@ 2018.11.06 , 14:00

如何识破新闻中的误导数据

作者:Liberty Vittert/The Conversation

如何识破新闻中的误导数据
审判长,火眼金睛 Credit:HW

根据埃塞克斯大学的研究人员根据性行为档案中所作的研究,发现“性欲”可以通过人们手指的长度来确定,这个消息最近还蛮火的。

然而我火眼金睛,一看就知道这全是扯淡。

科研结果的发表是很严格的,数据样本是不是足够广泛,有没有严格的同行审议,一篇新闻报道基本是不在乎这些严谨的过程的,毕竟抓人眼球更重要,所以不必真的花很多心思去针对这样的新闻本身。

但你如果不想被这样的文章误导,还是要稍微研究一下里面关于数据的一些“猫腻”的。

对我而言真正的风是什么?
比如《八年研究表明,爱吃炸薯条,死亡几率两倍高》这样的,我正吃薯条呢,你给我来一这个???

嗯,是的,根据美国临床营养学杂志发表的同行评审研究,这是真的。吃炸薯条会增加你死亡的几率。但是,吃多少炸薯条,而且,我本来的死亡几率是多少?不知道啊!

该研究表明,如果每周吃三次或更多的炸薯条,你的死亡几率会增加一倍。因此,让我们在这项研究中采用一个普通人的样本:一个60岁的男人。无论他吃多少炸薯条,他的死亡几率是多少?1%。这意味着,如果有100名60岁的男性,其中至少有1人将在明年死亡,仅仅是因为他是一名60岁的男性。

现在,如果所有这100名男性至少每周吃三次炸薯条,是的,他们的死亡几率会增加一倍。1%翻倍=2%。因此,在100名男子中,明年2人将会死亡。他们每周三次或多次吃炸薯条 - 听起来其实也还行啊。

这是一种称为相对风险的统计概念。如果患上某种疾病的几率是十亿分之一,即使你的患病几率提高四倍,仍然只有十亿分之四——基本不会发生。

因此,下次当看到几率增加或减少时,应该问的第一个问题是“原始几率是多少”。

睡前吃奶酪等于被床单勒死?
婴儿箱已成为新父母的时尚礼品,旨在为新生儿提供一个安全的睡眠场所。该倡议源于20世纪30年代末的芬兰,旨在减少婴儿与睡眠有关的死亡。纸板箱里包括一些必需品:一些尿布、婴儿湿巾、连体衣、乳垫等。

随着这些婴儿箱的推出,芬兰的婴儿死亡率迅速下降,目前是世界上婴儿死亡率最低的国家之一。 因此,我们假设这些婴儿箱导致婴儿死亡率下降是有道理的。

但还有其他的条件发生了改变——产前检查。买婴儿箱之前,妇女在怀孕的头四个月开始就要去诊所检查。

1944年,31%的芬兰母亲接受了产前检查。1945年,比率已跃升至86%。婴儿箱对婴儿死亡率的变化不负责任; 相反,这是教育和早期健康检查的结果。

这是一个典型的相关性与因果关系不同的情况。婴儿箱的引入和婴儿死亡率的降低是相关的,但不是因果关系。

然而,这个小小的事实并没有阻止婴儿箱公司遍地开花。每个只卖449美元,畅销得很。

因此,下次当你看到一个关联 - 就像吃奶酪等于被床单勒死这种 - 你应该问“还有什么可能导致这种情况发生?”

当误差幅度大于效果时
美国劳工统计局最近的数据显示,全国失业率从8月份的3.9%下降到9月份的3.7%。在编制这些数字时,主管显然不会询问每个人是否有工作。它询问了一小部分人口样本,然后将该群体的失业率推广到整个美国。

这意味着任何特定时间的官方失业率都是一个估计 - 一个很好的猜测,但仍然是猜测。这种“正负误差”被统计学家称之为置信区间。

数据实际上表明,全美国失业人数似乎减少了27万人,但由置信区间定义的误差幅度为正负26.3万。采样总是带有误差范围,并且将单个估计值视为范围更准确。在这种情况下,统计学家认为,失业人口的实际数量在7千和53.3万之间。

这与性欲和手指长度发的问题相同 - 与这些估计相关的正负误差可以简单地否定结果中的任何确定性。

置信区间让我们的生活变得混乱的最明显的例子就是民意调查。民意调查人员采集人口样本,询问该样本将投票给谁,然后推断整个人口在选举日将要选谁。当选举结束时,与他们的样本民意调查相关的正或负误差否定了对谁将赢得选举的任何真实因素,使得选举“难以预测”。

下次看这样的数据时,先留意一下置信区间吧。

这三点知道了也不能百分百让你不被骗,但还是有用的啦。

本文译自 popsci,由译者 HW 基于创作共用协议(BY-NC)发布。


支付宝打赏 [x]
您的大名: 打赏金额:

赞一个 (18)