@ 2019.03.24 , 12:00

众多科学家建议抛弃「统计学意义」这一概念

前情:三位统计学家在Nature上号召科学家放弃“统计学意义”,公开信在一周内吸引了超过800名研究人员共同署名。

最近,科学家们一直在反思用于描述科学确定性的著名工具——“统计显著性”这一概念。有些人认为它很好。其他人希望降低数值标准,还有人呼吁完全废弃掉它。

最近一期的《美国统计学家》收到了很多读者的意见——事实上,有43条建议。

让我们化用温斯顿·丘吉尔的话来说:p值一直是确认科学事实显著性的最差方式……除了所有其他被用过的方法之外。

分析实验数据时,研究人员可以使用一系列统计工具来计算p。一般认为P≤0.05或者P≤0.01就有显著性差异,研究结果在统计学上是有意义的。

为什么是5%?纯粹出于历史习惯,真的。嗯,它比10%更严格,此外就没有什么神奇之处了。

我们的大脑并不太能处理概率。也许是因为进化过程中,这一需求并不太紧迫。

我们更喜欢将某个命题简单直接地划分到真或假的阵营中。因此,p<0.05这一标准容易被我们粗暴地滥用。

“世界比那更加不确定。”乔治亚大学的Nicole Lazar统计学家说。

Lazar与美国统计协会执行主任Ronald L. Wasserstein和数学与政策研究院退休副总裁Allen Schirm共同撰写了一篇评论文章,向我们介绍了若干替代p值的方案。

很明显,概率可以让我们受益,但前提是我们不用它们来做蠢事。

“知道什么与p值无关,确实是必要的,但这还不够。”三人写道,“直接踢开它,就好像拆除了科学大厦的支柱和横梁,而不提供坚固的替代支撑材料。”

该文章也并未完全就改用哪些支撑材料达成共识。但许多人确实提出了一些基本的原则。

有些人认为,新的特征应该能够被理想地转化为数据列表和方法描述,这些描述提供了额外的细微差别,谦逊地梳理了可能性,同时仍然可以支持单一的解释。

“我们必须学会接受不确定性。”一些作者写道,“有一种可行方法是使用置信区间——命名为'兼容区间',并避免以过度自信的方式来解读数据。”

这不是廉价的p值改造方案——需要研究人员积极描述出区间内数据点的实际意义。

最终目标是避免使用划分正误的界点,而是认可和支持科学方法的不确定性。推论应该是科学的,而不仅仅是统计的。

从根本上说,科学毕竟是一种对话。政策制定者、技术人员和工程师都是倾听者,他们将来自各方的声音提炼成一个个具体的决定,但对于追逐真理的科学家来说,p值本身并不特别有用。

推翻这种根深蒂固的文化实践规范需要更多的人和论文。p值在一个世纪以来一直是备受科学界尊重的标准,因此它还会存在一段时间。

但大逆不道的想法是科学的垫脚石,能够提升视野使我们超越统计学意义,进入一个可以为模糊和不确定性欢呼的领域。

本文译自 sciencealert,由 majer 编辑发布。

赞一个 (8)