走进科学
众多科学家建议抛弃「统计学意义」这一概念
前情:三位统计学家在Nature上号召科学家放弃“统计学意义”,公开信在一周内吸引了超过800名研究人员共同署名。
最近,科学家们一直在反思用于描述科学确定性的著名工具——“统计显著性”这一概念。有些人认为它很好。其他人希望降低数值标准,还有人呼吁完全废弃掉它。
最近一期的《美国统计学家》收到了很多读者的意见——事实上,有43条建议。
让我们化用温斯顿·丘吉尔的话来说:p值一直是确认科学事实显著性的最差方式……除了所有其他被用过的方法之外。
分析实验数据时,研究人员可以使用一系列统计工具来计算p。一般认为P≤0.05或者P≤0.01就有显著性差异,研究结果在统计学上是有意义的。
为什么是5%?纯粹出于历史习惯,真的。嗯,它比10%更严格,此外就没有什么神奇之处了。
我们的大脑并不太能处理概率。也许是因为进化过程中,这一需求并不太紧迫。
我们更喜欢将某个命题简单直接地划分到真或假的阵营中。因此,p<0.05这一标准容易被我们粗暴地滥用。
“世界比那更加不确定。”乔治亚大学的Nicole Lazar统计学家说。
Lazar与美国统计协会执行主任Ronald L. Wasserstein和数学与政策研究院退休副总裁Allen Schirm共同撰写了一篇评论文章,向我们介绍了若干替代p值的方案。
很明显,概率可以让我们受益,但前提是我们不用它们来做蠢事。
“知道什么与p值无关,确实是必要的,但这还不够。”三人写道,“直接踢开它,就好像拆除了科学大厦的支柱和横梁,而不提供坚固的替代支撑材料。”
该文章也并未完全就改用哪些支撑材料达成共识。但许多人确实提出了一些基本的原则。
有些人认为,新的特征应该能够被理想地转化为数据列表和方法描述,这些描述提供了额外的细微差别,谦逊地梳理了可能性,同时仍然可以支持单一的解释。
“我们必须学会接受不确定性。”一些作者写道,“有一种可行方法是使用置信区间——命名为'兼容区间',并避免以过度自信的方式来解读数据。”
这不是廉价的p值改造方案——需要研究人员积极描述出区间内数据点的实际意义。
最终目标是避免使用划分正误的界点,而是认可和支持科学方法的不确定性。推论应该是科学的,而不仅仅是统计的。
从根本上说,科学毕竟是一种对话。政策制定者、技术人员和工程师都是倾听者,他们将来自各方的声音提炼成一个个具体的决定,但对于追逐真理的科学家来说,p值本身并不特别有用。
推翻这种根深蒂固的文化实践规范需要更多的人和论文。p值在一个世纪以来一直是备受科学界尊重的标准,因此它还会存在一段时间。
但大逆不道的想法是科学的垫脚石,能够提升视野使我们超越统计学意义,进入一个可以为模糊和不确定性欢呼的领域。
本文译自 sciencealert,由 majer 编辑发布。