众多科学家建议抛弃「统计学意义」这一概念

最近，科学家们一直在反思用于描述科学确定性的著名工具——“统计显著性”这一概念。有些人认为它很好。其他人希望降低数值标准，还有人呼吁完全废弃掉它。

最近一期的《美国统计学家》收到了很多读者的意见——事实上，有43条建议。

让我们化用温斯顿·丘吉尔的话来说：p值一直是确认科学事实显著性的最差方式……除了所有其他被用过的方法之外。

为什么是5%？纯粹出于历史习惯，真的。嗯，它比10%更严格，此外就没有什么神奇之处了。

我们的大脑并不太能处理概率。也许是因为进化过程中，这一需求并不太紧迫。

我们更喜欢将某个命题简单直接地划分到真或假的阵营中。因此，p<0.05这一标准容易被我们粗暴地滥用。

“世界比那更加不确定。”乔治亚大学的Nicole Lazar统计学家说。

Lazar与美国统计协会执行主任Ronald L. Wasserstein和数学与政策研究院退休副总裁Allen Schirm共同撰写了一篇评论文章，向我们介绍了若干替代p值的方案。

很明显，概率可以让我们受益，但前提是我们不用它们来做蠢事。

“知道什么与p值无关，确实是必要的，但这还不够。”三人写道，“直接踢开它，就好像拆除了科学大厦的支柱和横梁，而不提供坚固的替代支撑材料。”

该文章也并未完全就改用哪些支撑材料达成共识。但许多人确实提出了一些基本的原则。

有些人认为，新的特征应该能够被理想地转化为数据列表和方法描述，这些描述提供了额外的细微差别，谦逊地梳理了可能性，同时仍然可以支持单一的解释。

“我们必须学会接受不确定性。”一些作者写道，“有一种可行方法是使用置信区间——命名为'兼容区间'，并避免以过度自信的方式来解读数据。”

这不是廉价的p值改造方案——需要研究人员积极描述出区间内数据点的实际意义。

最终目标是避免使用划分正误的界点，而是认可和支持科学方法的不确定性。推论应该是科学的，而不仅仅是统计的。

从根本上说，科学毕竟是一种对话。政策制定者、技术人员和工程师都是倾听者，他们将来自各方的声音提炼成一个个具体的决定，但对于追逐真理的科学家来说，p值本身并不特别有用。

推翻这种根深蒂固的文化实践规范需要更多的人和论文。p值在一个世纪以来一直是备受科学界尊重的标准，因此它还会存在一段时间。

但大逆不道的想法是科学的垫脚石，能够提升视野使我们超越统计学意义，进入一个可以为模糊和不确定性欢呼的领域。

本文译自 sciencealert，由 majer 编辑发布。

赞一个 (8)

煎蛋