@ 2017.04.29 , 10:00
37

贝叶斯定理是什么

我们的世界观与合力作用经常为简单的定理所驱动,由低调的英国数学家和神学家Thomas Bayes在150年前私下提出,并仅在他死后才发表。

贝叶斯定理曾被用于二战中破解德国的恩尼格玛密码,如今已广泛用于科学、技术、医药和其他领域中。

所以是什么原理呢?

贝叶斯定理解释

Thomas Bayes的观点十分简单。一个假设为真的可能性取决于两个标准:

1. 基于当前知识,有多合理(先验);
2. 与现有证据的符合程度。

然而,在他死后100年里,大部分科学家仍旧只根据新证据评估自己的假说。这是传统的假设-检验(或频率学派)的方法,在科学课上我们也是这么被教的。

在难以置信的解释完美符合一些新证据的时候最能看出贝叶斯与频率学派的方法的区别所在。

比如捏造一个假说:“月亮是奶酪做的。”

贝叶斯定理是什么
credit: 小编自己照原文画的

我会抬头望望夜空,收集相关的新证据,注意到月亮呈奶酪般的黄色。利用传统的假设-检验框架,我会总结到新证据与我的激进的假说相一致,因此增强了我对其的置信度。

贝叶斯定理是什么
credit: 小编自己照原文画的

但利用贝叶斯定理,我就会更加慎重。虽然我的假说与新证据相符,但本来这个假说就是荒唐的,违背了我们所有的宇宙学和矿物学的知识。

贝叶斯定理是什么
credit: 小编自己照原文画的,石头图片credit: 123RF

因此,月亮是奶酪的整体概率就是两项的乘积,非常低。

当然,这是极端情况下的讽刺。没有哪位著名科学家会无聊到去测试这种愚蠢的假说。

但世界范围内的科学家总是在评估大量的假说,并且其中某些还是蛮牵强的。

例如,一项2010年的研究最初表明政治主张温和的人能看到更多字面意思的灰色阴影。

经过进一步的测试后来这一说法被推翻了,因为研究者认识到本来这一说法就是不可能的。但其他类似的研究几乎是不加批判的被接受了。

生活中的贝叶斯方法

我们从自己的经验和记忆中提取先验知识,从我们的感知中得到新证据,为日常事务分配概率,管理我们的生活。

就比如考虑一件简单的事情,要不要接你的工作电话,你工作的时候会把工作电话放在办公桌上,或者在家的时候充电。

你在家里的小院子里,听到屋里的工作电话响了。你的新数据与其位于室内某处相一致,但你直接就去充电器那里了。

在此过程中你已经结合了你对电话的先验知识(要么在办公桌上,要么在家里的充电器那里)和新证据(家里的某处),来判断出其位置。

如果电话不在充电器那里,那么你会利用有时候会把电话放在哪里这一先验知识缩小搜索范围。

你会忽略屋子里的大部分地方(冰箱,放袜子的抽屉),因为先验上较为不可能,并前往你认为最可能的地方直到最终找到电话。

置信度和证据

贝叶斯推理的特点之一是在数据不足的时候先验置信度最为重要。我们可以从直观上使用这一准则。

例如,你在酒馆里玩飞镖,附近有个陌生人说他/她是一个专业飞镖玩家,你可能最开始会假设这家伙在开玩笑。

你对这个人几乎什么都不知道,但遇到一个真正地专业飞镖玩家的几率是很小的。澳大利亚的专业飞镖玩家也不过大约15个。

如果这个陌生人扔飞镖并且正中靶心,可能还是不能令你信服,因为这可能只是运气。

但如果这个人连续十次都正中靶心,你就会倾向于接受他/她的专业说法了。你的先验置信度就被累积的证据所覆盖,贝叶斯定理又起作用了。

驾驭一切的一个理论

贝叶斯推理现在是大量人类问询领域的支柱,从癌症筛检到全球变暖,遗传学,货币政策以及人工智能。

贝叶斯推理是风险评估和保险的基石。每当龙卷风或者洪水袭击某个区域,保险费就会突然飞涨。为什么?

量化风险极其复杂,当前状况为未来可能灾难提供的信息很少。因此保险公司会根据现状和曾经发生的情况进行风险评估。

每当自然灾害袭来,他们就会更新那个地区的先验信息,将其变得较为不利,因此预计未来发生灾害的可能会更大,从而提高保险费。

贝叶斯推理在医学诊断中也扮演相似的角色。症状(新证据)是多种可能疾病(假设)的结果,但不同的疾病对于不同的病人的先验概率也不同。

诸如webMD的在线医疗工具的主要问题在于无法正确考虑先验概率。他们对你的个人历史所知甚少,因此会诊断出很多可能的疾病。
向了解你病史的医生求助将会缩小可能范围,得到更合理的诊断。贝叶斯定理又起作用了。

阿兰·图灵与恩尼格玛密码机

贝叶斯方法使我们能从含糊的数据中提取精确的信息,从各种可能性中找到一小撮解。

贝叶斯方法对英国数学家阿兰·图灵破解德国的恩尼格玛密码至关重要,并加速了二战盟军的胜利进程至少两年,拯救了数百万生命。

要解密一组德国的编码信息,搜寻近乎无穷的可能翻译显然是不可行的,特别是通过不同的复杂恩尼格玛密码机转子设置还会每天改变编码。

图灵重要的贝叶斯观点是特定信息出现的可能性比其他的信息更高。

研究团队将其成为“cribs”,是基于先前解密的信息,以及逻辑上的期望。

例如,从U型潜水艇出来的消息可能包含与天气或者盟军船只的短语。

贝叶斯定理是什么
破解德军恩尼格玛密码的Bombe机器的重建复制品。Credit: Ted Coles/Wikimedia

这些cribs提供的强先验信息大大缩小了待评估的可能翻译的数目,使得图灵的解码机器破译恩尼格玛密码的速度能赶得上每天更换的速度。

贝叶斯与进化

我们为什么对贝叶斯理论如此感兴趣呢?在我们自己的研究领域,进化生物学,贝叶斯方法变得越发重要。

从预测气候变化产生的效应到理解传染病的传播,生物学家能从众多可能性中搜寻得到少量的可能解。

我们的研究主要包括重构生命的历史和进化,这些方法能帮助我们从理论上数十亿种可能的分枝模式中找到唯一的正确进化树。

在工作和日常生活中,贝叶斯方法都能帮助我们找到沧海一粟。

贝叶斯推理的不利方面

当然,在先验信息不正确的情况下贝叶斯推理也会出问题。

在法庭上,这会导致严重的误判(参见检察官谬论:泛指多种根据不相关资讯认定被告“无辜的机率”很小的情况)。

在英国的一个著名例子中,1999年,Sally Clark被错认为谋杀了她的两个孩子。

检察官曾争论道两个孩子死于自然原因(她是无辜的先验概率)的可能性非常低,只有7300万分之一,因此她肯定谋杀了两个孩子。

但他们没有考虑母亲杀死两个孩子的概率(她有罪的先验概率)更是极其之低,因此她完全无辜与双重谋杀者的相对先验概率其实比最初争论认为的更为相近。

Clark随后进行了上诉,并且上诉法院批判了原始判决中统计方式的错误使用(这一事件的后续是二审判决宣判无罪,并于2003年出狱,但这一经历造成了严重的精神问题,2007年因乙醇中毒死于家中,sigh)

这表明了贝叶斯定理的错误使用能带来深远的严重后果。但好处是合理调整的具有正确先验信息的贝叶斯方法能提供替他方法不具备的洞察力。

本文译自 conversation,由译者 CliffBao 基于创作共用协议(BY-NC)发布。Mike Lee&Benedict King


给这篇稿打赏,让译者更有动力
支付宝打赏 [x]
您的大名: 打赏金额:
已打赏蛋友(4): Hongkai · mm · 宇智波煎蛋 · rex.z
4.5
赞一个 (40)

TOTAL COMMENTS: 37+1

  1. 十一哥
    @9 months ago
    3437375

    小编的工作量大了很多啊

  2. hongkai
    @9 months ago
    3437381

    热烈庆祝煎蛋进入贝叶斯时代
    讲真贝叶斯定理应该在小学花半学期来讲, 什么电信诈骗, 传销,炒股被套啥的只要应用一下贝叶斯定理就知道你真的被怀疑犯罪和真的能赚钱的后验概率都是微乎其微的…

  3. 凑个热闹
    @9 months ago
    3437387

    需要兼职的灵魂画师吗?

  4. 3437388

    贝叶斯方法挺好的,但是能不能估计出缺失数据对判断的影响啊?

  5. 3437390

    北上广房价的贝利叶推理→_→

  6. 3437391

    贝叶斯方法是个好方法,但是它能不能估计出缺失值对判断的影响啊?(来自一个几乎不懂统计的进化生物学爱好者)

  7. 3437393

    @游客: 北上广房价的贝叶斯推理。。。

  8. i大熊猫
    @9 months ago
    3437394

    传统的假设-检验框架:
    证据 colt:快了。
    结论 评论系统真的快了。

    贝叶斯定理:
    证据 colt:快了。
    先验概率 colt第一次说快了的时间和次数。
    结论 评论系统遥遥无期(*꒦ິ⌓꒦ີ)

  9. 3437395

    @ZZiggy:
    贝叶斯方法不关心数据是否缺失。仅仅只是用“得到”的信息去评估。考虑评估的准不准确那是概率学派,贝叶斯学派不会去假定存在一个正确值。

  10. 游客001
    @9 months ago
    3437396

    作为一个贝叶斯方法的使用者分享一点心得。
    贝叶斯最大的优点和最大的缺点都是先验分布的选取,有了先验,一些复杂高维的问题可以高效率的被解决,但是常常被argue的也是先验的选取。
    本质上是先验和后验的一个加权。
    有兴趣的可以看看下文:
    Efron B. Bayesians, Frequentists, and Scientists[J]. Journal of the American Statistical Association, 2005, 100(469):1-5.

  11. CliffBao
    @9 months ago
    3437397

    @凑个热闹: 可以找sein,一起快活啊

  12. 3437403

    成立一个贝叶斯阴谋会煎蛋分部

  13. 3437407

    我估计Bayes历史应该学的很好

  14. duola512
    @9 months ago
    3437408

    “字面意思的灰色阴影”…….我特地回原文看了一眼,还真是“literally”,其实可以译成“灰色阴影(字面意思)”啊

  15. compete
    @9 months ago
    3437409

    高中时做生物遗传问题自己推出了贝叶斯公式(大学概率论里面的那个。)
    结果被某重点高中的核心生物老师(好像是生物组组长,负责生物奥赛的)当面给了一个大红叉(瞥了一眼,大概看了几秒钟我写了一页的推导过程)。
    当时要是知道大学数学有个贝叶斯公式,绝对要质疑一个专家居然连本科内容都不懂。

  16. 宇智波煎蛋
    @9 months ago
    3437413

    @ZZiggy: 可以,贝叶斯统计中有一个叫贝叶斯因子的概念,是和假设检验中pvalue相对应又完全不一样的东西,贝叶斯统计在有缺失值的情况下也能作推断,想要知道缺失值的影响大小,可以求出有无缺失值两种推断的贝叶斯因子。手机打字中。。。

  17. 3437419

    很有应用价值,但也仅限于应用价值

  18. 3437420

    推荐给希望深入阅读的读者:
    数学之美番外篇:平凡而又神奇的贝叶斯方法 – 刘未鹏 | Mind Hacks
    http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/

  19. Butters
    @9 months ago
    3437426

    举个简单的栗子:
    扔硬币,前两次扔的都是正面
    那么,第三次仍然是正面的概率是2/3

  20. 俱舍莲帝
    @9 months ago
    3437458

    @Butters: 卧槽,伙计你能不能不搅浑水。
    我也来一个:
    有3扇门,其中一个里边有大奖。
    你选错一个,那么下一个再选错的概率是2/3。

  21. you_know_who
    @9 months ago
    3437462

    这是好文章!

  22. 曰狗少年
    @9 months ago
    3437468

    @俱舍莲帝: 很经典的一道题

  23. 3437469

    @Butters: 扔了三次硬币,已知前两次是正面,第三次是正面的概率是1/2;扔了三次硬币,已知有两次是正面,剩下的一次是正面的概率是1/6;扔三次硬币,前两次是正面,扔第三次结果是正面的概率是1/2。2/3是怎么来的?是我理解错了?

  24. 3437491

    啥时候月亮是黄色的了?小时候画画都画黄的但是从来看的都是白的啊

  25. 3437498

    有点像反证法啊

  26. m方加一
    @9 months ago
    3437499

    恭喜煎蛋进入半自主创新半翻译时代!

  27. 武安居士
    @9 months ago
    3437517

    @俱舍莲帝: 扯淡不上税…

  28. 宇智波煎蛋
    @9 months ago
    3437591

    @zzz: 是的,贝叶斯公式除了可以结合先验知识,另外一个好处就是可以将推理和归纳之间,互相转换。反证法也是用归纳变为推理。

  29. frequentist
    @9 months ago
    3437638

    煎蛋啥时冒出这么些个bayesian???

  30. Butters
    @9 months ago
    3437924

    @index:
    你确实理解错了,而且根据我这条评论的xo数,我知道大部分人根本没看懂这文章写的啥。。。

    这道问题的关键是:这枚硬币是非均匀的,两边朝上的概率并非1/2和1/2,
    贝叶斯先验的就是这个硬币朝上的概率
    根据头两次硬币都是正面朝上的事实,利用贝叶斯可以推断出这块硬币正面朝上的概率是2/3
    所以,第三次抛硬币正面朝上的概率就是2/3

    ps., 每次抛硬币之后,这枚硬币正面朝上的概率都会根据之前的结果而变化,这就是贝叶斯的可爱之处。

  31. Butters
    @9 months ago
    3437925

    @俱舍莲帝: 详解参见楼上

  32. 人工脑
    @9 months ago
    3438074

    @Butters: 这难道不是极大似然估计?

  33. 孤睾的大魔导
    @9 months ago
    3438094

    @Butters: 附议,大学以后,一直觉得“概率”和“统计”的关系问题是个值得深思的事情

  34. 3438533

    @Butters: 这ox比例 很多人真的不懂贝叶斯啊…

  35. 亻山亻掌
    @9 months ago
    3439815

    @hongkai: 肯德基优惠券觉得呢?(⊙o⊙)宝宝乖乖哒。

  36. 亻山亻掌
    @9 months ago
    3439822

    @hongkai: 姐姐们吃包子铺垫啦

发表评论


24H最赞