@ 2016.11.14 , 18:00
45

民调没错,是大家的数学错了

[-]

大家都在讨论民调的失败。但是川普获胜远非一场无法预料的“黑天鹅”事件。证据都在这里,就看你如何解读了。

实际上,民调还是靠谱的。从历史标准来看,2016年大选的结果并非谬之千里。大部分州的结果都在民调误差范围内,最谨慎的预测给了希拉里66%的获胜可能。在选举两周前,川普获胜的概率是输掉俄罗斯轮盘赌的概率的两倍。但是最乐观的预测给了希拉里90%的获胜可能,因为他们错过了一个基本的事实:民调误差往往或同时影响很多州,而且方向一致。

为了理解66%可能和90%可能之间的巨大差异,我们要先把可能性转换成赔率,即胜算对败算的比率。50% 可能性就是抛硬币,赔率是1:1。
[-]

66%可能就是2:1的赔率,这也是著名民调机构FiveThirtyEight公布了希拉里获胜几率。
[-]

相比之下,用6发左轮手枪玩俄罗斯轮盘赌,你的赢面是83%,即5:1的赔率,获胜可能性是2:1赔率的两倍还多。
[-]

我们接着往上加。从83%加到90%,这不代表获胜可能性增加了7%,而是又增加了接近一倍,因为现在赔率是9:1。
[-]

90%的可能性比66%的可能性赢面多了超过4倍。

那么为什么最乐观和最保守的预测之间差了这么多呢?一些模型并没有考虑到这一点,即独立的民调可能是准确的,但是综合起来的结果往往不对。

我们下面看一组预测希拉里获胜的摇摆州数据。一下都是过去两周内的民调,而且加入了误差范围(灰色区域,红点表示民调中领先位置)

首先是希拉里领先的宾夕法尼亚州:
[-]

最终结果是川普以领先1个百分点获胜,这比民调平均结果差了几个点,但是这仍然在最后几次民调的误差范围内。

佛罗里达州的结果更不令人惊讶:
[-]

最终结果完全在误差带内,但是预测方向还是错了:对希拉里过于乐观了。

威斯康辛州则完全是个意外:
[-]

很难说哪里出错了;民调误差来自于多种因素,包括投票率、民众在调查时撒谎或者不断变化的人口统计。但是一旦出现问题,它往往在很多地方都会体现出来:民调方法的偏差会影响多个州,民调机构又往往弄不清其中的问题。

路透社就没有考虑其中的变数,给了希拉里90%的获胜可能,而FiveThirtyEight考虑到了,甚至还事先警告大家民调误差的可能性。它们只给了希拉里66%的获胜可能,也就是2:1的赔率。

你们应该相信哪一种模型呢?

预测既是一门科学也是一门艺术,而且不仅限于选举中,因为历史的每个瞬间都是独一无二的。我们容易在这种变幻莫测中感到迷失,我们只愿意看到自己想看到的。误差范围是民调与生俱来的,因为无论分析有多全面,那些看不见的因素都可能造成错误。下一次当你看到两个相差巨大的预测时,要问自己,差距到底有多大?为什么这么大?

本文译自 quartz,由译者 许叔 基于创作共用协议(BY-NC)发布。


给这篇稿打赏,让译者更有动力
支付宝打赏 [x]
您的大名: 打赏金额:

2.1
赞一个 (15)

TOTAL COMMENTS: 45+1

  1. 关公战秦琼
    @10 months ago
    3323087

    如果是选民直选,希拉里就胜了,因为选民的票希拉里多一点,毕竟希拉里胜的很多压倒性的,川普胜的百分之五十几险胜的很多。

    [23] XX [154] 回复 [0]
  2. 3323089

    每个字都知道就是看不懂系列

    [33] XX [2] 回复 [0]
  3. MEGATRON
    @10 months ago
    3323090

    你说是就是吧

    [19] XX [0] 回复 [0]
  4. 大碾克
    @10 months ago
    3323091

    受访者都是希拉里雇佣的,她把全家家当压了特朗普赢~~~

    [58] XX [7] 回复 [0]
  5. 3323092

    民调当然没错了,只不过这帮被资本收买的媒体不敢如实报道而已。投票前舆论一边倒的情况下希拉里都输了,如果之前把真实的民调数据如实地向大众选民报道,那希拉里还不输的连家底都没了。
    还有那些维基解密爆出来的邮件,很多媒体也都是收了黑钱,好一点的转遮遮掩掩不去报道,彻底卖身的就强词夺理希拉里开脱愚弄民众。这些媒体要是对自己的国家和国民有一点责任心,如实报道这次邮件泄漏的事件,希拉里别说竞选总统,判她个终生监禁都算是法外开恩了。

    [143] XX [21] 回复 [0]
  6. 一位中年妇女
    @10 months ago
    3323093

    随便吧,让川普玩吧,只是希望川普粉要至死不渝地支持他。

    [10] XX [40] 回复 [0]
  7. MEGATRON
    @10 months ago
    3323094

    你说是就是吧

  8. 3323095

    专业民调补刀
    美媒:民调显示桑德斯本可以赢得大选
    大选前两天,Gravis Marketing开展了一项民意调查,收集了1600个登记选民的信息,调查结果为桑德斯可以赢得56%的选票,而特朗普只有44%。

    [44] XX [1] 回复 [0]
  9. 3323096

    明明就是民调的错

  10. 3323105

    每个字都能看懂

  11. 3323106

    我来给你们解释一下我猜这篇文章想说什么

    民调数据反映了候选人在这个周获胜的概率,这是没错的
    用所有州的民调数据计算总概率的方法错了,因为这些胜率的关系不是独立的。
    假设一个州偏差了2%,那么其他州也有可能往同样的候选人方向偏差,因为大家偏差的原因很可能是相同的。

    比如一颗苹果树上某一个苹果在一周后成熟的概率是10%,另一个在一周后成熟的概率也是10%。那么一周后两个苹果都成熟的概率是多少呢?如果按照苹果成熟是独立的计算,那么都成熟的概率是10%乘以10%就是1%。 其实现实生活中并不是这样的,因为这两个事件相关性很大,并不独立。

    [48] XX [4] 回复 [0]
  12. 3323112

    民调是什么? 就是创业公司的月活啊!
    希拉里不得用这个拉融资么。
    Trump为什么总票数输呢, 因为加州这种左派聚集地的存在。。。

  13. 帝國主義
    @10 months ago
    3323113

    @一位中年妇女:

    都選完了,川普粉不需要‘至死不渝’的支持了。

    [13] XX [2] 回复 [0]
  14. kyd70599
    @10 months ago
    3323114

    选前八十多次民调,其中显示川普领先的四次,统计学怎么解释,这种民调要他有什么用。

  15. DaringSp
    @10 months ago
    3323116

    @关公战秦琼: 川普拿到过半选举人票确定获胜时普选票是落后的,但是当稍晚点票已经无关胜负的其它州点票完成后,川普普选票总数是比希拉里多70万票的。你的说法最早是出自当川普拿到270票选举人票获胜时媒体的报道,但当时总票数仍然还在点算中,未有正式结果。

    [53] XX [7] 回复 [0]
  16. 3323117

    (((Ivanka Trump)))

  17. 老野瓜
    @10 months ago
    3323119

    主要是winner-take-all这点吧,例如 FL Trump仅仅险胜不到2个百分点就拿到29票,而NY是Clinton大胜超过20个百分点也是29票.

    [10] XX [2] 回复 [0]
  18. 3323120

    民调只调大城市,有个铲铲用?

    [10] XX [1] 回复 [0]
  19. 3323121

    @DaringSp: 自己看最新的维基百科

  20. 3323123

    民调呀民调,咱都知道这次的数据啥的被操纵,一方拼命洗,一方拼命黑,就你知我知,谁也别再说啥,move forward得了~ 别再拼了老命出来洗地了。

    大选当天晚上看电视实时数据+采访,当时访问一个弗罗里达的一个市长,他说就是因为发现90%的媒体都被操控,拼命黑川普,才觉得稀拉拉势力太大,各种阴招黑手段,这才选的川普。非常多的人本来不想选川普的,但就是因为希拉里实在是一个太太糟糕的候选人,才‘不得已’投了川普。就和赵薇之前那个操纵媒体细思恐极的时间如出一辙~ 所以媒体呀,就忘了这件事先前看吧,别再洗了~

    [31] XX [7] 回复 [0]
  21. 3323131

    感觉这篇文章许多地方都说错了

  22. penpen06
    @10 months ago
    3323135

    靠~~都是黑庄放出来的吧~~川普赌自己赢的话,又赚一笔~~

  23. 愿和平降临人间
    @10 months ago
    3323143

    选举前咋不说?事后诸葛亮

  24. 白饭鱼
    @10 months ago
    3323145

    傻逼媒体被抽肿了脸,还出来给自己洗地?

    [16] XX [1] 回复 [0]
  25. 3323150

    事后臭皮匠,说啥都有理

  26. 3323163

    统计是一门艺术,讲究说学逗唱

    [15] XX [0] 回复 [0]
  27. 常用的网络ID
    @10 months ago
    3323166

    @关公战秦琼: 纠正一个问题,最终计票结果是床破62,972,226票对希拉里62,277,750票,就算是普选照样是床破赢

    [28] XX [5] 回复 [0]
  28. 3323180

    @关公战秦琼: 很可惜,最终的统计结果还是川普的票多,就是直选也一样

    [14] XX [3] 回复 [0]
  29. 3323182

    @常用的网络ID: 而且这还是希拉里狂作弊造假票的情况下才有的数字

  30. 3323186

    给自己的不要脸洗地,99%媒体选边站,给希拉里吹捧,怎么可以有川普有利的民调?

    [14] XX [0] 回复 [0]
  31. 3323241

    是的是的
    1. 宾州所有的民调都在希拉里那边, 但是”因为容许误差的最左边的””大部分”覆盖到最后结果, safe~
    2. 佛罗里达大部分民调说希拉里至少平或者赢, 结果”大部分”的”容许误差的最左边”也刚好覆盖到最后结果, safe~
    3. 威州连”容许误差的最左边”都碰不到, 但是算意外, safe~

    嘛, 确切来说, 太阳其实可以算方的嘛, 方的太阳在误差允许范围内嘛, 就算不在, 也就是今天意外而已啦, 明天就是方的了

    [31] XX [0] 回复 [0]
  32. 3323352

    《奉天时报》的中文语法也肯定是没错的。

  33. 3323431

    @DaringSp: 我查了维基百科 是希拉里领先70万,不是川普

  34. 3323432

    @常用的网络ID: Clinton won the popular vote in already counted ballots. As of November 13, the AP was reporting these popular vote totals:

    Donald Trump 60,350,241 (47.3%)
    Hillary Clinton 60,981,118 (47.79%)
    That’s a difference of 630,877 votes.

    希拉里票数多,13日的统计

  35. 3323464

    逗我呢
    希拉里:61,047,207
    川普:60,375,961

    刚刚google到的…你要是说这都是被操纵的我也没话讲

  36. 一位中年妇女
    @10 months ago
    3323490

    @肥颓:
    煎蛋的政治正确就是必须力挺川普,不挺不是中国人。

  37. dogisacat
    @10 months ago
    3323544

    @一位中年妇女: 不知道为什么,在中国有很多网上的「知识份子」都是狂热的川粉。可能是他们很喜欢反对政治正确的川普。但问题是,总统是必须接受政治正确的职位。所以川普接的结局,不是接受政治正确,就是被政治正确打倒。所以,川普?呵呵~
    真的以为竞选口号代表一切?人家川帝已经放宽了对绿绿的口号了

  38. 拉莱耶文本
    @10 months ago
    3323603

    中国哪有那么多川普粉啊,单纯就是吃瓜群众不怕事大,没错我就是这么的政治不正确!

    [11] XX [0] 回复 [0]
  39. 3323668

    @一位中年妇女:
    人文教育对于今天的中国来说,也许还是太奢侈了。

  40. 3323769

    @dxd20: 谁都好,共产主义就是不行

  41. 3323771

    @dogisacat: 川普上台对美国有益,但是也远好过希拉里那种没下限的,没人会欢迎一个左派信仰爆炸的疯子,关键是希拉里犯得是原则错误,川普只是小节问题,如果支持希拉里那是挑战基本的社会底线

  42. 毛毛团
    @10 months ago
    3324278

    @noname: 虽然我没查,当你的两个数字都比别人
    小,时间也是两天前。你不觉得是你找的数字不够更新么?

  43. 3324892

    @常用的网络ID: 维基百科说川普61,251,881对希拉里62,413,443,我还是不知道你的数据是哪里来的

  44. 3326516

    = 蛋蛋的蛋上面的叽叽 12

  45. 3330455

    @关公战秦琼:
    如果选民直选,很多安全州的选民也会出来投票。赢的人也不一定是谁。历史不可假设。

发表评论


24H最赞