@ 2022.05.04 , 12:46

才华和颜值负相关?你听说过伯克松悖论吗

观察一下国内(国外也差不多)的文化娱乐事业的从业者,或许你直觉上会产生一个认知:外表越有吸引力的人,在演艺、歌唱上的才华似乎就越小;反之,越是才华横溢的艺人,在颜值上就越普通。

对应这种认知的是,大家把好看的艺人称之为流量明星,相对的叫实力唱将或老戏骨;以示后者虽然外在普通或风华不再,但内里有货,不是徒有其表之辈。

这里不讨论这是否是一种偏见,我们单纯从统计学上说,如果这种认知是可被统计数据证实的,那是否可以推断出颜值和才华是负相关的呢?除了极少数例外,绝大多数人仅能得其一?

在美国,确有人分析过明星的外表和才华之间的联系,他们推断出这两个特征真是负相关的——有吸引力的人往往缺乏才华,而有才华的人往往缺乏吸引力。

但是,这具有欺骗性:既没有魅力也没有才华的人通常不会成为名人,而明星样本并没有代表这一大群人。明星往往具有一种特征,但(不出所料)很少同时具有这两种特征。

这就是所谓的伯克森悖论的一个实例。

1946 年,美国医生和统计学家约瑟夫·伯克森提出的一个问题。他发现医院中糖尿病患者和胆囊炎患者中,患糖尿病的同时患胆囊炎的人,数目较少;而没有糖尿病的人群中,患胆囊炎的人数比例较高。这似乎说明患有糖尿病可以降低病人罹患胆囊炎的风险,但是从医学上,我们无法找到这种联系。

他将自己的观察写成了论文《用四格表分析医院数据的局限性》 ,发表在《生物学公报》上。就此,人们把该问题称为伯克森悖论。

按照百科的解释,悖论产生的最主要原因是:文章中统计的患者都是医院的病人,从而忽略了那些没有住院的人。

为了简化起见,我们假设医院只收治两种疾病:糖尿病和胆囊炎。然后画一个平面直角坐标系:横坐标表示病人糖尿病的严重程度,纵轴表示胆囊炎的严重程度,再把每一个人按照两种疾病的轻重点在坐标系里。

如果我们对全体人群进行统计,就会发现糖尿病和胆囊炎并没有相关性

但是如果只对医院中的患者进行统计,就会出问题。如果病人的糖尿病或者胆囊炎问题比较轻,病人就不需要住院,所以也不会被统计到。来到医院的病人要么是糖尿病,要么是胆囊炎,要么二者兼有。所以,我们需要把图像左下方代表轻症的点都去掉,他们不在统计的范围内,我们只会统计到这条线右上方的点。这回糖尿病和胆囊炎就表现出负相关了。不患有糖尿病的人,更有可能患有胆囊炎,而患有糖尿病的人,胆囊炎的比例就会下降了。

可见伯克森悖论是一种统计偏差,因为我们忽略了身体健康而没有入院的人,只在医院的病人中进行统计,这些病人一定患有这样或者那样的疾病。

赞一个 (25)