致富信息
量化颜值经济价值的模型
2016年一次宴会上,两位领域截然不同的研究人员被安排坐到了一起。晚餐谈话后,数据科学家和工程师,与经济模型专家决定合写一篇量化 "颜值溢价" 影响的期刊文章。这里的“颜”泛指外表特征,不单说脸。
工程师是弗吉尼亚大学数据科学副教授Stephen Baek,而计量经济学家是爱荷华大学经济和金融副教授Suyong Song。5年前,2人发现他们的兴趣范围比他们最初意识到的要重合得多。
在之前的工作中,Baek为产品设计、虚拟时装、服装设计和人体工程学等工程应用分析并建立了人体形状模型。
与以前分析颜值溢价的论文相比,Baek和Song的方法更加新颖,因为他们的数据集来自2002年的美国和欧洲公民表面人体测量资源项目,即CAESAR。除了自我报告的身高和体重——在以前的研究中已经使用过——该项目还收集了三维人体扫描数据、关于人口和家庭收入的广泛信息,以及近2400名平民的体检数据。有了这些信息,两位研究人员可以提供一个细节更丰富的关于身体外观和社会经济的故事。
Baek说:"以前的工作的问题是,人们过度简化了描述身体形状的参数。确定身体外观的传统过程,如身材、体重和BMI,是不完善的,因此无法捕捉到所有维度。"
使用一种被称为 "图形自动编码器" 或叫 "深度机器学习" 的新型机器学习算法,将数据的维度从几十万个点降低到几个重要的特征,用数值来描述每个人体形状。然后,Baek和Song将这些特征可视化,以确定该算法参考了哪些身体部位,并估计它们与社会经济变量的关系。使用这种科学方法,可以量化身体外观的因果效应。
对于男性和女性子样本来说,身材和体重都是重要的特征,而臀腰比是女性身体外观的另一个独特特征。实证结果发现,男性身材越高,收入高的可能性就越大,而女性的肥胖与家庭收入越低相关。
除了人类外观和经济,Song在经济模型方面的专业知识为模型增加了另一个层次:调查和测量误差在利用身体测量的研究中发挥的负面作用。根据他的计算--由于2002年的数据还包括自我报告的身体测量,Song发现报告误差与真实体重和身高高度相关。平均而言,体重较轻的人倾向于多报体重,而体重较重的人则倾向于少报。研究结果证明,关于这些测量的调查误差是很大的,以前利用自我报告的调查数据的研究可能因此而受到影响。Song解释说,当回归模型中的经济变量受到调查或测量误差的影响时,估计会出现偏差,模糊了正确的关系。
"为了解决误差问题,许多经济学家假设这些误差可以忽略不计,或者相互抵消。然而,我们的研究表明,它们是不可忽略的,它们的平均数也不是零,这使许多使用调查数据的研究出现了重大偏差。"
最初,Song预计目标受众是经济学家和统计学家,但后来意识到该课题对工程、计算机科学、生物学和社会科学等领域的更广泛影响。
https://phys.org/news/2021-09-link-body-image-income.html