@ 2015.11.26 , 22:30

数据挖掘技术,揭示了百年来年鉴中微笑的变化趋势

[-]
数据挖掘技术改变了我们对于信息的思考方式。然而,对于集体照的数据挖掘,长期以来一直被忽略了。这项工作其实蛮复杂的。

首先,数据量极大,从有摄影技术开始,跨度长达150多年。此外其中包含的信息很难提取,通常是因为这些信息太复杂或者太平凡了,难以用语言来描述。不过,加利福尼亚大学的 Shiry Ginosar 开拓的机器视觉技术,终于让我们得以提取普通照片中的信息。

Ginosar 与同伴从简单的数据库——美国高校1905年以来的毕业年鉴照片开始着手进行研究。美国各地图书馆对这些照片进行了数字化,其中包含每个人标准姿势的正面照。于是 Ginosar 等人,下载了150000张肖像。在剔除了部分非正面肖像照后,剩下37000张来自美国26个州800多份年鉴的照片。

然后他们将照片按照10年的跨度进行分组,并将照片进行叠加,得到这个时期的“平均”长相。这个过程同时显示出了一些其他的“平均”特征,如发型、衣着、眼镜款式,以及普遍表情。文章题图显示了这些每十年男性与女性平均长相的变化

结果看起来十分有趣,特别是年鉴照中微笑的变化特别明显。Ginosar及其团队表示,在刚出现照片技术的那几年,大部分的人拍照时,摆的都是油画姿势——这种自然的表情容易维持比较长的时间。

当时的礼仪标准是小嘴微张——摄影师拍照时的指令都是“说西梅”(prunes),而不是“茄子”(原文cheese)。而到了20世纪,拍照更加普及流行了,人们开始在拍照时摆出灿烂的笑容,留住美好的回忆。总之,如今的人们变得更爱笑了

该团队还开发了一种算法用于计算唇部的弯曲程度,数据显示,随着时间的推移,笑容明显加深了。

数据还揭示出了另一个趋势:女性比男性笑得更灿烂。此外,数据也显示了发型的变化趋势,如30年代的指卷波浪;40、50年代的发夹式卷发;60年代的bob头、飞片发型和泡沫蓬松头;70年代的长发、非洲发型和蓬松发型。80、90年代的规矩发型和刘海;以及21世纪的长直发。

也有一些从未变化的因素,例如男性一直默认着正装

当然,目前这种数据采集方式还有缺陷,例如20世纪美国18岁的中学毕业生不到10%,而20世纪60年代时,就增加到了50%多。此外,20世纪中期以前,学校里可没什么非裔美国人,这对数据也造成了较大的影响。

不过显然,这项技术很有价值,它可以帮助研究家庭人口的变化情况、儿童玩具的变化趋势、家庭壁纸的变化情况等等,前途无可限量。

本文译自 technologyreview,由 大脑袋 编辑发布。

赞一个 (10)