@ 2017.11.17 , 17:30

我们该不该让算法认识不同种族的脸?

科技公司们正着眼于下一个前沿领域:人脸。只要你愿意,现在就可以把自己的面部表情实时叠加在视频中的动物脸上。如果你手头比较宽裕,新买的iPhone X则可以用你的脸解锁智能手机。而在中国杭州的一家肯德基里,甚至冲着摄像头笑一笑都可以买鸡肉三明治了。现在,美国至少四分之一的警察局都在使用人脸识别软件来帮助寻找嫌犯了。

但这项技术还不算完美。你的新iPhone X不是每次都能成功解锁;警察也可能错抓好人。在人脸识别软件总是能准确地认出你的脸的背后,是一系列算法在协同工作。首先,软件必须能区分出一张图片中到底是不是包含人脸。如果你是想要找到走失儿童的警察叔叔,估计还会想要软件把图像中所有的人脸按年龄排序一下。最终,我们需要的是一个可以把每一张人脸与数据库中的图像进行比对,即便这些照片可能有着不同的角度、不同的光线,但仍然能认出这些脸是不是属于同一个人的软件。

为了改进这些算法,研究人员发现他们其实使用的是民意调查机构和社会科学家们惯用的工具:人口统计学。通常来说,如果让面部识别软件学会关于种族、性别以及年龄的差异,它们都能更好地完成任务。“这没什么可奇怪的,”密歇根州立大学的生物统计学研究员Anil Jain说道,“模型的分类越精细,结果当然越好。”有了更好的算法之后,也许警察就不会冤枉好人了。听上去对每个人都是个好消息,对吧?

但事实没有这么简单。人口统计数据也许可以让算法变得更精确,但却让算法使用起来更复杂了。

我们该不该让算法认识不同种族的脸?
credit:锐景创意

举个简单的例子。英国萨里大学和中国江南大学的研究人员正努力改进一种用在面部识别应用中的算法。这个算法基于一种叫做3D形变的模型,可以在不到一秒钟的时间内把一张自拍照转换成一个3D的头部数字模型。举例来说,有了这个模型,你就可以转换某人自拍照的角度,并把它和其他照片进行比较。iPhone和Snapchat也在使用类似的3D模型。

研究人员给了这个算法一些基础的指令:比如关于头部的模板,以及把这个模板进行拉伸或者压缩以使2D的图像来尽可能地平滑覆盖它的能力。他们使用的模板本质上是基于人脸数据的平均值的——平均的鼻子高度、平均的瞳孔距离、平均的脸颊宽度,这些数数据则来自他们对真人的3D脸部扫描。因为这种扫描非常耗时,过去人们在制作这些模型时往往很难获得大量的扫描数据。所以,过去一般只是把收集到的所有数据放在一起,并计算出一张“平均的脸”,而不管那些基础数据中的种族、性别和年龄差异。

这个研究小组使用了一个包含942张来自英国和中国的脸部数据的数据库来制作他们的模板。 不同的是,他们这次没有一次性计算942张脸的平均值,而是预先对不同种族的脸部数据进行了归类。他们给每一个不同种族都制作了模板——算出了平均的亚洲脸、平均的白人脸,以及平均的黑人脸,并在这三个模板之上搭建了他们的算法。尽管他们只有10张黑人脸的扫描数据——相比之下,白种人的数据是100张,而亚洲人脸更是高达800张——他们还是发现这个算法生成的3D模型要比之前仅依赖单一模板的模型更加符合真人的头部实际状况。

“这不仅仅与种族之别有关,”萨里大学的计算机科学家Zhenhua Feng说道,“如果你为婴儿建立了一个模型,那么由此构建的婴儿3D面部数据也会更好。如果给老人建立一个模型,构建那种类别的3D面部数据也会更好。”所以就是说,如果你向生物统计学软件明确地输入不同社会分类的数据,算法就会工作得更好。

Jian认为,Feng的3D模型是一个面部识别的细分算法——尽管目前的主流算法还是在使用2D的照片,因为3D的面部数据使用起来还是很难的。但是,其他更加广泛使用的技术也在通过对不同的人群进行分类来提高软件的表现。基于某一具体人的模型是一种更常见的3D脸部模型,它也经常会用到脸部模板。根据图片中的人是男是女,是老是幼,算法通常会启用不同的模板。对于那种用来区分不同照片中是否包含同一个人的特定2D机器学习算法来说,研究人员已经证明,如果你把人的外貌进一步加以细分归类的话——比如按照性别和种族,也可以按照不同的眼睛颜色和表情等等——通常算法的结果都会更精确。

我们该不该让算法认识不同种族的脸?
credit:锐景创意

所以,如果你教会算法识别不同的种族,这算不算种族主义?哥伦比亚大学的社会学家Alondra Nelson是研究新技术道德的专家,他认为没必要为此大惊小怪。社会科学家们基于人口信息来给数据进行分类是长久以来的惯例,这也算是对社会自身已有的结构的响应。举例来说,社会学家经常分析不同性别和种族的行为逻辑。“我们就生活在一个到处在使用种族来分类的世界,”Nelson说道,“我不明白为什么关于这一点竟然还有争论。”现有数据库——比如FBI的面部数据库,以及人口普查数据——已经把人们按照预先设定好的类别分门别类划分好了。所以如果你想用这些数据库,也就必须使用这些分类方法。

然而,Nelson还是指出,最关键的地方在于,科学家们需要想清楚为什么要按照种族分类而不是其他分类方法。可能有一些分类方法没有那么严重的潜在歧视或者偏见影响,但是也同样有效。“如果按照蓝眼睛或者黑眼睛、宽鼻子或者窄鼻子来分类行不行?这不就完全没有种族主义什么事儿了嘛?”Nelson如是说。

他还说,研究人员需要想象一下他们的工作成果可能被用在哪里,特别是那些可能被政府部门或者权力机构使用的成果。去年,FBI公布了巴尔的摩“黑命贵(Black Lives Matter)”系列抗议活动的监控录像——那里的警方自从2011年起就在使用面部识别软件了。Nelson说:“这项工作在技术上越来越复杂了,能否应用已经不仅仅取决于研究人员的技术成果,还要涉及到伦理工作了。”

本文译自 WIRED,由 Freez Sun 编辑发布。

赞一个 (4)