史海钩沉
史海钩沉:《花花公子》插图与JPEG文件格式的渊源
1972年,Lena Sjööblom为《花花公子》(Playboy)杂志拍了一张照片,后来她把这件事忘了,她完全不知道自己的照片会成为计算机图像识别的标准。
测试图像 Lena,原始图像是一个512×512像素的方形。摄影:Dwight Hooker, 1972
在Samantha Cole的新书《性如何改变了互联网,而互联网又如何改变了性》中写道,“这是一段意外的历史。” 书中追溯了这副来自《花花公子》的Lena图片如何成为训练计算机识别图像的国际标准。这张拍摄于1972年的图片在计算机科学领域持续使用了几十年,甚至在2015年还有工程学学生为它撰写专栏文章。对于许多进入该领域的年轻女性来说,这张图片及其无处不在的特点象征着性别歧视和男性统治。
1972年,Lena Sjööblom接受了《花花公子》的模特工作,拍摄了一张裸体照片,得到了报酬,然后继续她的生活。
这是Lena第一次也是最后一次拍摄裸体照片。她拒绝了Hugh Hefner参观他的豪宅的私人邀请。她在柯达公司做了更多的工作,为 "雪莉卡"(以第一个模特的名字命名,一个名叫Shirley Page的黑发白人柯达雇员)摆姿势,帮助技术人员校准胶片的照明和色彩平衡。她的朋友认为《花花公子》的经历是一个有趣的故事,但对Lena来说,那张照片已经成为过去。
但对世界其他地方来说,Lena正在改变互联网。
在那期《花花公子》刊发的几个月后,在南加州大学的信号和图像处理研究所,电子工程师Alexander Sawchuk和他的团队正在研究计算机的图像处理算法。他们使用 “测试图像”——一组特定的照片,在各成像实验室之间共享,以便每个实验室从相同的标准开始工作”——来测试他们的图像压缩算法。该团队的工作最终促进了JPEG文件格式的发展,这是我们今天仍然使用的最常见的图像格式之一。
关于莉娜的故事的历史复述中,似乎都没有包括(或想透露)究竟是谁,在那天把这本《花花公子》带到了工作岗位。但大多数说法都认为,当他们需要一个新的图像来扫描到惠普2100型微型计算机,为了方便,选择了1972年11月的《花花公子》。他们对旧的测试图像感到厌烦,想要一张有人脸、有趣的纹理和光亮的照片来测试技术的极限,而那张插图很完美。
他们把Lena的照片从她的肩膀上剪下来,让它成为一张“安全”的照片(safe for work)。有些人把裁剪工作归结为品味或技巧;更有可能的是,这是一个技术问题。该页的顶部5.12英寸适合Muirhead wirephoto扫描仪,形成一个512 x 512像素的图像。
这个图像非常符合他们的目的,他们把扫描结果给了其他从事类似图像处理任务的研究人员,最终它被广泛传播,以至于被整个行业接受为标准。当时还有其他的测试图像在使用,但Lena成为了全国各地实验室可以认同的既定标准。她经久不衰的遗产有一部分是由争议推动的。在20年的时间里,Lena的形象在《花花公子》注意到之前就悄悄地、不受控制地传播开来。当出版商注意到时,当行业期刊《光学工程》在1991年将Lena放在其7月的封面上时,他们试图挽回已经来不及了——出版商最终允许将其用于教育和研究目的。
但侵犯版权并不是导致争论的原因。科技世界的互联网爆炸同时为所有人提供了充满希望的未来,女性正在建设世界,主持和托管BBS服务器、MUD和她们自己的网站,与老男孩俱乐部在一起。但在计算机行业,女性仍然没有被视为与男性平等的竞争对手和同事。有些人认为,Lena的测试图像只是过去30年来统治世界的漫不经心的父权思想的又一产物。一些人要求让这张照片退役。
行业期刊《IEEE图像处理汇刊》的主编David Munson Jr.在1996年写了一封公开信来处理这些投诉。他的结论是不要审查Lena的使用,但如果有其他同样有用的选择,研究人员应该选择那些替代。“如果另一个图像也能很好地满足你的目的,为什么不使用另一个图像呢?”Munson写道。问题似乎解决了。
多年来,Lena本人并不知道这一切的发生。她在瑞典过着平静的生活,没有意识到她的照片在美国的计算机极客中引起的骚动。直到1997年她被邀请参加影像科学与技术学会第50届年会,她才明白她的照片被使用的范围,更不用说作为黄金标准使用了20多年。在那之前,她甚至从未接触过互联网。
这次会议对Lena来说是一次超现实的经历,主要是因为所有这些人,大多数是白人男性工程师,以前从未考虑过她真实的、实际的存在——他们在其学术生涯中见到这个怪异的科学女性,他们仔细研究了这组像素和颜色——但从未将其视为整个人类的一部分。
对女性身体和形象的实验态度将女性赶出了这个行业,而她们还没有机会开始。2015年,Thomas Jefferson科技高中的高三学生Maddie Zug给《华盛顿邮报》写了一篇专栏文章,讲述了她作为少数几个被指派使用莉娜形象进行编码项目的女性同龄人之一的经历。老师警告她们不要翻阅该图片。当然,那个计算机实验室里的每个人做的第一件事就是搜索原版,然后在屏幕上调出整个插页。
Zug写道:“当时我16岁,很难相信我属于一个男性主导的计算机科学班。”
“我试着不去理会男孩们的性评论。为什么一所先进的科学、技术、工程和数学学校在课堂上使用《花花公子》插页?”
今天,技术专业的女学生仍然有许多与她们一开始就有的抱怨。性别工资差距,男性倾斜的晋升机会,以及性别歧视的态度仍然在科技行业盛行。不得不坐着听计算机课,而在这堂课上,一个关于一群男人和他们不知情的玩伴的故事就是这周的课程,这是在伤口上撒盐。
虽然现在Lena已经70多岁,已经是一位祖母了,但她对自己形象的使用似乎没有什么强烈的意见。尽管这个测试图像仍然困扰着我们的现代机器,就像一个怀旧的点头示意,如今的图像处理研究人员偶尔会在他们的论文中使用她。但是近年来,一些期刊和机构宣布他们将直接禁止以Lena为主角的投稿,包括光学学会、工业与应用数学学会,以及整个《自然》杂志家族的大约150份期刊。
对于图像处理界的一些人来说,Lena已经超过了她的用处。在他2018年作为IEEE Transactions主编的告别信中,Scott Acton敦促他的同事们跳出老一套的思维模式。Lena的照片包含大约26万个像素——这对她所处的年代来说相当不错,而2019年发布的iPhone 11的一张图片包含了超过1200万的像素。
在Lena的 "十一月小姐 "刊出五年后,Apple II将成为第一台进入美国家庭的具有图形功能的个人电脑。然而,在图像处理普及之前,人们只能将就着使用现有的设备:把文字组合成马赛克来显示“图片”。