@ 2015.02.10 , 13:51

大数据时代的道德风险

[-]

这是一篇关于《The Black Box Society》的书评。

如果你是个美国人(中国也一样),将有着一堆的公式想要了解你的个人信息。这些公式或服务于私人公司,或服务于政府,但是他们都是直接或间接的基于你的行为进行分析。去google一下“Ways to keep New Years resolution”,然后去亚马逊买一条吸汗带,接着你fackbook的广告将是一些健身房的会员促销广告。在Wikihow上搜索“(加入叙利亚前线)Join al-Nusra Front”,并且在Target买一把猎刀,国安局就会锁定你。通过网络在虚拟世界活动就意味着,不光是被监控摄像头,还有GPS,以及网页cookies,都被越来越多的被用于对行为预测相关的监控算法。

来自马里兰大学的法学教授弗兰克·帕斯夸莱的新书《The Black Box Society》:介绍智能计算如何成为美国生活的三大(名誉,搜索和财务)主要组成部分之一的。帕斯夸莱借用了几个不同的概念,来描述现今美国生活中的信息收集算法。就如飞机上的黑匣子,它会通过算法搜集周围噪声中的有用信息。或者计算机中的黑盒测试,其中的算法是不可见的,只能通过输入输出分析内部逻辑。但是更像是一个黑洞,算法只在其内部是可见的。我们生活中的经济和许多重要的生活过程都与这一复杂的数学过程交织着。

[-]

在这种情形下,个人信誉将不再是以往人们对某个人的评价(当然是他不在场时)。我们生活中每个“可见”的部分,包括一次购物,一个鼠标点击,都构成了这幅信誉肖像的每一笔。在电脑面前,我们就像是巨型韦恩(Venn)图所描述的学生,就像无数个相互交织在一起的圆圈,圆圈被标记这:“家里的□□”,“喜欢蜂蜜燕麦”,“双性恋”等。罗布·霍宁把这些称为:我们在数字世界遨游时泄露信息构成的“数据的我(data self)”。
(维恩图也叫文氏图,用于显示元素集合重叠区域的图示。)

各种零售商、广告客户、数据经纪人等等,都拥挤在这些圈的边缘,寻求他们感兴趣的相关性模式。一般情况下这些分析是相对无害的,甚至是有益的,当Netflix公司根据的你观影史推荐一步新电影,或Pandora 推荐一首新歌。另一些时候,这些算法就并不是表现的很好,比如Twitter把我推荐给一位黑人作为约会对象时,或者煎蛋侧栏的广告,百度的搜索相关推荐。这些算法并非每次都做得好,但是总的来说大体方向上是相对正确的。

但是数字信誉系统的地下操作就十分可怕。公民法保护虽然公民的工作,住房和金融信息不被这些算法使用,以防个人种族和受孕信息预测(外国不是不做计划生育么?)。帕斯夸莱写道:虚拟市场中有规模相当惊人的比例用于寻找可疑贷款、医用药剂、寻求野鸡大学文凭的教育工作者(大概就是办证吧),并进行标记。赌博骗子会瞄准被标记为 “正在戒赌的赌客”,□□网站上还充斥这大量的铅笔增大药物广告。无论我们是否真的感兴趣,我们一直在告诉电脑(算法)从我们这里捞钱的最佳方式。我们不断的给他们提供大量的信息,这些信息正好帮助算法了解我们。网络就像是一所学校,我们就是学校所要学习的对象。

对于搜索方面,google并不是答案(大天朝当然就是百度了),它只是你咨询的第一个对象,但是这个概念就十分巨大。很难想像没有搜索引擎的网络会怎样,就像没有电话簿的电话,没有目录的字典。搜索使得我们能够找到世界上几乎存在的一切!帕斯夸莱比喻谷歌搜索在英语传播方面的霸主地位:虽然它不一定是最好的,但是它站在顶峰,并一直保持着。但是google的所有者的利益与大众并不总是一致的,帕斯夸莱援列举少数情况下:google核心算法在一定程度上反映了他们公司财务状况,而并非是搜索结果的“客观”排序。

虽然google一直努力表现的更加喜欢公共事务(如慈父般的存在?),但他们的书都是非公开的。Page rank算法的结果总是多少被企业利益“改进”过。

[-]

除了名誉和搜索,金融恐怕是美国人最担心被数据分析算法所染指的方面。通过算法,银行能够为次级抵押组合贷款寻求最佳投资人,而评级算法能够分析出在哪些地方资产是安全的。金融作为经济的一部分,其根本应该是致力于资源的有效组合。利益会不断从投资者流向可以有效利用他们的人。但是,随着金融业的发展,我们发现这些激励措施本身并不能保证好结果。

同时,金融大鳄们将他们的技巧隐藏了起来。正如帕斯夸莱所说的那样,“极端的复杂性迷惑了大众,为了扩展还公开邀请精算师,贸易商和经理人充当看门人,组建了如评级机构,会计师和监管机构的组织来隐藏他们的发财技巧。”金融大鳄们,就像腐败政党一样,利用自己在国家资源的中心位置,将这些资源纳入自己的腰包。

复杂的算法正加速了这一过程,金融机构通过切断一般人的财富增长,而使他们自己的财富增长的更为迅速。

帕斯夸莱的《The Black Box Society》的最后一章正是讨论如何致力于监管和改革。作为数字法律的学者,帕斯夸莱提供了一些有趣的改革方案,像一成不变的审计日志?和纳税人资助券制度,以支持独立艺术家。他们都觉得有点三心二意。每个黑盒代码的设计初衷都是为了获取利润,最佳解决方案是通过政府进行干预,通过立法在这些产品使用之前进行审查(PS:最近我过政府就推行了这一法案,需要公司将所有代码提交政府审核。苹果的itunes上的app也需要审核才能被发布)。但是这道防线也可能被侵蚀,因为华府虽然有自己的黑盒子,但是他们过度的依赖了私人安全公司。这种关系使得这些公司居于“政府资源中心”,在这里企业和政府的数据分析员聚在一起分享和保护商业秘密和国家安全。

帕斯夸莱针对这一黑幕进行了揭露,但是作为一个数字法律学者他的观点过于偏激,从头到尾他都都没有列举所谓的黑盒在保证国家安全上起到的作用。即便,短期内我们可能鲜有合作,随着时间人们不断接受这一过程,算法将越来越准确的对我们进行建模和预测。这本结构为:描述问题-提问-解决方案的书没有给帕斯夸莱太多的回旋余地和想象。其实就是没有解决提出太好的解决方案。

这本书只是说明了电脑在现今社会和个人生活发挥了核心作用,但是作者的观点只是一种特定结果(消极的方面):国家、企业在金融和执法部门的渗透,使得他们的服务越来与利益化。大量的财富、权利和有用信息逐渐流向少数人(PS:其实很正常,这是帕蒂罗分布的体现)。只要我们不断设计利润机,他们将不断对非市场性的信息分类,并包围他们。因为,利益是对社会资源(人力或物资)发展和管理的最佳驱动力,这一言论将不再是可信的。但随着我们从各方面得到的更多的信息,是的我们能够方便的展开一个新项目。

本文译自 New Republic,由 邻家乖蜀黍 编辑发布。

译者声明:我没看过这本书,也缺乏经济相关的知识,也没在美国生活过,更不具备资本主义国家的意识形态。我也不想骗稿费,更不想浪费大家的时间,大家也不想看这么复杂的书,咱们也许不怎么去美国。翻了豆瓣书评和中亚,都没有对本书的评价。到是美亚有几条评价认为这本书值得一读。但是还是看得出,作者一直主张这种隐秘的分析是消极的,我到是建议大家有兴趣的话可以看看《大数据时代》,有中文翻译版,档次比我要高大上无数倍,那里面有不少积极观点。

讨论:以前咱们喷绿坝,封谷歌还有很多国家政策,现在我们可能需要反思一下,你要骂我五毛我也没办法,我是就事论事,当然国家要是能给我钱被骂也值了。对于某些东西的发展,大家当然希望是走良性路线,但是事实上可能是利益驱动,有良心的人和有良心的网站不多,互联网时代大家都想发大财。不是也有网站盗用煎蛋文章去发家致富么?我去看了,作者名字都被去掉了。360什么的我也不敢信。政府要求所有公司提交代码也不是师出无名,说个实话,法律大部分情况还是用来保护弱者的,只是有时候法律尚不健全。

还就是12306撞库事件,我觉得大家应该对自己的社交账户自己去划分一下安全权限等级,每个等级的密码设置不同强度的口令,一般的社交网站(比如我自己没事逛贴吧,游戏论坛17173,duowan, 766等)这些网站可能安全性较低(明文保存)的密码设简单点也无所谓,但是要跟支付密码之类的做严格区分,上次查出来的库源就是他们。淘宝之类的,密码就设高强度和一般密码区分度高一些。我现在最怕的就是输入法,词频统计结合网站访问信息,做个字典我的密码恐怕不保。

支付宝打赏 [x]
您的大名: 打赏金额:
赞一个 (30)