@ 2015.02.10 , 13:51
36

大数据时代的道德风险

[-]

这是一篇关于《The Black Box Society》的书评。

如果你是个美国人(中国也一样),将有着一堆的公式想要了解你的个人信息。这些公式或服务于私人公司,或服务于政府,但是他们都是直接或间接的基于你的行为进行分析。去google一下“Ways to keep New Years resolution”,然后去亚马逊买一条吸汗带,接着你fackbook的广告将是一些健身房的会员促销广告。在Wikihow上搜索“(加入叙利亚前线)Join al-Nusra Front”,并且在Target买一把猎刀,国安局就会锁定你。通过网络在虚拟世界活动就意味着,不光是被监控摄像头,还有GPS,以及网页cookies,都被越来越多的被用于对行为预测相关的监控算法。

来自马里兰大学的法学教授弗兰克·帕斯夸莱的新书《The Black Box Society》:介绍智能计算如何成为美国生活的三大(名誉,搜索和财务)主要组成部分之一的。帕斯夸莱借用了几个不同的概念,来描述现今美国生活中的信息收集算法。就如飞机上的黑匣子,它会通过算法搜集周围噪声中的有用信息。或者计算机中的黑盒测试,其中的算法是不可见的,只能通过输入输出分析内部逻辑。但是更像是一个黑洞,算法只在其内部是可见的。我们生活中的经济和许多重要的生活过程都与这一复杂的数学过程交织着。

[-]

在这种情形下,个人信誉将不再是以往人们对某个人的评价(当然是他不在场时)。我们生活中每个“可见”的部分,包括一次购物,一个鼠标点击,都构成了这幅信誉肖像的每一笔。在电脑面前,我们就像是巨型韦恩(Venn)图所描述的学生,就像无数个相互交织在一起的圆圈,圆圈被标记这:“家里的老二”,“喜欢蜂蜜燕麦”,“双性恋”等。罗布·霍宁把这些称为:我们在数字世界遨游时泄露信息构成的“数据的我(data self)”。
(维恩图也叫文氏图,用于显示元素集合重叠区域的图示。)

各种零售商、广告客户、数据经纪人等等,都拥挤在这些圈的边缘,寻求他们感兴趣的相关性模式。一般情况下这些分析是相对无害的,甚至是有益的,当Netflix公司根据的你观影史推荐一步新电影,或Pandora 推荐一首新歌。另一些时候,这些算法就并不是表现的很好,比如Twitter把我推荐给一位黑人作为约会对象时,或者煎蛋侧栏的广告,百度的搜索相关推荐。这些算法并非每次都做得好,但是总的来说大体方向上是相对正确的。

但是数字信誉系统的地下操作就十分可怕。公民法保护虽然公民的工作,住房和金融信息不被这些算法使用,以防个人种族和受孕信息预测(外国不是不做计划生育么?)。帕斯夸莱写道:虚拟市场中有规模相当惊人的比例用于寻找可疑贷款、医用药剂、寻求野鸡大学文凭的教育工作者(大概就是办证吧),并进行标记。赌博骗子会瞄准被标记为 “正在戒赌的赌客”,色情网站上还充斥这大量的铅笔增大药物广告。无论我们是否真的感兴趣,我们一直在告诉电脑(算法)从我们这里捞钱的最佳方式。我们不断的给他们提供大量的信息,这些信息正好帮助算法了解我们。网络就像是一所学校,我们就是学校所要学习的对象。

对于搜索方面,google并不是答案(大天朝当然就是百度了),它只是你咨询的第一个对象,但是这个概念就十分巨大。很难想像没有搜索引擎的网络会怎样,就像没有电话簿的电话,没有目录的字典。搜索使得我们能够找到世界上几乎存在的一切!帕斯夸莱比喻谷歌搜索在英语传播方面的霸主地位:虽然它不一定是最好的,但是它站在顶峰,并一直保持着。但是google的所有者的利益与大众并不总是一致的,帕斯夸莱援列举少数情况下:google核心算法在一定程度上反映了他们公司财务状况,而并非是搜索结果的“客观”排序。

虽然google一直努力表现的更加喜欢公共事务(如慈父般的存在?),但他们的书都是非公开的。Page rank算法的结果总是多少被企业利益“改进”过。

[-]

除了名誉和搜索,金融恐怕是美国人最担心被数据分析算法所染指的方面。通过算法,银行能够为次级抵押组合贷款寻求最佳投资人,而评级算法能够分析出在哪些地方资产是安全的。金融作为经济的一部分,其根本应该是致力于资源的有效组合。利益会不断从投资者流向可以有效利用他们的人。但是,随着金融业的发展,我们发现这些激励措施本身并不能保证好结果。

同时,金融大鳄们将他们的技巧隐藏了起来。正如帕斯夸莱所说的那样,“极端的复杂性迷惑了大众,为了扩展还公开邀请精算师,贸易商和经理人充当看门人,组建了如评级机构,会计师和监管机构的组织来隐藏他们的发财技巧。”金融大鳄们,就像腐败政党一样,利用自己在国家资源的中心位置,将这些资源纳入自己的腰包。

复杂的算法正加速了这一过程,金融机构通过切断一般人的财富增长,而使他们自己的财富增长的更为迅速。

帕斯夸莱的《The Black Box Society》的最后一章正是讨论如何致力于监管和改革。作为数字法律的学者,帕斯夸莱提供了一些有趣的改革方案,像一成不变的审计日志?和纳税人资助券制度,以支持独立艺术家。他们都觉得有点三心二意。每个黑盒代码的设计初衷都是为了获取利润,最佳解决方案是通过政府进行干预,通过立法在这些产品使用之前进行审查(PS:最近我过政府就推行了这一法案,需要公司将所有代码提交政府审核。苹果的itunes上的app也需要审核才能被发布)。但是这道防线也可能被侵蚀,因为华府虽然有自己的黑盒子,但是他们过度的依赖了私人安全公司。这种关系使得这些公司居于“政府资源中心”,在这里企业和政府的数据分析员聚在一起分享和保护商业秘密和国家安全。

帕斯夸莱针对这一黑幕进行了揭露,但是作为一个数字法律学者他的观点过于偏激,从头到尾他都都没有列举所谓的黑盒在保证国家安全上起到的作用。即便,短期内我们可能鲜有合作,随着时间人们不断接受这一过程,算法将越来越准确的对我们进行建模和预测。这本结构为:描述问题-提问-解决方案的书没有给帕斯夸莱太多的回旋余地和想象。其实就是没有解决提出太好的解决方案。

这本书只是说明了电脑在现今社会和个人生活发挥了核心作用,但是作者的观点只是一种特定结果(消极的方面):国家、企业在金融和执法部门的渗透,使得他们的服务越来与利益化。大量的财富、权利和有用信息逐渐流向少数人(PS:其实很正常,这是帕蒂罗分布的体现)。只要我们不断设计利润机,他们将不断对非市场性的信息分类,并包围他们。因为,利益是对社会资源(人力或物资)发展和管理的最佳驱动力,这一言论将不再是可信的。但随着我们从各方面得到的更多的信息,是的我们能够方便的展开一个新项目。

本文译自 New Republic,由译者 邻家乖蜀黍 基于创作共用协议(BY-NC)发布。

译者声明:我没看过这本书,也缺乏经济相关的知识,也没在美国生活过,更不具备资本主义国家的意识形态。我也不想骗稿费,更不想浪费大家的时间,大家也不想看这么复杂的书,咱们也许不怎么去美国。翻了豆瓣书评和中亚,都没有对本书的评价。到是美亚有几条评价认为这本书值得一读。但是还是看得出,作者一直主张这种隐秘的分析是消极的,我到是建议大家有兴趣的话可以看看《大数据时代》,有中文翻译版,档次比我要高大上无数倍,那里面有不少积极观点。

讨论:以前咱们喷绿坝,封谷歌还有很多国家政策,现在我们可能需要反思一下,你要骂我五毛我也没办法,我是就事论事,当然国家要是能给我钱被骂也值了。对于某些东西的发展,大家当然希望是走良性路线,但是事实上可能是利益驱动,有良心的人和有良心的网站不多,互联网时代大家都想发大财。不是也有网站盗用煎蛋文章去发家致富么?我去看了,作者名字都被去掉了。360什么的我也不敢信。政府要求所有公司提交代码也不是师出无名,说个实话,法律大部分情况还是用来保护弱者的,只是有时候法律尚不健全。

还就是12306撞库事件,我觉得大家应该对自己的社交账户自己去划分一下安全权限等级,每个等级的密码设置不同强度的口令,一般的社交网站(比如我自己没事逛贴吧,游戏论坛17173,duowan, 766等)这些网站可能安全性较低(明文保存)的密码设简单点也无所谓,但是要跟支付密码之类的做严格区分,上次查出来的库源就是他们。淘宝之类的,密码就设高强度和一般密码区分度高一些。我现在最怕的就是输入法,词频统计结合网站访问信息,做个字典我的密码恐怕不保。


给这篇稿打赏,让译者更有动力
支付宝打赏 [x]
您的大名: 打赏金额:

3.4
赞一个 (30)

TOTAL COMMENTS: 36+1

  1. 2688833

    ?零评论还是第一次看到

  2. 山芋
    @3 years ago
    2688902

    为什么我觉得这篇文章我昨晚见到过?

  3. 2688907

    @山芋: 昨天头痛没写完,我觉得这玩意发出来没人会看,就给sein先看了,结果他以为写完了,就发了。我看到让他撤了。我还是觉得没人会看

    [13] XX [0] 回复 [0]
  4. BatteryMan
    @3 years ago
    2688913

    哼,你就是把我心里想的都写出来,我也不会给你点赞。

  5. 神的波纹
    @3 years ago
    2688916

    长长长长长……

  6. BatteryMan
    @3 years ago
    2688923

    如果是数据收集领域那就没有办法了,都是实打实的数据,那是没有办法保证安全与隐私的。
    不过如果是数据分析领域还是可以达到一定程度上的隐蔽(错误),有的人就是能笨到把数据摆到他们眼睛下面都看不明白的程度,如果数据本身还是经过掩饰的就更无解了。

  7. 好色猴子
    @3 years ago
    2688925

    灰色字体会招来很多谩骂的……

  8. apploid
    @3 years ago
    2688963

    输入法确实是一个问题,各种云功能,简直是反人类,输个密码都好不放心

    [25] XX [0] 回复 [0]
  9. 2688993

    上网时不要登录什么google账号 baidu账号。也不要登录输入法账号。

    浏览器最好设置为隐私模式~

    其实个人能做的也不多。。。

  10. 2689002

    你说说需要反思啥? 或者说谁需要反思?

  11. 2689019

    额,小意见,灰字的话默默放在评论里就好了,同样是讨论,放在正文就有种……奇怪的感觉。就好比国家给我装了绿坝我既不能oo也不能xx只能默默观赏的感觉……

  12. stanley
    @3 years ago
    2689031

    有一天,在某东买了个u盘,下班后,去街边买了条士力架, 第二天上班刷煎蛋,就看到推广的广告有个士力架,还跟我买那款U盘放在一起 。 。。。。。。。。 是巧合么? 还是已经到了这种意识分析的地步?u盘跟士力架形状的确很像 – –

  13. 2689053

    @cvmax: 太甜了,你说的都不奏效的

  14. 坏淫
    @3 years ago
    2689061

    其实灰色才是小编真正要说的话。只是顾全翻译为主的网站,她只是默默把想表达的话语默默放在最后。小编不是个妹子就是个小受,介么敏感。从吃不上饭被人瞧不起的战后废墟国家,到现在步入信息时代法治时代,中国的进步不可谓不快,能够保持这样一种发展速度的政府很难说它是保守的,相反,它是相对开放相对进步的。绿坝之类确实影响到了每个人,但是它也为bat等等提供了发展的温床。没有绿坝,很难说中国现在的IT,传媒,广告,影视会是什么样子,也难说不会发生阿拉伯之春之类的情况。方向是对的,步伐是稳的,不要纠结于细节

    [30] XX [16] 回复 [0]
  15. forvord
    @3 years ago
    2689082

    大数据可以揭秘每个人的隐私,但要看到另一个方面;我们每个人也可以把自己特意包装出一个形象来,通过大数据让人搜得。

  16. 2689083

    云确实方便,可是隐私也就更容易泄漏,这也就是我为什么至今不用云备份短信通讯录什么的。百度实在恶心,我搜过什么就在百度广告上直接原封不动的显示出来,真是让人不爽,所以过段时间要清下cookies

    [10] XX [0] 回复 [0]
  17. 土金水
    @3 years ago
    2689149

    按某些人的观点说:国产软件全不可信

  18. Medivh
    @3 years ago
    2689199

    法律保护弱者?法律不是为统治阶级服务的么

  19. 2689212

    大数据要的是数量,预测群体行为,不是针对个人的,黑客什么的属于社工,你要是有那个价值就不会在煎蛋刷存在了

  20. 2689280

    其实愚蠢的大数据才是危险的。就比如我在百度搜索一个关键字,第二天看到满屏幕广告都跟我的搜索结果有关。哪怕伪装地像是不那么直接地知道我的搜索记录也好啊。

  21. GorgeousYaoyao
    @3 years ago
    2689339

    看完了,一介草民,感觉好无力

  22. 2689404

    以前360被曝收集用户数据时就对互联网感到绝望了,罢了罢了,这本就是个处在监控下的时代,想起小学时看的一篇以第一人称写被迫参与研制监听全民系统的暗黑科幻文,唉

  23. lolihunter
    @3 years ago
    2689411

    为什么我搜不到关于帕蒂罗分布的资料……

  24. 2689420

    @LJ: 其实谷歌早就有 不过人家是光明正大的,好像是可以关掉

  25. 星星鱿鱼
    @3 years ago
    2689428

    的确,我也是最怕输入法,尤其是手机输入法,所以从来不用搜狗

  26. 笑眯眯的狗
    @3 years ago
    2689494

    奇怪,难道你们用输入法都没有 ctrl+空格 的习惯么?反正我是除了打汉字之外,都要切换成英文输入法状态。而且也不会登录什么账号。

  27. bistro
    @3 years ago
    2689561

    有没有好心人造个软件你在上网的同时会制造假数据,然后现在系统没那么智能的时候我们又可以撑一段时间

  28. 邻家怪蜀黍
    @3 years ago
    2689608

    @lolihunter: wiki百科用英文 俗称2-8定律

  29. 邻家怪蜀黍
    @3 years ago
    2689620

    @lolihunter: http://en.wikipedia.org/wiki/Pareto_distribution

  30. 苏苏
    @3 years ago
    2689639

    善变的女人一天一个样,大数据怎么算?

  31. 2689829

    忽然间我脑子里本能的跳出那句话:老大哥知道你在想什么。

  32. contralisk
    @3 years ago
    2689907

    Rime 输入法!

  33. 七月的烟火
    @3 years ago
    2690254

    输入法方面,反正我个人是很讨厌一开机就是默认成xx输入法的那种设置,我自己的电脑都是默认是系统的英文键盘,需要中文的时候再Ctrl+空格开启输入法,用完随手Ctrl+空格再关掉。更不会在输入法开启的情况下去输入登陆XX的账号密码。这样做是否能避免输入法收集我的账号密码信息我不知道,但是我已经养成这个习惯了,总感觉比开机就是xx输入法心理上舒服一点。

  34. 神之疯神
    @3 years ago
    2690261

    以防个人种族和受孕信息预测(外国不是不做计划生育么?)
    这个说的是刚怀孕(甚至还没怀孕)就收到育儿产品广告轰炸的情况

    另外,政府介入监管黑盒,只不过是政府来分一口羹罢了,未来的腐败只会更加隐秘更难追踪

  35. 2690641

    灰字部分让人想起阿Q捏小尼姑脸时的言语:和尚动得,我就动不得?

    只是故事的小尼姑是骂一声“断子绝孙的阿Q”,而当下现实里的小尼姑是弱弱地说:“和尚都想动得,你们就不要骂阿Q了。”

  36. canadadry
    @3 years ago
    2690925

    有些人见识特别的少,所以别人的都特别的好。

发表评论


24H最赞