@ 2016.09.14 , 19:00
33

天真!你以为打马赛克就安全了?

[-]

网上保护隐私的防范措施越来越容易被破解了,尤其是模糊处理和打马赛克的图片。这些方法可以防止吃瓜群众看到敏感信息,但是对于德州大学奥斯汀分校和康奈尔大学的研究者而言,这些措施在机器学习时代已经不堪一击了。

通过深度学习工具,这个三人团队可以识别高度模糊的面部和数字。在一个行业标准的数据集中,人类只有0.19%的识别准确度,而算法则有超过7成的胜算(在可以猜测5次的情况下胜算达到了83%)。该算法并不会制造去模糊的图片,它只是能识别从模糊图片中看到的东西,基于它已经知道的信息。这一方法对马赛克和P3同样有效,后者是一种被视为可以安全隐藏信息的JPEG加密方法。

今年,专门用来看穿模糊图片和马赛克的工具如雨后春笋般冒出,比如马克斯普朗克研究所的一款识别脸书上模糊人像的工具。德州大学和康奈尔大学的研究与众不同的是它简单。他们使用了Torch(一种开源深度学习数据库),神经网络Torch模板和标准开源数据。

“我们用的是乞丐版方法,东西都是现成的,”康奈尔大学的研究合著者Vitaly Shmatikov说。“找来一堆训练数据,扔一个神经网络,在扔一个标准图片识别算法,于是我们得到不错的结果了。”

Shmatikov承认,考虑识别的语境线索的话,普朗克研究所的成果更加高端。但是他说他的简单方法已经充分说明隐私保护形同虚设。

[-]

为了做演示,研究者们用油管视频工具找来一些图片和模糊的人脸。然后他们将这两组图片都交给算法处理,从而它能够将模糊的图像跟清楚的图像建立联系。遇到同一个人的不同照片时,算法一次性识别准确率是57%,5次识别的准确率是85%。“这玩意很简单,”研究合著者Richard McPherson说。“唯一的限制就是你拿来训练它的数据集。但是如果想搞,还是搞得到的。”

[-]
用油管模糊工具处理的图片可以被轻易识别

训练数据集可以是脸书上的头像,或者是网站上的员工目录。从数字到字母(甚至是手写的),网上都能找到训练数据集。McPherson和Shmatikov说,油管上推荐的模糊措施只能防人,防不了机器。

“在安全和隐私方面,人们尚未感受到机器学习的威力,”Shmatikov说。“除非有人用简简单单就找到破解之道,人们才会意识到自己的隐私不堪一击。”

本文译自 quartz,由译者 许叔 基于创作共用协议(BY-NC)发布。


给这篇稿打赏,让译者更有动力
支付宝打赏 [x]
您的大名: 打赏金额:

4.5
赞一个 (32)

TOTAL COMMENTS: 33+1

  1. 马赛克
    @1 year ago
    3256866

    一直希望有这种工具~

    [232] XX [4] 回复 [0]
  2. Hearty
    @1 year ago
    3256867

    大家都知道这玩意该拿来做什么,我先说吧苍井空,希野,柚木提娜

    [130] XX [11] 回复 [0]
  3. 阿迷
    @1 year ago
    3256868

    怀念原来妹子图的像素logo了

    [19] XX [1] 回复 [0]
  4. Hearty
    @1 year ago
    3256869

    大家都知道该拿来做什么,我先说吧,苍井空,希志爱野,柚木提娜

    [11] XX [1] 回复 [0]
  5. 3256870

    近视眼摘掉眼睛就能解决的问题

    [26] XX [1] 回复 [0]
  6. 3256871

    心中早已无码多年。

    [36] XX [2] 回复 [0]
  7. 弯仔
    @1 year ago
    3256874

    谢谢这方面的研究者

  8. flanker98
    @1 year ago
    3256877

    翻译得不对,library要翻译成库(函数库),而不是图书馆。

    [67] XX [0] 回复 [0]
  9. 3256879

    骑兵片能逐帧去马赛克了?

    [23] XX [2] 回复 [0]
  10. 水能载舟
    @1 year ago
    3256880

    先把工具放出来给我们试试啊。

  11. 3256881

    阅尽天下AV,心中自然无码,南无阿弥陀佛

    [30] XX [1] 回复 [0]
  12. 3256886

    我知道你们都在想什么 。。。

  13. 嘟嘟
    @1 year ago
    3256889

    为啥不早发明出来!害我的视觉系统朝错误方向进化了这么多年。。

    [26] XX [1] 回复 [0]
  14. 屁股
    @1 year ago
    3256892

    该算法并不会制造去模糊的图片。so fk off

  15. 日落炒番茄
    @1 year ago
    3256903

    目测研究者是色鬼。

  16. 3256911

    这篇文章你应该去给日本人看,给日本的广电总局看,

  17. 包皮垢
    @1 year ago
    3256915

    @Hearty: 其实马赛克遮住的地方并没多大区别

  18. harami
    @1 year ago
    3256944

    说去码的一看就是没看正文 这个只能分辨出类型 黑的粉的 这些肉眼都能分辨出 并不能还原图像

    [10] XX [0] 回复 [0]
  19. 咯咯
    @1 year ago
    3256951

    一大群不看内容急于评论的,煎蛋应该推出账号等级制啦
    文章都说了不是去马赛克而是试图识别图中的东西
    马赛克和模糊再怎么说也是对原是图像的破坏,不可能有算法能完全逆向恢复的,极端的例子,整张图片是九个大像素块的马赛克,恢复原始图和“P他的正脸”一样困难。

    [33] XX [1] 回复 [0]
  20. freakbeast
    @1 year ago
    3256966

    是开源项目吗?

  21. hhhhha
    @1 year ago
    3256982

    这群人用的机器学习框架Torch就是Facebook开发的

  22. 3257038

    真正的粉丝

  23. 3257041

    相比于黑条黑块,马赛克就是装逼不成反被打的例子啊

  24. 马赛克兄弟
    @1 year ago
    3257151

    一直希望有这种工具~(hhhhh…)

  25. 马赛克兄弟
    @1 year ago
    3257152

    一直希望有这种工具~(hhhhh…)

  26. 普利奈尔
    @1 year ago
    3257162

    然后在古罗马的蜥蜴嘴里也发现了这种物质。

  27. OM雷帝嘎嘎
    @1 year ago
    3257203

    原理并不难理解,模糊化本来就是用来欺骗人的视觉的,而对于机器来说,只是简单的数据加密。

  28. (#゚Д゚)
    @1 year ago
    3257238

    丟他病歷

  29. 绅士
    @1 year ago
    3257254

    看来单纯的高斯模糊已经骗不了机器了, 还是硬打码最靠谱, 例如覆盖一个超载鸡什么的

  30. 哼哼哈嘿
    @1 year ago
    3257297

    super-resulotuon方面的工作已经有一段时间了。东京大学还把这个技术用到了龙珠上,得到了超高清的龙珠。

  31. 鸡鸡
    @1 year ago
    3257565

    什么时候发明转过身技术?

  32. 3258120

    这个技术不是早就有了吗?而基本上有这个的人都高兴不起来。出来吧近视眼。

  33. 扬帆大海
    @1 year ago
    3261324

    所以主要信息打码我都是打两层。纯色条遮蔽-保存-马赛克遮蔽-保存

发表评论


24H最赞