@ 2016.08.24 , 18:01

大热剧《硅谷》启发谷歌:用神经网络压缩文件

[-]

虽然这不是剧中的发散式压缩算法解决方案(middle-out compression),但是也仅次于这个了。

谷歌的研究者们正在研究一种用人工智能神经网络将图片文件压缩得更小却不会牺牲质量的方法。对用户而言,更小的文件意味着手机、平板和电脑可以有更多空间,但是对谷歌这样提供无限照片储存的公司而言,更小的文件意味着减少服务器负载、能量功耗以及改善传输速度。他们的灵感来源自HBO的大热剧《硅谷》,剧中虚构的创业公司Pied Piper使用了神经网络优化文件压缩。(Dropbox实际已经使用了他们的发散式压缩算法在自己的图片压缩中。)

根据发表在ArXiv上的技术论文,谷歌正在训练神经网络通过观察互联网上随机图片的标准压缩方式来节约数据。论文显示,神经网络可以在标准测试中战胜标准的JPEG压缩。但是这并不意味着该技术已经可以为谷歌产品所用。

在训练中,这一网络将六百万张随机选取的已压缩照片拆散为32*32像素的碎片,然后从中选出100张压缩率最低的碎片,并在此基础上进行学习。这里的「效率」是由那些被压缩成PNG后能最大程度保持其尺寸的碎片衡量的(因为PNG可以抵抗压缩)。研究者们提出理论,认为在经过更难的训练之后,该网络在处理简单碎片时可以做得更好。神经网络自己能预测图片在压缩之后的样子,并生成这个图片。这一研究最大特点便是,神经网络能决定用最佳方式对一张照片的不同碎片进行变量压缩,以及决定这些碎片要如何组装,而不是将这张照片视作一个整体。

谷歌今年早些时候已经公布了同一主题的研究,但是之前的研究从未证明这一方法可以用在小于64×64像素的图片上。当前的研究则不受文件尺寸限制。

虽然人们很容易认为最佳压缩方式就是将文件压缩到最小,但是人的主观感知也是非常重要的因素。如果终端用户看不清图片,压缩就是失败的。谷歌团队指出,鉴于主观感知这块没有标准度量或者测试(不像《硅谷》里的魏斯曼得分),他们很难衡量该网络的效果。

目前它还没有达到Pied Piper的压缩水平,他们在理论上可以把文件压缩到可以大小忽略不计,但是谷歌的研究证明剧中的理念并非天方夜谭。

本文译自 quartz,由 许叔 编辑发布。

赞一个 (21)