@ 2018.12.05 , 20:43

Deepmind搞了个大新闻:宣布AlphaFold系统开发成功

可能本文发出来是前天了,他们的官博上发文:
今天我们很高兴能向大家分享Deepmind部门的一项新成果,这也将是我们第一次能清楚地展示,人工智能研究对科学进步有多强大的助力。为了把最尖端的技术应用在蛋白质三维建模上(完全只以其基因序列为蓝图),我们搜罗了结构生物学、物理学和机器学习编程等各个业界的大佬,为这项目贡献心血。

耗时两年,这新系统终于开发成功,名为AlphaFold(阿法浮德?)。它绘制的蛋白质三维建模,在精度上远超此前人类所能,而生物学研究,亦会因此出现长足进步。

Deepmind搞了个大新闻:宣布AlphaFold系统开发成功
一种酶

什么是蛋白质折叠?
在微观上,蛋白质是宏伟而复杂的分子构造体。我们的肉身,从肌腱收放、感光到消化食物为能量,几乎所有功能的实现都可以各自追溯落实回某几个蛋白质的移动和变形上。

一种蛋白质能做什么,将按其独有的结构而定。比如我们免疫系统里的抗体蛋白质,就是个Y型,会勾住病毒和病菌,为后续火力标记出这些有害的小东西;切割DNA的蛋白质形状像剪刀;生产其他蛋白质的核糖体,自己的三维构造则像个工厂流水线。

完全只以某种蛋白质的基因序列为蓝图,构建出它的三维模型,在过去几十年都是个棘手的难题。难点在于,虽然我们在DNA上能抠出某个蛋白质的组成公式,知道把它擀直后是什么样,每一节又都有什么,可这长链实际上如何折叠,我们很多时候只能科学地猜,投入海量的时间和资源,反复验证。

这就是蛋白质折叠问题。蛋白质越大,它的构造和内部互动就越复杂。1969年利文索尔曾说过即使硬算到天荒地老,都无法穷尽某种典型蛋白质的构造形式,并找到对的那个,人称利文索尔佯谬。(感谢抓虫~)

为什么这问题重要?
一方面,只有知道其构造,才能知道该蛋白质准确的工位;另一方面是有多种疾病,现在都认为跟蛋白质错叠有关,如阿兹海默、帕金森、亨廷顿病以及囊胞性纤维症。

而AlphaFold提供的高精度模型,能帮助专家们设计出更低廉有效的新疗法。我们对各种蛋白质结构的知识由此能够积累加深,也能通过这些模型模拟来摸索其运作规则,这样,新药的发现机会大增,而同时开发成本将降低。我们相信,最终全球将有数以百万计的病人因此受惠。

除此之外,蛋白质折叠问题的解决很可能还会解锁另一条科技树上的分支。比如可生物降解酶的进步,应该能缓解当今塑料和石油的污染问题。实际上已经有科学家在尝试“调教”细菌,让它们分泌出特定的蛋白质让垃圾变得可生物降解,更容易处理。

下一步,会发生什么?
我们在蛋白质折叠领域的初步尝试,已经证明机器学习系统能够统驾驭梳理各路信息,帮助专家们便捷地就复杂问题得出解决之道。在阿法狗和阿法零身上,我们已经见证过AI能帮助人们通晓艰深游戏的玩法。相似地,我们也希望终有一日,AI技术的突破能帮助人类解决那些根本性的科学迷题:这个宇宙的玩法。

AI在折叠建模上带来的进境,让我们大家都很兴奋。虽然后续还有许许多多的工作等着去磨好,才能在疾病、环保等问题上做出切实成绩,但我们知道这条路上充满了可能性。我们的团队依然在专注深挖机器学习究竟还能在哪些方面推动科学向前,也依然在展望我们的技术能如何改变这世界的模样。

译:AlphaFold不知道会不会有正式译名/俗名,阿法芙?原文中间谈算法的几个自然段我觉得对公众来说太硬核,我翻不好又怀疑即使翻了大部分蛋友也没有那背景知识来吸收,所以就搁着没翻,见谅。文章结尾有Deepmind链接,懂的大佬请自行去看热闹就好。

原文:《AlphaFold: Using AI for scientific discovery》
本文译自 deepmind,由 梁兵 编辑发布。

赞一个 (22)