走进科学
人工智能革新了蛋白质科学,但未能终结它
AlphaFold2的突破性成就改变了蛋白质科学,但未能完全替代生物实验。
三年前,Google的AlphaFold取得了科学界迄今为止最大的人工智能突破,加速了分子研究,并引发了关于我们为什么从事科学研究的深刻思考。
2020年12月,在疫情封锁使面对面会议变得不可能的情况下,数百名计算科学家聚集在屏幕前,见证了科学新时代的到来。
他们参加了一场会议,这是一个他们有些人近三十年来几乎每次都会亲自参加的友好竞赛,在这里他们可以聚在一起,专注于同一个问题。这个问题被称为蛋白质折叠问题,简单来说:他们能否从最基本的信息——一维分子代码——准确预测出蛋白质分子的三维形状?蛋白质维持着我们的细胞和身体的生命运转。因为蛋白质的形状决定了它的行为,成功解决这个问题将对我们理解疾病、开发新药以及了解生命运作方式产生深远影响。
在这场每两年举行一次的会议上,科学家们测试了他们最新的蛋白质折叠工具。但解决方案总是遥不可及。有些人花费了一生的职业生涯,只是为了在这种预测上取得一点点进步。这些比赛的特点是缓慢的进展,研究人员几乎没有理由认为2020年会有所不同。
他们错了。
那一周,一位蛋白质科学界的新秀John Jumper展示了一种新的人工智能工具AlphaFold2,这个工具来自Google在伦敦的人工智能部门DeepMind。通过Zoom,他展示了数据,表明AlphaFold2的3D蛋白质结构预测模型的准确率超过了90%——是最接近的竞争对手的五倍。
刹那间,蛋白质折叠问题从不可能变得轻而易举。人工智能在人的智慧陷入困境的地方取得的成功震惊了生物学家社区。“我很震惊,”参加会议的哥伦比亚大学数学基因组学项目的系统生物学家Mohammed AlQuraishi说。“很多人都不敢相信。”
但在会议的总结发言中,组织者John Moult几乎没有留下任何疑问:AlphaFold2“基本上解决了”蛋白质折叠问题,并永远改变了蛋白质科学。坐在家中书房的书架前,穿着黑色高领毛衣,通过Zoom点击幻灯片,Moult用兴奋但也有些不祥的语气说:“这不是终点,而是起点。”
蛋白质分子有数亿种不同的形状。每一个都有一个特定的生物功能,从携带氧气通过血液到引发化学反应。函数通常由其形状或结构定义。
当Google的公关机器将这一消息传遍世界时,媒体疯狂了。标题声称AlphaFold2“将改变一切”。那些花了一生时间研究单一蛋白质结构的蛋白质生物学家担心他们会失业。有些人声称AlphaFold2将革新药物开发;现在生物学家可以迅速了解蛋白质的形状,他们可以创造出新的药物来针对它们。另一些人则反驳说,这些结果主要是炒作,实际改变不大。
Moult自己几乎无法理解这一消息。他以所有人心中的问题结束了会议:“接下来怎么办?”
那是三年半前的事了。现在终于可以开始回答他的问题了。
AlphaFold2无疑改变了生物学家研究蛋白质的方式。然而,尽管AlphaFold2是一个强大的预测工具,但它不是一个无所不知的机器。它巧妙地解决了蛋白质折叠问题的一部分,但不是以科学家的方式。它并没有取代生物实验,而是强调了它们的必要性。
也许AlphaFold2最大的影响是引起了生物学家对人工智能力量的关注。它已经激发了新的算法,包括设计自然界中不存在的新蛋白质的算法;新生物技术公司的成立;以及新的科学实践方式。它的继任者,AlphaFold3,已于2024年5月宣布,进入了生物预测的下一阶段,建模蛋白质与其他分子(如DNA或RNA)结合的结构。
“这是迄今为止最大的‘科学中的机器学习’故事,”AlQuraishi说。
然而,人工智能仍有很多巨大的空白没有填补。这些工具不能模拟蛋白质随时间的变化,也不能在它们存在的环境——细胞中建模它们。“AlphaFold改变了一切,又什么都没改变,”在劳伦斯伯克利国家实验室开发生物分子结构建模算法的结构生物学家Paul Adams说。
这是Jumper团队在Google DeepMind如何在蛋白质科学中取得成功,以及这对生物学中的人工智能未来意味着什么的故事。
[原文超长,有兴趣继续看原文]
本文译自 Quanta Magazine,由 BALI 编辑发布。