@ 2017.12.11 , 15:30

IBM利用语言翻译系统的AI来预测化学反应

IBM利用语言翻译系统的AI来预测化学反应
credit:123RF

把原子看成是字母,分子当做是单词,IBM的人工智能软件现正使用翻译语言的算法来预测有机化学的反应结果,这套巧妙的工具可以缩短新药物开发流程。

在过去的半个世纪里,科学家们试图教授计算机化学理解化学原理,预测有机化学的反应。然而,有机物和它们之间的反应实在是非常复杂,对他们的行为进行数字模拟可能会耗费大量时间,却只能得到模棱两可的结果。

与以前不同,IBM的研究人员利用了一般用于翻译语言的AI系统,“不是把英文翻译成德文或中文,而是用同样机制的人工智能技术,通过参考数十万甚至数百万次的化学反应,来学习有机化学的‘语法结构’,然后来对未见过的高分子之间的化学反应来预测结果。”报告的合作者,苏黎世IBM研究所的Teodoro Laino说。

“我们希望帮助化学家设计出有机化合物的新配方,”制取药物和其他复杂的有机化合物往往是一项是否艰巨的任务,“可能需要30或40个步骤,”他解释说。“商业领域和资本市场都渴望寻找到能跳过几个步骤的捷径,从而缩短生产时间,提高产量。”

AI程序是一个人工神经网络系统。在这个网络中,由395496个被称为神经元的组件响应输入的数据,通过集成训练共同做出反馈。神经网络反复调整其神经元之间的连接,看看这些新的连接模式是否能产生更好的结果。随着时间的推移,神经网络会找到一个最优模式来处理输入的问题,整个步骤就是模仿人脑中的学习过程。 Laino说:“这种推理和学习方式与现实生活中有机化学家的思维习惯非常相像。”

正如一个稍大些的儿童,可以流利的使用母语,但是却全然没有关于语言语法结构的知识。人工智能软件或许永远都不会理解机化学的反应原理,但仍然可以分析预测出符合实际的结果。甚至当化学反应可能有不止一个结果时,它会按可能性的大小罗列出所有答案。

在具体实验中,系统只提供了几率最大的5种结果。测试表明可能性最高那组预测在80%的时间中都是正确的。尽管该团队迄今为止只对含有150个或更少的分子的聚合物进行了数字模拟,但是对更复杂的高分子,并没有理论上限制阻碍AI的应用。

在未来,“我们计划通过云服务向大家提供这个服务,”苏黎世IBM研究院的Théophile Gaudin说,“我们也希望达到90%甚至更高的精确度,以后的思路是使用特定的模型来替代一般的有机化学模型,我们让AI专专精于特定类别的有机化学反应。”

此外,研究人员会将诸如温度、溶剂和pH等因素纳入对AI的训练中。然而,这需要更加仔细检查地所有这些附加数据的准确性。

此外,“我们还希望进行社会学实验,我们希望找到有机化学专家,看看我们的模型与他们相比,是否具有优势。”Gaudin说。

由于人工智能尚不完善,仍然需要有机化学家来指导AI的学习。 “我们并不像用电脑来取代有机化学家,而是为了帮助他们。”Laino解释说。

AI科学家们在12月4日加利福尼亚州长滩举行的神经信息处理系统会议上详细介绍了他们的发现。

本文译自 IEEE,由 majer 编辑发布。

支付宝打赏 [x]
您的大名: 打赏金额:
赞一个 (1)