@ 2019.07.18 , 10:00

用人工智能在论文中“捡漏”

劳伦斯伯克利国家实验室的研究人员已经开发出一种人工智能,只需要很少的训练,就能在材料科学领域有所发现。这种人工智能主要的工作就是“捡漏”,为了发现科学家们遗漏了什么,它所要做的就是阅读以前发表的数百万篇科学论文。

这种人工智能所用的方法被称为机器学习,是一种能够针对特定任务进行训练的算法,直到经过多次迭代,生成有意义的结果。机器学习的方法被用来解决许多问题,该研究团队就利用它在材料科学的世界中寻找那些被“遗漏”的知识。

正如《自然》杂志报道的那样,科学家们给这个被称为Word2vec的算法输入了330万篇来自1922年至2018年间出版的1000种不同期刊的材料科学论文摘要。它从这些摘要中抽取了50万个不同的单词,并在它们之间建立了数学联系。这给了该人工智能非常有趣的预测能力。

目前在谷歌工作的伯克利实验室博士后Vahe Tshitoyan,他在一份声明中说道:“每个研究领域都累积了100年的研究文献,每周都有几十项研究被发表,而研究人员只能访问其中的一小部分。我们认为,机器学习能够在不需要人类研究人员指导的情况下利用这些集体的知识。”

通过对程序进行一些训练后,研究人员创造出一种可以将单词与其含义联系起来的人工智能。例如,它可以在21元素周期表中对元素进行分组,而不需要知道该元素是什么样子的。研究小组的主要重点是热电材料,这是材料科学家研究了几十年的领域。热电材料能把热转化为电,因此它们非常重要。然而,要想成功,这些材料还需要高效、安全、通用和易于生产的特性。

在文献分析的基础上,这种人工智能可以确定哪种材料具有最好的热电性能。但它做了一些更不同寻常的事情:通过2008年之前出版的摘要,Word2vec能够预测出现在后来研究中的材料。伯克利实验室能源储存与分布资源部工作的团队负责人Anubhav Jain说道:“我真的没想到这个算法还能预测未来,我认为这个算法也许可以描述人们以前做过的事情,但是不能得出这些不同之间的联系。当我不仅看到了预测,而且还看到了预测背后的推理时,我感到非常惊讶。这项研究表明,如果这种算法更早被使用,一些材料可能在几年前就被发现了。”

该团队已经公布了Word2vec选出的排名前50的热电材料,并计划发布该算法,以便其他科学家可以使用这一人工智能来研究不同的材料。研究小组还在研究一种新型的学术搜索引擎,这种引擎可以更有效地搜索论文摘要。

本文译自 iflscience,由 Lough 编辑发布。

赞一个 (9)