@ 2018.06.25 , 12:00

用AI翻译最神秘的古代书籍:伏尼契手稿

用AI翻译最神秘的古代书籍:伏尼契手稿
Beinecke珍稀图书和稿件藏馆

几个世纪以来,它都是无人能够破解的天书,但现在我们终于有机会知晓它到底记录了什么秘密。

伏尼契手稿(Voynich manuscript)通常被称为世界上最神秘的书,有大约240页以复杂的未知语言编写的神秘文字,并附有奇怪的图表和插图。它甚至还带有折叠彩页,这对于可追溯到15世纪初的中世纪书籍来说,可说是非常精美漂亮。

问题是,数百年来一直没有哪个人类能够解读这些被誊写在古代牛皮纸上的文字。

1912 年,美国珍本书商威尔弗雷德·伏尼契(Wilfrid Voynich)在罗马附近一所耶稣会大学图书馆的地下,找到他一生中最大的发现:一份厚达230多页,以奇特字体写成的手稿,手稿中还有许多植物、天体和出浴美女等奇异的图片。伏尼契立刻认定这是极为重要的新发现。这份手稿虽然看来像是中世纪炼金术士或草药医生的参考书,但似乎完全以密码写成。从插图中的发型等特征看来,这本书的制作时间应该介于1470~1500年间,手稿上的信中的17世纪字母说明,这份手稿在1586年由神圣罗马帝国的鲁道夫二世收购。 1600年代,至少有十位学者曾试图解读这份手稿,后来它消失了将近250年,直到被书商伏尼契发现才重见天日。——百科

大量的密码学家、密码破译者和语言学家都试图揭开伏尼契手稿的秘密,但其页面中包含的晦涩难懂的代码,以及植物、符号和沐浴女性组成的奇怪图画,令所有的尝试统统无功而返。

现在,多亏了加拿大的计算机科学家,让我们在有生之年看到了一线希望。

阿尔伯塔大学的研究人员使用人工智能来解码古代手稿,他们使用一种被称为算法解密的技术来揭示隐藏在这本奇怪书籍背后的加密信息。

他们在论文中解释说,因为涉及未知数量的变量,这不是一件容易的事情。“手稿用一种未知语言编写,这是一种最具挑战性的解密问题。”

利用《世界人权宣言》的380种不同译文文本,测试过他们的算法后,研究人员的发现他们的工具有97%的几率正确识别出了原文所用的语言。

随后,他们将伏尼契手稿喂给AI。以往有人怀疑,它们可能是用阿拉伯语写成,但人工智能并不同意。AI说,剔除了很多中世纪不大流行的备选语言项,希伯来文才是最有可能的原始文本语言。

研究人员假设文本中的单词,是将希伯来语中的单词去掉元音,按照字母表顺序重拍后得到的密码。(take—>kt)

科学家教授AI掌握上面的变换规则,令其尝试解读文本的前10页。

“事实证明,超过80%的文字可以和希伯来语字典中的相对应,但我们不知道它们连在一起是否组成有意义的句子。”计算语言学家Greg Kondrak说。

因为没有找到希伯来语学者帮助他们检验他们的发现,研究人员最终使用了谷歌在线翻译,但即使他们承认翻译时需要用到一点想象力,但结果似乎与手稿相匹配。

那是手稿“草药”一章的开头部分,因书页中绘有几种植物的图画而得名,翻译时出现了许多植物学相关术语,包括农民、光线、空气和火焰。

巧合?也许不是。

根据AI的说法,“她向牧师,家中的人,我和人们提出了建议,”是手稿中的第一句话。

也许是草药的建议?该团队承认他们也不能确定。

“它给出了一个语法上合理的句子,你可以从各种角度来解读它。”Kondrak说,“这句话有点怪,尤其是作为一部书的开头,但它绝对是有道理的。”

也就是说,团队承认他们需要古希伯来历史学家的协助来完成进一步解码,并确保我们不会因算法的不足衍生出误解。

“无论如何,对噪音输入进行算法解密的结果只能成为熟悉特定语言和历史时期的学者的起点。”

考虑到我们还有许多谜题等待揭晓,对以后研究古代文书而言,AI或许是一个令人兴奋的新领导。当然,这并不是说现在每个人都必须相信该团队基于AI的翻译是完全正确的。

本文译自 sciencealert,由译者 majer 基于创作共用协议(BY-NC)发布。


给这篇稿打赏,让译者更有动力 !
支付宝打赏 [x]
您的大名: 打赏金额:

4.8
赞一个 (10)

24H最赞