史海钩沉
自然语言处理简史之二:莱布尼兹的思想机器
1666年,德国多才多艺的学者Gottfried Wilhelm Leibniz发表了一篇神秘的论文,题为《组合的艺术》。莱布尼兹(Leibniz)当时20岁,但已经是一位雄心勃勃的思想家,他概述了一种通过基于规则的符号运算来自动产生知识的理论。
莱布尼兹的中心论点是,人类的所有思想,无论多么复杂,都是基本概念和基本概念的组合,就像句子是单词的组合一样。他相信,如果能够找到一种方法来象征性地表示出这些基本概念,并开发出将它们按照逻辑运算的方式,那么他将能够根据需要产生新的思想。
莱布尼兹的灵感来自于拉蒙·鲁尔(Ramon Llull),鲁尔是13世纪马略卡的神秘主义者,他致力于开发一种神学推理系统,用于向非信徒证明基督教的“普遍真理”。
鲁尔本人则是受到了犹太卡巴拉教派的启发,他将后者的思想又向前推进了一步,发明了所谓的“volvelle”。那是一组同心圆转盘,每一环上都标有象征上帝属性的符号。鲁尔相信,通过以各种方式旋转volvelle,将符号相互组合成新颖的字符串,他可以揭示出神性的方方面面。
莱布尼兹对鲁尔的转盘印象深刻,他着手设计一个项目,通过符号组合来计算思想。他对神学概念不感兴趣,而是用于哲学推理。他提出,这样的系统有三大基本元素:象征人类思想的字母;有效组合和重新组合的逻辑规则列表;以及一种可以快速,准确地对符号进行逻辑运算的机制。
他认为这台被他称为“理性的伟大工具”的机器将能够回答所有问题并终止所有的理性争论。
“当人与人发生争执时,我们可以简单地说,‘让我们来计算一下’,看看谁是正确的。”
——Gottfried Wilhelm Leibniz
启蒙运动的其他思想家,如勒内·笛卡尔(René Descartes),都认为存在着仅凭理性就可以达到的“普遍真理”;如果理解了基本原理,所有现象都可以得到充分解释。莱布尼兹认为,语言和认知本身亦是如此。
但是其他人认为,这种纯粹理性的学说存在严重缺陷。其中一位批评者是讽刺小说家乔纳森·斯威夫特(Jonathan Swift),他在1726年出版的《格列佛游记》中了讽刺了莱布尼兹的思想计算机:在一个章节里,格列佛参观了拉加多大学院,在那里他看到了一种奇怪的机械。
拉加多大学院的学生在机器侧面摇动手柄,使木质立方体旋转,将符号重新组合。抄写员记录下机器的输出内容,并将其交给教授。教授声称,通过这个过程,他和他的学生可以“撰写哲学,诗歌,政治,法律,数学和神学的书,而无需天赋或学习。”
斯威夫特对莱布尼兹思想机器的调侃,从更宽泛的角度说,是反对其科学至上主义的论点。与拉加多学院一样,该国的其他尝试(例如试图将人类排泄物重新转化为食物),格列佛也认为是毫无意义的实验。
斯威夫特的观点是,语言并不像莱布尼兹所主张的那样,能够代表人类思想的形式系统,而是一种凌乱而蒙昧的表达形式,必须借助上下文关系才能把握其意义。斯威夫特认为,要使机器生成语言,不仅需要正确的规则集,还需要具备理解单词含义的能力的机器,这是仅靠拉加多学院或莱布尼兹的“理性思想”都无法实现的目标。
最终,莱布尼兹从未造出他的思想机器。实际上,他在后来之后的人生中逐渐意识到,用机器生成语言的想法是不成熟的。但是,使用机械设备执行逻辑功能的想法却是大有希望的——1673年,莱布尼兹建造了机械计算器。
当今的数据科学家已经为NLP设计出了更好的算法,但他们之间的分歧仿佛是莱布尼兹和斯威夫特时代的回响:即使我们可以令机器生成看似有意义的语言,我们能够赋予它理解那些语言的能力吗?
下一节的内容:马尔科夫和香农的语言模型。