习得母语需要向大脑输入1.5M的先行信息

学习母语似乎毫不费力。昨天，襁褓中婴儿还在咿呀学语；今天，就可以把小孩子拉过来向客人表演背诵古诗。

但加州大学伯克利分校的一项新研究表明，母语天赋并不是以硬连线的方式写入了儿童的脑子里——从出生到年满18岁，学习语言需要向大脑输入大量的信息素材。

研究人员计算出，从婴儿期到青年期，学习者可吸收约1250万条关于语言的信息——大约每分钟2bit——以充分掌握语言模式。研究发现，如果转换成二进制代码，输入的信息可以装满1.5MB的软盘。

发表在《皇家学会开放科学》期刊上的研究结果挑战了语言学中的经典假说：语言习得对人类来说不费吹灰之力，机器人可以很容易地掌握它。

加州大学伯克利分校的心理学助理教授Steven Piantadosi说：“我们的工作是第一项衡量了语言习得所需信息量的研究。它强调儿童和青少年是非凡的学习者，每天能吸收超过1000比特的信息。”

例如，当出现“火鸡”这个词时，小孩子通常会问：“火鸡是一只鸟吗？是还是不是？火鸡飞吗？等等，直到掌握火鸡这个词的全部含义。”是，或不是，就相当于逻辑运算中的1和0。

“为了理解一个词语，考虑到小孩子必须记住数百个0和1构成序列时，那就是说他们必须有令人印象非常深刻的学习机制。”Piantadosi说。

Piantadosi和研究主要作者Frank Mollica博士试图衡量英语使用者学习母语所需的信息量和信息类型。

他们在计算机上运行有关语言语义和语法的各种模型。值得注意的是，该研究发现语言知识主要侧重于语义，而不是语法。

“许多关于语言学习的研究都集中在语法上，比如词序，”Piantadosi说，“但我们的研究表明，语法只是语言学习中的一小部分，而主要的难点在于记住众多单词的含义。”

关注语义与语法的区别也反映人与机器的区别，后者包括Alexa，Siri和Google Assistant等语音控制数字助手。

“这真的凸显了机器学习者和人类学习者之间的差异。”Piantadosi说，“机器知道哪些词汇在一起以及它们在句子中的位置，但对词语的含义知之甚少。”

至于双语人士是否必须存储两倍的信息，Piantadosi表示，就语义信息量而言，这是不太可能的，因为许多语义是跨语言共享的。

“像'母亲'这样的常用名词在各种语言中都有相似的语义，所以你不需要通过重新输入来学习它。”

本文译自 berkeley，由 majer 编辑发布。

赞一个 (11)

煎蛋