@ 2019.04.03 , 11:00

习得母语需要向大脑输入1.5M的先行信息

学习母语似乎毫不费力。昨天,襁褓中婴儿还在咿呀学语;今天,就可以把小孩子拉过来向客人表演背诵古诗。

但加州大学伯克利分校的一项新研究表明,母语天赋并不是以硬连线的方式写入了儿童的脑子里——从出生到年满18岁,学习语言需要向大脑输入大量的信息素材。

研究人员计算出,从婴儿期到青年期,学习者可吸收约1250万条关于语言的信息——大约每分钟2bit——以充分掌握语言模式。研究发现,如果转换成二进制代码,输入的信息可以装满1.5MB的软盘。

发表在《皇家学会开放科学》期刊上的研究结果挑战了语言学中的经典假说:语言习得对人类来说不费吹灰之力,机器人可以很容易地掌握它。

加州大学伯克利分校的心理学助理教授Steven Piantadosi说:“我们的工作是第一项衡量了语言习得所需信息量的研究。它强调儿童和青少年是非凡的学习者,每天能吸收超过1000比特的信息。”

例如,当出现“火鸡”这个词时,小孩子通常会问:“火鸡是一只鸟吗?是还是不是?火鸡飞吗?等等,直到掌握火鸡这个词的全部含义。”是,或不是,就相当于逻辑运算中的1和0。

“为了理解一个词语,考虑到小孩子必须记住数百个0和1构成序列时,那就是说他们必须有令人印象非常深刻的学习机制。”Piantadosi说。

Piantadosi和研究主要作者Frank Mollica博士试图衡量英语使用者学习母语所需的信息量和信息类型。

他们在计算机上运行有关语言语义和语法的各种模型。值得注意的是,该研究发现语言知识主要侧重于语义,而不是语法。

“许多关于语言学习的研究都集中在语法上,比如词序,”Piantadosi说,“但我们的研究表明,语法只是语言学习中的一小部分,而主要的难点在于记住众多单词的含义。”

关注语义与语法的区别也反映人与机器的区别,后者包括Alexa,Siri和Google Assistant等语音控制数字助手。

“这真的凸显了机器学习者和人类学习者之间的差异。”Piantadosi说,“机器知道哪些词汇在一起以及它们在句子中的位置,但对词语的含义知之甚少。”

至于双语人士是否必须存储两倍的信息,Piantadosi表示,就语义信息量而言,这是不太可能的,因为许多语义是跨语言共享的。

“像'母亲'这样的常用名词在各种语言中都有相似的语义,所以你不需要通过重新输入来学习它。”

本文译自 berkeley,由 majer 编辑发布。

赞一个 (11)