走进科学
不同语种具有相同的信息转化率:每秒39比特
整体而言,意大利人拥有世界上最快的语速,每秒最多能蹦出9个音节。另一方面,许多德国人说起话来慢慢悠悠,1秒钟里5、6个音节。然而,根据最新研究,意大利人和德国人平均每分钟输出的语言信息量大致相同。实际上,无论不同语种的音节特性或人种的语速差异有多大,全部语种倾向于以大致相同的速率传输信息:每秒39比特,大约2倍于摩尔斯码的效率。
“这一发现具有可靠性,”在布鲁塞尔自由大学研究语音信息的进化语言学家Bart de Boer解释说,他本人没有参与这项工作,所以属于第三方评价。语言学家长期以来一直怀疑信息量较大的语言——如将关于时态、性别和说话者信息蕴含于较小的语言单位中的语种——其使用人群往往语速较慢,以降低信息密度。但一直以来,没有人能够用数据证明这一假说。
科学家们分析了由17种语言撰写的书面文本,其中包括英语、意大利语、日语和越南语。他们用信息学中的单位——比特,计算出每种语言的信息密度。他们发现日语有643个音节,平均每个音节的信息密度约为5比特;而英语,有6949个音节,单音节的密度为7比特。越南语是包含6个音调的复杂系统(同一音节在不同音调上具有不同含义),所以每个音节的信息密度为8比特,排在榜首。
接下来,研究人员花了3年的时间从17种语言中14种的使用群体中招募参与者,每种有5名男性和5名女性。(其他3种语言的情况在更早实验中留有录音。)每位参与者大声朗读15个相同的段落。研究人员计算出每种语言的平均语速,以音节/秒为单位。
毫不奇怪,有些语言显然比其他语言说起来更快。但是,当研究人员最后将语速乘以音节信息密度时,他们对结果的一致性感到震惊。他们在Science Advances上报告说,无论快或慢、简单或复杂,每种语言都倾向于平均每秒39.15比特的速度传递信息。相比之下,世界上第一台计算机的调制解调器(1959年)的传输速率为每秒110比特,而今天家庭互联网的平均传输速率为每秒100兆比特(或1亿比特)。
报告的共同作者、法国里昂大学法国国家科学研究中心赞助的Dynamique Du Langage实验室的演化语言学家François Pellegrino说:“有时候,有趣的事实或规则就隐藏在眼皮底下。”他说,由于语言科学长期关注语法复杂性等问题,因此信息传递率被忽略了。他补充说,“明确的”是,尽管语言的编码策略差异很大,但在输出信息时,没有哪种语言比另一种语言更有效。
但“为什么”完全是另外的问题。Pellegrino和同事们怀疑答案与我们脆弱身体的生物学限制有关——我们大脑在产生和接收信息时,受到的生理制约。神经科学的研究支持上述观点,最近一篇论文提出,美式英语中每秒9个音节已经达到了听觉处理系统的能力上限。
Boer同意瓶颈来自我们的大脑。但是他说,似乎制约不是来自听觉系统的处理速度,而是大脑分析信息内容的速度。这是因为,当把录音1.2倍速播放时,听者完全能够理解。“看起来最终瓶颈出现在语音-意义的合并-转化环节。”
本文译自 sciencemag,由 majer 编辑发布。