Tech
为什么 Facebook上50%的语音流量来自柬埔寨
2018 年,Facebook 团队遇到了一个难题。根据吹哨人 Frances Haugen 发布的文件,柬埔寨用户占 Messenger 语音功能全球总流量的近 50%,但该公司没有人知道原因。
根据世界其他地区看到的内部文件,一名员工建议进行一项调查,看是否与当地识字率有关?但柬埔寨的识字率约为 80%。
那是Facebook 的问题吗?令人惊讶的是,答案与 Facebook 无关,而更多地与高棉语言的复杂性有关。
在柬埔寨,从顺风车司机到首相洪森,每个人都喜欢发送语音而非文字。Facebook 的研究表明,不仅柬埔寨人喜欢语音信息,它在其他任何地方都更受欢迎。在这项研究中,包括来自多米尼加共和国、塞内加尔、贝宁、科特迪瓦和那位柬埔寨人的 30 名用户,87% 的受访者表示,他们爱用语音。在受访者中最受欢迎的平台 WhatsApp 以及 Messenger 和 Telegram 上也是如此。
最常见的原因之一是。打字太难了。
就柬埔寨而言,从来没有一种简单的方法可以输入高棉语。虽然高棉 Unicode 在 2006 年至 2008 年间很早就标准化了,但键盘本身却落后了。第一个高棉语计算机键盘的开发人员必须容纳该语言的 74 个字符,这是世界上所有语言系统中最多的。
这是一项艰巨的任务。哈维尔·索拉 (Javier Sola) 是西班牙出生、居住在金边的计算机科学家,他是 2005 年从事最初高棉操作系统项目的团队的一员。
“高棉语中的符号比拉丁语中的符号多得多,”现任柬埔寨非政府组织开放研究所执行董事的索拉说。在拉丁键盘上,用户可以一次看到所有字母表,从而使打字变得直观。但在高棉语中,每个键都承载两个不同的字符,这需要在两个键盘层之间反复翻转。不仅如此,有限的字体意味着如果收件人的计算机缺少与发件人相同的字体,某些消息将无法显示。
Facebook 于 2009 年左右在柬埔寨流行起来,就在廉价智能手机和互联网接入的同时,这意味着它的使用量激增。今天,它仍然是该国最受欢迎的综合平台。但是在一个小的智能手机屏幕上,同样的打字系统几乎变得不可能。
美国国际开发署 2016 年的一份报告显示,智能手机用户更喜欢语音电话和语音信息,因为他们发现打字困难且耗时,或者因为他们对如何在设备上使用高棉语文字感到困惑。一些受访者甚至没有意识到他们的设备根本不支持这种语言。西方用户认为理所当然的其他功能——如准确的拼写检查或光学字符识别——在高棉语中仍然只有基本功能,这使得文本变得令人沮丧。
“现在有更先进的键盘,”索拉说,但它们没有预装在手机上——不像谷歌、三星和微软的键盘。多年来,习惯已经逐渐被接受。他说,在柬埔寨,语音信息“正是人们所做的”。
但依赖语音工具也会产生一系列问题。想必每个在微信上接收过父母语言信息的人都深有体会。
“许多年轻人,如果他们[确实]想打字,就会用拉丁文写出高棉语单词,”金边的软件工程师兼 POSCAR Digital 的首席运营官 Sok Pongsametrey 说。其他时候,如果一个字母太难拼写,他们可能会使用更容易获得的字符或带有省略号的单词缩写来错误地拼写单词,因为他们知道读者会理解隐含之意。
Sok 表示,这些变通方法使从事机器学习的工程师更难用该语言训练 AI 解读文字信息。他还担心,这些捷径将意味着年轻人将不再熟悉高棉文字。
“我用高棉语写作时非常小心,因为这是一门艺术,”他说。 “但是,年轻人,他们认为[使用拉丁文本]很容易。”
Javier Sola 指出,有更新的键盘,如 Microsoft SwiftKey,可以更轻松地输入高棉语,但许多柬埔寨人甚至不知道它们的存在。默认键盘“并不能真正适应用户行为。他们只是使用我们已经使用了近 20 年的标准,”Sok 说。
柬埔寨只是一个小市场,许多科技公司对开发更好的产品不感兴趣。 “他们在这里不赚钱,所以他们不没有动力,”索拉说。
https://restofworld.org/2021/facebook-didnt-know-why-half-of-messengers-voice-traffic-comes-from-cambodia-heres-why/