FB发现全球Messenger总语音流量50%竟来自柬埔寨?查了两年原因才曝光

根据Facebook吹哨者弗朗西丝·霍根公布的内部文件,外媒意外的发现一件有趣的事:在2018年,Facebook的团队遇到了一个难题,他们发现柬埔寨用户占Messenger语音功能全球总流量的近50%,但这家公司却没有人知道原因。

根据Rest of World报道的内部文件,一名员工为此想要进行一项调查,怀疑这是否与识字率低有关?而后,在2020年,Facebook进行了另一项研究,调查的对象为音频使用量大的国家的用户。

令人惊讶的是,答案跟Facebook的关系不大,而是跟高棉语的复杂性有关,以及用户如何将科技应用在Facebook从来没想到的方向。

在柬埔寨,从嘟嘟车司机到首相洪森,每个人都喜欢发送语音频息(在此指录音后发送的语音频息,而非即时语音)而不是文本消息。Facebook的研究显示,虽然也有其他地方也会使用发送语音频息,但柬埔寨用的人最多。

在这项研究中,包括来自多米尼加、塞内加尔、贝宁、科特迪瓦的30名用户以及柬埔寨人。其中,87%的受访者表示,他们习惯于使用语音工具,来发送跟他们应用程序上设置的语言不同的语音频息。不光是在Messenger、还有Telegram以及WhatsApp–调查对象中最受欢迎的平台。

为什么呢?主要的原因之一是,打字输入对他们的情况来说太难了。

以柬埔寨的情况来说,并没有一个简单的方法可以输入高棉语。虽然高棉语Unicode很早就被标准化了,但在2006年至2008年间,键盘本身却有技术上的困难。第一个高棉语计算机键盘的开发者必须适应该语言的74个字符,这是世界上所有文本中最多的。

这显然是一项艰巨的任务。Javier Sola是一位出生在西班牙、居住在金边的计算机科学家,他是2005年最初高棉操作系统计划的团队成员。

现任柬埔寨非政府组织Open Institue执行主任Sola表示:“高棉语的符号比拉丁文多得多。”在拉丁文键盘上,用户可以一次看到所有的字母,这使打字变得直观。但在高棉语中,每个键都有两个不同的字符,这需要在两个键盘层之间反复反转。

不仅如此,如果收件人的计算机没有跟发件人相同的字体,一些输入的文本就无法出现。不过,他们还是在计算机上客服了这些难题。

但是,在2009年左右,Facebook在柬埔寨开始流行,与此同时,智能手机和移动网络也开始出现,这意味着信息量爆炸性增长。今天,Facebook仍是该国最受欢迎的社群平台。但是,在一个小的智慧手机屏幕上,与计算机同样的打字系统在手机上输入变得几乎不可能。

2016年美国国际开发局的一份报告显示,柬埔寨智能手机用户更喜欢使用电话语音和语音频息,因为他们发现打字很困难、很耗时间或因为他们对如何使用设备上的高棉文本感到困惑。甚至有一些受访者,根本没有意识到他们的手机支持高棉语。

对于西方用户来说,理所当然的其他功能–如准确的拼写检查或光学文本识别–在高棉语中仍只具备基本的功能,这让用户对文本使用感到沮丧。

Sola表示:“现在我们有了稍微先进的键盘,但它们没有预装在手机上–跟Google、三星和微软的键盘不同。”多年来,人们已经对这种现象习惯了。他表示,在柬埔寨,使用语音频息只是人们的选择。

这种情况不仅仅在Messenger上,在柬埔寨其他流行的平台上,诸如Telegram、WhatsApp和LINE,用户也都喜欢用语音频息。虽然在这些平台上没有如Facebook一般有统计语音流量的资料,但受访的柬埔寨人表示,他们认识的绝大多数人都依靠语音工具来获得便利和表达能力。总体来说,他们对在公共场合说话并不感到害羞,在街上录制语音频息也很自在。

另一位受访的自由职业者Leng Len表示,这很难再回去了。 “它可以进行最有机的表达,并且比打字更快。”

但对语音工具的依赖也产生了它自己的一系列特殊问题:对话变得短暂了。这些用户还抱怨,他们无法快速查到他们交流的细节,只能通过记住他们留下的语音频息是哪一段,来重放这些消息。在聊天记录中的内容不可能使用搜索功能来寻找。

然而,与此同时,这些不便似乎并没有超过其弊端。现在柬埔寨的书面消息,往往以商业交流或英语交流为主。

虽然Facebook的员工想象语音频息的重度使用与文化水准的低落有关,但根据世界银行的最新资料,柬埔寨的识字率约为80%。

“许多年轻人,如果他们想打字,就会用拉丁文写出高棉语单词,”金边的软件工程师兼POSCAR数字公司CEO Sok Pongsametrey指出。POSCAR是一家为教育创建数字工具的公司。其他时候,如果一个字母太难拼写,他们可能会采用更容易获得的字符来错误地拼写这个词或用省略号来缩写一个词–因为他们知道读者会理解这个隐含的词。

这引发了更多的连锁反应。Sok表示,这些变通的方法,使从事机器学习的工程师更难用这种语言来训练人工智能。另外他还担心,这些取巧的方式,将意味着年轻人将失去对高棉文本的熟悉。

“当我用高棉语写作时,我非常小心,因为这是一门艺术,但是年轻人,他们认为(使用拉丁文本)非常容易,”Sok说道。

语音频息在柬埔寨的主流化,引发了关于内容控制和错误消息传播的问题。语音是出了名的难以扫描、缺乏上下文线索,且跟视频相比,更难分辨它是否被篡改过。

目前,已经在一些引人注目的案件中,出现了语音频息的证据。例如逃离柬埔寨的佛教活动家Luon Sovath,他称柬埔寨当局捏造了判他有罪的录音。

当被问及在柬埔寨如何防止错误内容的传播,Facebook(现在称为Meta)的一位代表只提到了一般的措施。 “用户可以报告Messenger上的任何内容,包括语音频息,我们会有以高棉语为母语的团队将对任何违反我们政策的内容进行审查和强制执行。”

Javier Sola指出,有一些较新的键盘,如微软的SwiftKey,让高棉语输入变得更容易一些,但许多柬埔寨人甚至不知道它们的存在。

柬埔寨只是一个市场,许多科技公司对开发更好的产品不感兴趣。 “他们在这里赚不到钱,所以他们并不投资研发,”Sola说道。

为此,柬埔寨的用户将继续适应着这种模式。当被问及她是否认为语音频息会被更好的技术所取代时,Len表示怀疑–“我不这么认为。它有助于促进更有效的对话。”