Mozilla同声计划首波发布4.2万人语音记录,邀请你加入

语音识别技术正在改变我们使用科技的方式,Google、微软、苹果等科技大厂都有推出自己的语音助理。不过,对于其他厂商来说,发展语音识别技术的前提,就是要有足够多的语音数据,这是最困难的地方。而开发Firefox的Mozilla为了解决这个问题,目前向所有用户发出邀请,希望大家都能来提供自己的语音数据,协助他们打造一个免费的语音引擎。

Mozilla表示,语音识别技术正在改变我们与机器进行交互的关系,不过目前可供使用的系统都相当昂贵并且是专有的技术。为此Mozilla推出 Common Voice计划(同声计划),旨在让语音识别技术变得更好也能免费使用。

而在今年三月份,他们已经发布第一批多语语音数据集,其中共涵盖18种语言的录音纪录,包括:英文、法文、德文和中文(繁体) 等广泛通行的语言,以及威尔斯语及卡拜尔语(Kabyle) 等较为冷门的语言。 Common Voice共收集到超过4.2万人贡献的录音,总长度约1,400小时,且语音数据量仍持续增长中。

这个计划主要是希望全球的用户都可以提供自己的语音,将自己的语音加入到公共数据库中。通过这个庞大的语音数据库,可以让任何人或开发者快速轻松地训练出能够识别任何语音的应用程序。

不过,光是有语音数据库还不够,还要有一个语音识别引擎。因此除了创建语音数据库外,Mozilla也还再构建一个名为Deep Speech的开源语音识别引擎,未来等到这个识别引擎成熟之后,也会开放给所有人免费使用。

通过这个计划,Mozilla希望让开发者可以打造效果媲美微软、Google等大公司效果一样好的语音识别应用程序,例如在即时翻译、语音助理等等方面,也可以通过与大公司旗鼓相当的语音数据数量,达到足以与大公司的产品一较长短的程度。

另外,Mozilla也表示,目前语音助理、语音应用,多数都是以英语系的用户为主。与英语相比,中文的语音助理成熟度要比英文系的来得低,主要就是数据数量不够多的关系。因此,他们表示需要更多中文用户,为这个计划提供中文语音。如果你觉得自己的口音不标准,讲话不清晰也都没关系。因为语音识别本来就需要不同的口音来加强判断。

此外,如果你不想录音的话,也有其他方式来帮忙这个计划。目前中文语音已经收集了许多的语音片段,不过,单纯靠机器识别的准确率并没有那么高,所以需要你帮助辅助判断。