Google开源低比特率音频编解码器

Google在2月的时候,发布最新的音频编解码技术研究,其新开发的Lyra是一款极低比特率的音频编解码器,可让低带宽网络用户也能享有良好的通信品质,而现在Google宣布以Apache授权许可开源Lyra,让更多开发者可以在自己的通信项目中使用Lyra,或是发展其他应用。

由于COVID-19疫情的关系,通信服务的重要性大幅提高,而Google新发展的音频编解码技术,能够应用在远程工作或是低带宽的环境,改善语音通话品质。Google表示,Lyra是一个革命性的音频编解码器,其使用机器学习技术来提供高品质的语音通话。

Lyra的架构分为编码器和解码器两部分,当用户对着电话讲话时,编码器会从语音中截取特殊的属性特征,并在压缩后经过网络传输,而解码器的功能则是将收到的属性特征,转换成人类可以听懂的声音,也就是另一端电话播放的音频波形。

Lyra解码器使用生成模型将特征解码回音频波形,Google解释,生成模型是一种特殊类型的机器学习模型,非常适合从有限的特征,重新创建出完整的音频波形。Lyra的架构与传统音频编解码器非常相似,传统音频编解码器已经有数十年历史,是支撑互联网通话的主要方法,而有别于传统的编解码器使用数字信号处理(DSP)技术,Lyra的优势则是使用生成模型来重建高品质语音信号。

Google提到,在过去数十年间,虽然移动网络技术与建设稳定增长,但是设备上运算能力的提升,远远超过高速无线网络基础设施的发展,而这种反差在发展中国家更是严重,接下来还有数十亿的用户需要连接网络,但是基础设施可能远无法应对这庞大的网络需求。另外,即便是移动网络连接高可靠度的地区,语音通信品质也还是受到行动资料传输的限制。

由于这些使用场景,Lyra有了发挥功能的空间,因为Lyra可以将原始音频压缩至3kbps比特率,而且音频品质仍比其他诸如Opus编解码器的效果还要好,因此在低带宽,或是带宽受到限制的情况,Lyra成为了良好的解决方案,Google强调,Lyra的目标不是要成为一个完整的替代方案,而是在特定场景中,有意义地节省带宽使用。

除了考量带宽因素外,Lyra还可支持一些独特的应用,像是能够用来存档大量的语音,或是利用Lyra轻省的运算,达到节省电池的目的,或者在多人同时拨打电话时,可以最大程度减轻网络拥塞的情况。

Google现在开源Lyra项目,使用C 开发以实现高性能和互通性,并且使用Bazel构建框架,和用于全单元测试的GoogleTest框架。这个发布的版本同时提供开发人员使用Lyra编码和解码音频所需要的工具,包括文件和封包层级的解码和编码API接口,以及各种滤波器和转换器等信号处理工具链,并针对在Linux上,开发64位元ARM Android平台应用程序优化。所有Lyra执行程序代码皆以Apache授权许可开源,唯有数学核心除外。