Google开源低比特率音频编解码器

Google在2月的时候，发布最新的音频编解码技术研究，其新开发的Lyra是一款极低比特率的音频编解码器，可让低带宽网络用户也能享有良好的通信品质，而现在Google宣布以Apache授权许可开源Lyra，让更多开发者可以在自己的通信项目中使用Lyra，或是发展其他应用。

由于COVID-19疫情的关系，通信服务的重要性大幅提高，而Google新发展的音频编解码技术，能够应用在远程工作或是低带宽的环境，改善语音通话品质。Google表示，Lyra是一个革命性的音频编解码器，其使用机器学习技术来提供高品质的语音通话。

Lyra的架构分为编码器和解码器两部分，当用户对着电话讲话时，编码器会从语音中截取特殊的属性特征，并在压缩后经过网络传输，而解码器的功能则是将收到的属性特征，转换成人类可以听懂的声音，也就是另一端电话播放的音频波形。

Lyra解码器使用生成模型将特征解码回音频波形，Google解释，生成模型是一种特殊类型的机器学习模型，非常适合从有限的特征，重新创建出完整的音频波形。Lyra的架构与传统音频编解码器非常相似，传统音频编解码器已经有数十年历史，是支撑互联网通话的主要方法，而有别于传统的编解码器使用数字信号处理（DSP）技术，Lyra的优势则是使用生成模型来重建高品质语音信号。

Google提到，在过去数十年间，虽然移动网络技术与建设稳定增长，但是设备上运算能力的提升，远远超过高速无线网络基础设施的发展，而这种反差在发展中国家更是严重，接下来还有数十亿的用户需要连接网络，但是基础设施可能远无法应对这庞大的网络需求。另外，即便是移动网络连接高可靠度的地区，语音通信品质也还是受到行动资料传输的限制。

由于这些使用场景，Lyra有了发挥功能的空间，因为Lyra可以将原始音频压缩至3kbps比特率，而且音频品质仍比其他诸如Opus编解码器的效果还要好，因此在低带宽，或是带宽受到限制的情况，Lyra成为了良好的解决方案，Google强调，Lyra的目标不是要成为一个完整的替代方案，而是在特定场景中，有意义地节省带宽使用。

除了考量带宽因素外，Lyra还可支持一些独特的应用，像是能够用来存档大量的语音，或是利用Lyra轻省的运算，达到节省电池的目的，或者在多人同时拨打电话时，可以最大程度减轻网络拥塞的情况。

Google现在开源Lyra项目，使用C 开发以实现高性能和互通性，并且使用Bazel构建框架，和用于全单元测试的GoogleTest框架。这个发布的版本同时提供开发人员使用Lyra编码和解码音频所需要的工具，包括文件和封包层级的解码和编码API接口，以及各种滤波器和转换器等信号处理工具链，并针对在Linux上，开发64位元ARM Android平台应用程序优化。所有Lyra执行程序代码皆以Apache授权许可开源，唯有数学核心除外。