查看原文
其他

只需 3kbps 就能清晰通话,Google 又一音频神器开源!

IT服务圈儿 2022-09-11

子豪 发自 凹非寺

本文经AI新媒体量子位(公众号 ID: QbitAI)授权转载,转载请联系出处


3kbps 也能清晰通话的神器 Lyra,开源了!

Lyra 是谷歌公司推出的一款不惧低带宽的音频编解码器,用来实现随时随地高质量通话。

3kbps 是什么概念?

换算成生活中常见的单位,等于 0.375KB/s

对比来看更加直观,Skype 官网给出的通话最低速度是 30kbps,带宽要求整整高出了 10 倍

Lyra 利用机器学习模型,将原始音频压缩到 3kbps,即使没有高速网络,也能得到自然清晰的语音。

它的架构与传统的编解码器类似,分为编码器和解码器两部分:

编码器以 40 毫秒为单位,从语音中提取特征,进行压缩后通过网络传输。

解码器利用机器学习模型,能使用最少的数据量重建语音,将特征转换成完整的音频波形,以进行播放。

带宽要求低、效果更好

在 Lyra 之前,音频编解码器的比特率越低,语音的清晰度就越差,并且机械感越重。

传统的音频编解码器使用的是数字信号处理技术,而 Lyra 则依赖其强大的信号重建能力

由于 Lyra 无需逐个处理信号,因此无需高带宽,而且在保持低比特率的同时,还能提供高质量的音频输出。

谷歌还使用 Lyra 与 Opus、Speex,在 6kbps 和 3kbps 的情况下,对同一音频的压缩质量进行对比测试

结果显示:

在 3kbps 的情况下,Lyra 性能 优于现有的其他编解码器;

在 8kbps 的情况下,其性能 优于 Opus,同时降低了超过 60% 的带宽;

甚至,Lyra 在 3kbps 情况下的语音清晰度,也 优于 6kbps 情况下的 Opus。

谷歌公司认为 Lyra 可能有广泛的应用前景,比如:降低音频文件大小,以存储大量语音;节省手机电量;以及缓解网络拥堵等。

已在 GitHub 开源

现在,Lyra 已经在 GitHub 上开源。

Lyra 使用 Bazel 构建框架,并且使用 C++ 编写代码,以保证速度、效率和可操作性。

这一版本支持用户在 Linux 上开发和调试,还针对 64 位 ARM Android 平台进行了性能优化,使它不仅能在云服务器上运行,而且还可以在手机上实时运行和训练。

此外,Lyra 还为开发人员提供了编码和解码所需的工具。

谷歌工程师 Andrew Storus 和 Michael Chinen 表示:

“很高兴看到开源社区的创造力能体现在 Lyra 上,以开发更多独特和有影响力的应用。”

感兴趣的读者可戳下方链接了解详情。

参考链接:
[1]https://github.com/google/lyra
[2]https://venturebeat.com/2021/04/06/google-launches-lyra-codec-in-beta-to-reduce-voice-call-bandwidth-usage/
[3]https://ai.googleblog.com/2021/02/lyra-new-very-low-bitrate-codec-for.html
[4]https://opensource.googleblog.com/2021/04/lyra-enabling-voice-calls-for-next-billion-users.html

1、Chrome 的小恐龙游戏,被我破解了...

2、一个诡异的MySQL查询超时问题,居然隐藏着存在了两年的BUG

3、直接用IP访问知乎,我发现了一个秘密···

4、黑客要攻下一台计算机,一般怎么做?

识别关注我们

了解更多精彩内容

点分享

点点赞

点在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存