查看原文
其他

AI语音技术在TWS耳机中的应用 | 大象声科

我爱音频网 我爱音频网 2022-06-27


2020年3月28日下午14:00-18:00,我爱音频网举办了一场线上直播大会 ——【2020(春季)亚洲蓝牙耳机大会】线上研讨会,邀请了7位行业大咖与我们分享了行业的最新资讯还有大家的动向,吸引了很多粉丝的关注和参与。


高达1.7 w 的直播间热度!

直播热度排行榜的第5名!

火爆全场 千人在线!


一场突如其来的疫情,打乱了我们所有人的节奏,但我爱音频网前进的步伐依旧坚定,作为纵观整个行业的媒体人,我们致力于在这个特殊时期,帮助大家实时了解行业的资讯、动向以及推广宣传。


所以在2020年的上半年我们还是会和今天一样,每个月不断地举办线上活动,也欢迎各位有兴趣的小伙伴与我们聊聊呀~


 今天让我们一起来回顾第六位演讲嘉宾大象声科的时晓宽先生的演讲视频吧!



 大象声科 



由于特殊原因,我们不能将大象声科的ppt分享给各位小伙伴们,不过大象声科的小伙伴们也很nice,帮我们整理好了ppt介绍,供大家学习和参考呀~在此,我爱音频网代表行业小伙伴们对大象声科表示致谢!


PPT介绍

背景:

TWS耳机将是继智能手机之后最具市场规模和增长潜力的硬件产品。在解决基本无线的蓝牙传输问题,比如断线、延迟及低功耗等问题后,TWS耳机的产品竞争将进入新的阶段,主要将围绕降噪、音质、智能化三大方向发展。

 

降噪,既包括主动降噪,也包括通话降噪,它在TWS耳机中的重要性一下子提高到了非常重要的地位。这主要和TWS耳机的使用场景息息相关。大家通常在什么场景下使用TWS耳机呢?地铁,户外跑步,健身房健身,办公室等等。所有的这些场景都会遇到一个问题,那就是噪声干扰。比如户外跑步,那么风噪就是一个典型场景,同时也是一个特别棘手的问题。那么,如何在噪声环境下还能为用户提供一个高质量的通话,就成为了各大TWS耳机厂商面临的攻坚课题。

 

行业痛点:

市面上大多数蓝牙耳机对噪声的处理效果十分有限,尤其对汽车鸣笛声、警报声、地铁呼啸声等瞬间产生的噪音没有任何抑制效果,甚至会压掉人声。此外,如果遇到迎风通话的情况,外部的麦克风几乎饱和,对方就完全无法听清自己的语音。这些耳机通常利用传统通话降噪技术,基于对信号的理解,采用人工规则编制算法,降噪效果非常有限,只能抑制平稳噪声或是信噪比较高情况下的噪声。为了有更好的降噪效果,许多厂商会采用多麦的设计方案,比如小孔径双麦方案,多麦克风阵列方案,这两种方法都利用了波束形成的算法,自动在期望信号方向形成波束,而在干扰方向形成“零点”,达到增强信号、抑制干扰的目的。但是这种方法在干扰源比较多的情况下,目标人声拾取容易不准,噪声抑制效果会大受影响,同时,这种多麦克风设计对对麦克风等器件一致性要求更高,而且对声学结构的依赖性很强,调试周期也比较长。

 

大象声科的方案:

大象声科Vocplus AI语音降噪技术创造性地将深度学习融合计算听觉场景分析中,一方面利用深度学习训练模型,让模型从大量的数据中自动学习规则。另一方面加入传统信号处理的知识,提升深度学习的泛化能力,所以,我们能对没有训练过的噪声也能处理得更好。这也是大象声科的方案具有较高技术壁垒的一个重要因素。

 

针对不同的耳机产品定位,大象声科目前推出了三个通话降噪产品,包括AI单麦,AI双麦,AI单麦骨传高效融合版,并成功在多款TWS、颈挂式耳机、话务耳机等多种耳机形态上商用落地,支持的芯片平台包括BES 2300全系列,络达155X系列,和外挂低功耗DSP的形式。

 

Vocplus AI双麦通话降噪方案利用深度神经网络模拟人双耳听觉系统,智能动态追踪人声,可以实现更清晰的双麦人声拾取。它对各类稳态和非稳态降噪的抑制效果都很好,同时对周围人声干扰抑制更强,通话私密性更好,同时能够覆盖相地铁这样超低信噪比的场景。

 

目前市面上一些高端的TWS耳机为了更好的通话效果,采用了骨振动传感器,但仅仅是利用骨震动传感器信号作为人声激活检测的标志。大象声科的技术是将骨振动传感器信号与麦克风信号一同送入深度神经网络模块,深度神经网络模块经过预测,分离人声和背景噪声,得出清晰语音。目前,该方案支持多种骨振动传感器,比如VPU, G-sensor等。此外,大象声科联合ST micro 基于ST25BA为客户打造首款单麦+骨传解决方案的产品,近期将会上市。

 

除了通话降噪产品,大象声科Vocplus Smart Voice UI方案近期也在一款TWS耳机上落地。大象声科延续在降噪领域的积累,相比市面上其他的Voice UI方案,突出优势是鲁棒性强,抗噪性能好,唤醒率高,这些对于TWS耳机产品来说特别重要,因为TWS大部分使用场景都有噪声干扰,而降噪能够有效提升人机交互体验。


提问

Qustions

&

解答

Answers


Q:大象声科AI通话降噪方案对比其他家有什么优势?


A:通常有单麦克风降噪技术和多麦克风降噪技术。然而传统的降噪技术中存在一些缺陷。传统的单麦克风降噪技术预先假设噪声为平稳噪声,局限较大。而传统的多麦克风降噪技术需要两个及以上的麦克风,对于产品的结构设计要求更高,限制了产品的结构设计;而且,多麦克风降噪技术依靠方向信息进行降噪,无法抑制来自接近于目标人声方向的噪音。

 

大象声科AI通话降噪方案是全球首个大规模落地的基于深度学习人声提取方案,利用深度学习训练模型,让模型从大量的数据中自动学习规则,同时加入传统信号处理的知识,提升深度学习的泛化能力,能够实现各类噪声场景下的人声提取,对麦克风等声学结构设计要求低,可以大大缩短调试周期,减少硬件成本。

 

Q:AI单麦和AI双麦的方案有什么区别?


A:大象声科的AI单麦方案对声学设计和结构要求低,工程效率高,同时能够节省硬件成本。AI双麦方案是基于双通道DNN模型,在模型训练中加入了方向性的信息,对包括周围人声干扰在内的各类环境噪声抑制效果好,通话私密性更佳。


Q:用大象的算法会增加多少功耗?


A:目前通话降噪算法的功耗都在1mA以内

 

Q:如何提高人声还原度并保持平稳?


A:通过算法模型的优化。基于DNN的降噪算法有一个好处是,效果可以不断优化。

 

Q:是否有相关的数据说明具体的降噪效果?


A:可以来公司体验我们的样机,另外我们也有实验室的3Quest客观测试报告。

 

Q:工程上面是怎样的配合模式?


A:前期需要客户提供可打通通话功能的SDK,同时提供两台带烧录口的样机给到我们移植;之后再通过主观测试调试确定最终能的SDK


大象声科相关阅读:

CES2020:大象声科发布AI单麦骨传降噪方案

大象声科唤醒方案:深度抗噪、支持2麦及以上、唤醒率96%以上


直播的过程中很多小伙伴表示很喜欢时晓宽先生分享的内容,在这里我们也统一和大家介绍一下大象声科的基本信息呀~想要对大象声科有进一步了解的小伙伴可以仔细查阅呀~


一、公司介绍


大象声科(深圳)科技有限公司,简称Elevoc,于2017年在深圳成立,是全球领先的机器听觉人工智能公司之一,致力于提供尖端的智能语音增强和语音交互解决方案,打造更自然的人机交互体验。


大象声科云集了一批来自世界顶尖机器听觉科学家和经验丰富的产品研发团队,基于多年对计算听觉场景分析理论(CASA)的研究,应用前沿的深度学习技术(DL),为智能手机、耳机、PC、VoIP云通讯、智能车载、智能家居等行业,提供全球领先的智能语音增强和智能语音交互解决方案。


大象声科已经与Qualcomm,Intel,arm,CEVA,CirrusLogic,Infineon,Rockchip和BES等国内外知名芯片厂商建立了良好的合作关系,成功服务于小米、OPPO、vivo、一加、中兴、努比亚、黑鲨、魅族、海能达、美图、猎豹移动、51Talk等客户。未来,大象声科将与合作伙伴们一道,推动产品智能升级,让人工智能更贴近生活,服务人民,造福人类。

 

二、产品介绍


SDK软件:

Vocplus智能语音增强方案(Vocplus Telecom/Headphone/Gaming/RTC软件套件):基于计算听觉场景理论基础,应用深度学习技术,实现人声与背景噪声实时分离,提取清晰人声,让用户即使在强噪音环境下,也能畅享清晰的音视频通话。

 

VocplusSmart 智能语音交互方案:集成了大象声科自主研发的智能降噪、回声抑制、声纹识别、语音唤醒、声源定位、波束形成、混响消除等核心算法,兼容主流芯片架构、硬件设计和声学结构,令人机交互体验更佳,助力品牌厂商打造精准自然的智能语音交互产品。


硬件模组:

Elevoc智能拾音降噪通讯模组:是针对大象声科基于深度学习的语音分离降噪方案,设计的集体验评估和开发调试功能为一体的产品。该模组不受限于噪声类型,无需依赖任何平台系统,体积小功耗低,能够在强噪声环境下实现音频的实时AI降噪处理,广泛应用于对讲机、录音笔、翻译机、话务耳机等各类拾音设备。

Elevoc AI单麦抗噪语音交互模组:集合了大象声科领先的AI智能降噪,回声消除,语音唤醒等语音交互核心技术。该模组支持众多语音平台,可快速实现语音识别、对话交互、语音技能、语音控制等功能,不受限于噪声类型,能够轻松实现对用户指令的精准识别。软硬一体化的解决方案,助力品牌厂商快速实现顺畅自然的语音交互体验。

 

三、核心竞争力介绍

技术优势:大象声科核心技术优势在于结合深度学习技术与计算听觉场景分析进行语音信号处理,实现复杂噪声环境下的人声提取和语音识别。一方面解决通讯场景下人耳听得更加清晰的问题,在保证同等人声还原度的情况下,大象声科方案的降噪性能得到大幅提升,且不限于噪声类型;另一方面解决语音交互场景下中的语音识别问题,抗噪性能好,唤醒率高,能有效提升人机交互体验。

团队优势:大象声科核心团队来自IBM、百度、阿里等世界知名企业,科学家团队包括声学领域的世界顶级专家,在技术层面具备持续领先的创新能力。

产业链资源优势:大象声科已经与产业链上游的芯片厂家如Qualcomm,Intel,CEVA,CirrusLogic,Infineon,Rockchip 和 BES 等国内外知名芯片厂商建立紧密合作伙伴关系,并成功服务于小米、OPPO、vivo、一加、中兴、努比亚、黑鲨、魅族、海能达、美图、猎豹移动、51Talk等客户。


最后,感谢所有的小伙伴对我们直播活动的支持,下一期你们想看哪一个厂商或者品牌给我们带来分享,可以在留言区告诉我们呀~或者对我们的直播有什么样的建议,也可以留言告诉我们呀~


音频行业年度报告持续更新中,如果你想了解消费类音频行业最新动态,欢迎关注我爱音频网呀:D

以下热门话题可以点击蓝字了解,

也可以在我爱音频网微信后台回复如下关键词获取专题


「技术专题」

LE AudioTWS降噪骨传导HWA智能音箱报告耳机报告助听器


「拆解汇总」

300篇拆解TWS耳机拆解充电盒拆解智能音箱拆解脖挂耳机拆解


「优质资源」

TWS耳机芯片充电盒芯片(有线)充电盒芯片(无线)TWS耳机电池充电盒电池


「芯片原厂」

高通BES络达瑞昱原相杰理钰泰MTK

楼氏STAMSCirrus Logic全志LPS 微源

晶晨紫光展锐昇生微思远


「电池厂商」

超聚紫建赣锋锂业鹏辉诺威


「品牌专区」

苹果华为SONYOPPO漫步者小鸟万魔百度小米


「展会报道」

蓝牙耳机亚洲展CESComputeX环球资源香港电子展果粉嘉年华中科院声学所峰会Bluetooth Asia瑞昱发布会紫光展锐发布会


「土豆专访」

第1期第2期第3期第4期第5期第6期第7期第8期第9期第10期第11期第12期


「土豆探厂」

楼氏思必驰由我盛洋


内容持续更新中


商务合作联系:info@52audio.com


的在看是我们最大的动力,留下观点赢福利

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存