2020(秋季)亚洲蓝牙耳机展完美落幕,此次展览上汇聚了近百家产业链优质供应商、服务商,以及上千家采购商。还到场了14位重量级演讲嘉宾,从蓝牙耳机的不同角度分享了在各自领域的成果以及蓝牙耳机的未来发展。
我爱音频网豆总在会场间隙,找到到场演讲的14位重量级嘉宾,对他们进行了采访,和他们聊聊TWS耳机行业目前发展情况和未来的发展方向。
大象声科(深圳)科技有限公司
产品总监 时晓宽
大象声科(深圳)科技有限公司,简称Elevoc,于2017年成立,云集了一批来自世界顶尖机器听觉科学家和经验丰富的产品研发团队,基于多年对计算听觉场景分析理论(CASA)的研究,应用前沿的深度学习技术(DL),为智能手机、耳机、PC、VoIP云通讯、智能车载、智能家居等行业,提供全球领先的智能语音增强和智能语音交互解决方案。
大象声科:全球首个将深度学习引入语音降噪的人工智能公司
大象声科是一家全球领先的机器听觉人工智能公司,研发团队基于多年对计算听觉场景分析理论的研究,应用前沿的深度学习技术,为手机、耳机、云通讯、IoT等行业,提供智能语音增强和智能语音交互解决方案。
早在2006年的时候,大象声科的首席科学家、也是联合创始人汪教授和团队已经开始测试二值掩膜的方法,进行语音降噪分离;2017年大象声科申请了基于深度学习的单通道实时降噪技术专利,2018年该技术首先在手机产品上商用落地,目前市面上小米、OPPO、vivo、黑鲨、联想、中兴、一加等多款手机搭载了大象声科的AI单麦/双麦通话降噪方案。
2019年,大象声科率先在OPPO Enco Q1上落地了全球首个AI蓝牙耳机通话降噪方案;后续大象声科又在漫步者DreamPods上落地基于AI算法的单麦骨传方案;不久前,华为刚发布的FreeLace Pro降噪耳机也有搭载大象声科的三麦通话降噪方案。
除此之外,大象声科在PC领域也有不错的进展,作为英特尔Ecosystem的一员,大象声科在PC上成功落地基于深度学习的语音降噪方案,成为首个成功运行在Intel GNA上的第三方语音公司,到下半年也会看到产品的陆续落地和上市。
大象声科最新AI单麦骨传、Vocplus AI三麦通话降噪方案均获应用
目前TWS耳机通话降噪算法面临的挑战主要有以下几点:通话环境复杂、多变;相比其他通话设备(手机),耳机离嘴更远;耳机内的麦克风数量有限;耳机芯片的运算和存储资源小。一些行业“主流玩家”,如苹果AirPods Pro和华为FreeBuds 3,都引入了传感器技术,利用骨振动传感器信号提供语音激活检测(VAD)信息,但最终通话降噪效果受限于Beamforming,并不能避免Beamforming的缺陷,此外,Beamforming对麦克风的排布、一致性要求较高,对硬件设计和产线都提出了挑战。
漫步者近期发布的DreamPods真无线耳机,采用大象声科AI单麦骨传通话降噪方案,通过数据驱动的方式,由深度学习自动发掘骨振动信号中的可利用信息(VAD以及频谱特征等),自动融合麦克风信号和骨振动信号,分离人声和噪声,以实现清晰通话。
针对TWS耳机通话降噪,大象声科目前已经推出了AI单麦版、AI双麦版、AI三麦版和AI骨传版四种方案。其中AI三麦通话降噪方案也已经在华为刚发布的FreeLace Pro耳机上有所应用。
大象声科Vocplus AI三麦通话降噪方案最大的亮点在于,它利用DNN(深度神经网络)强大的建模能力,高效融合入耳麦克风以及耳外麦克风的信号特点,实现清晰的人声提取,人声还原度更高,噪声抑制能力更强,无论是地铁、马路、甚至是大风噪这种业界公认的通话降噪难题,都能够达到很好的噪声抑制效果。此外,该方案可复用主动降噪的反馈麦克风,不用增加额外成本,适用于全入耳式耳机,成本低、效果好、易实现。
目前,大象声科与蓝牙耳机产业链上下游多家芯片、麦克风、传感器等合作伙伴保持密切联系,合作的芯片公司包括高通、恒玄、络达、ST意法半导体、Sonion、楼氏电子、歌尔声学、英飞凌等。
AI加速TWS耳机走向智能化,大象声科将引领信号处理行业变革
大象声科认为语音信号处理的未来是AI,这也是大象声科自成立以来的愿景,用前沿的AI技术不断拓展人和机器的听觉感知边界,来引领信号处理行业的变革。
接下来TWS耳机或者蓝牙耳机的发展就是“去智能化”,耳机已经是一个非常精密的设备了,后续会增加越来越多的应用,提升性能,最终达到我们所期待的互通、互融、互联。但是所有的前提,不论是通话降噪还是大家比较关注的主动降噪,这些都是基础设施。无论是友商还是同行,现阶段要解决的就是这个基础设施的问题,只有做好这个,TWS耳机后续才可以与AIoT设备做到很好的交互。大象声科愿意与大家一起努力,共同推动耳机行业的蓬勃发展。