查看原文
其他

亚马逊Alexa生态解决方案供应商Sugr突围语音交互蓝海赛道

黄志敏 36氪广东 2021-10-16

专注于远场语音降噪技术(Far-field NoiseCancellation)研发,Sugr为B端客户提供从算法、云技术再到芯片模组的整体解决方案,加强产品开发效率,提高语音交互在相关产品上的体验。

文丨黄志敏

编辑 |  江倩君 马赛氪


物联网正在广泛地应用于大众的日常生活中,随着5G的普及,更多场景的潜力正在得到释放。智能设备将迎来新一轮增长高潮,基于智能音箱和语音助理,从安防、开关、灯光设备等智慧家居场景,到车载HUB、商场虚拟导购等垂直领域应用,语音交互几乎成了大多数智能硬件的“标配入口”。作为重要的信息源前端,语音交互技术直接影响了相关产品的体验和实用性。深圳米唐科技有限公司(下称“Sugr”)专注于远场语音降噪技术(Far-field Noise Cancellation)研发,为B端客户提供从算法、云技术再到芯片模组的整体解决方案,提高产品开发效率,改善语音交互在相关产品上的体验。


语音交互技术,特指通过语音实现人与设备互动的手段,通常按照距离分为远场和近场。远场语音一般将作用距离设置在1米-10米间,相比于近场语音——手机上的语音助手及文字转换功能等,更容易实现清晰的声音收集和识别。远场语音技术需要解决更多来自不同场景所产生的复杂干扰,例如背景噪音、回声、混响等。随着用户对硬件设备接收语音指令的更远距离和更大空间范围的体验需要,使得中远场降噪、麦克风阵列等远场技术的应用从小众需求变成了大众需求,从音频企业的需求变成了所有企业(照明,电工,汽车,家电等)的需求。Sugr通过自研远场语音降噪技术,为客户提供了全方位的语音降噪解决方案。

 

Sugr自主研发了业界独有的创新三维球形麦克风阵列、三维球形谐波计算、三维球形波束成形和三维声场建模技术这是一种基于三维阵列波束形成器及高阶三维环绕声场编码分析取得全局最优解的降噪方案。该优化设计方法将业内现有的各种相关设计方法纳入一个统一的框架,具有更大的灵活性,且可以克服其他方法视角有限、定位精度不足、系统鲁棒性薄弱、不易量产,无法判定讲话人的缺点


三维阵列处理算法流程图(图源:Sugr)

 

Sugr的技术手段在达到业界最高去噪能力的效果,只需要消耗原有算力的1/5,大大地提升了算法的效率和精度,同时Sugr将传统的信号学,统计学方法和最新的机器学习方法结合,提出了自适应回声消除算法、盲检测波束成形算法、场景声学检测、语音通话和识别双引擎分离技术等核心算法。通过多年迭代的工程优化,Sugr将上述算法以低成本、低能耗的方式实现,唤醒率、识别率、响应延迟、功耗、信噪比等指标都达到全球领先水平,回声消除能力超过60dB,噪音消除能力超过40dB


米唐科技CEO宋少鹏表示,Sugr的远场语音降噪引擎在过去几年中已成功配置在数百万台产品,服务于全球数十万个家庭。远场降噪存在两个维度的技术难点,从微观层面看,远场降噪和麦克风阵列技术的成本高,功耗大,芯片复杂且技术不通用,比如应用于视频会议产品的线形麦克风阵列无法用在车载产品;而从宏观层面来看,模拟与数字结合点带来的声学难题,使得设计、研发、制造语音类产品的效率低,人才和团队缺乏,普及到其他行业难,从而上量慢。宋少鹏介绍,“Sugr通过核心算法和工程优化的结合,为客户提供一套完整的解决方案,使得客户选用我们的算法和芯片模组后获得更高的开发效率。这就像是一个学问高深的数学教授,仍然可以深入浅出的给小学生讲数学知识,效率极高,反响极好”。

 

Sugr目前是亚马逊全球合作伙伴,也是亚马逊认证推荐的Alexa生态方案集成商,已为包括华为(AI Cube)、Acuity Brands等诸多知名企业提供服务。


通过声场建模云端自动调校,同时在端侧算法,提出了盲信号波束成形和自适应回声消除算法的方法,Sugr帮助企业实现快速开发和量产。以华为为例,Sugr为其节省了大量实验室和人力成本投入,同时帮助其产品开发周期由12个月缩短到了3个月,声学调教周期由960小时缩短到了12个小时,大大提高了客户研发效率。

 

在此蓝海赛道中,目前国内拥有远场降噪技术的企业还包括声加科技、声智科技、友杰智新、启英泰伦等,其中友杰智新主要开发AI语音操作系统,而启英泰伦则专注于语音AI芯片及相关算法研究。从核心技术角度看,Sugr的远场降噪技术能做到40dB量级,为全球领先。


同时团队长期行业深耕经验也帮助Sugr在为客户实现工程解决方案落地方面更具备优势。米唐科技CEO宋少鹏早期就职于以色列芯片公司Zoran,此公司曾推出全球第一个全套杜比单芯片解决方案,而后在微软亚洲硬件中心工作,从事硬件产品的研发制造,经手产品包括智能摄像头、Kinect体感设备等。团队其余核心成员包括语言学家、算法领域资深专家,在学术和工程落地方面具有较为深厚的背景,平均行业经验在12-15年。Sugr拥有专利十余项,相关学术研究曾获得了三个国际科研项目的资助,已成功发表4篇论文于国际权威期刊(IEEE Transactions长文),并在美国获得一项最佳国际会议论文奖。

 

成立于2014年的Sugr,早期主要以自研智能音箱产品Sugr Cube 为主,而后开始专注于语音远场降噪技术及相关整体解决方案的研发。

 

(图源:Sugr)


曾经获得真格基金和深圳央金的天使投资,Sugr未来将继续以降噪算法为核心,深耕AIoT领域 ,实现“让万物听说”的使命。




从养成游戏到AI带货,天猫精灵开启新场景| 噢氪了

百亿级的净水器市场后,「一目科技」挖掘技术商业化的更多可能 | 大湾区前沿
紧跟“新基建”风口,楚山电子如何实现充电“无尾化”?| 湾区智造

广式糖水与咖啡碰撞,是什么让主编惊呼「不报销」?| 36氪求其测

香港「Qualife」如何用智慧药盒实现远程医疗?| 生命科技

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存