查看原文
其他

3 项新技术发布,5 大语音方案竞技,9 大咖共话语音 AI 的下一站 | WARE 2019

shenzhenware 深圳湾 2023-11-28

遗憾错过会议,还可以通过这篇文章补救一下~


- shenzhenware -


上周,深圳湾年度 WARE 2019 新硬件峰会第 II 季在深圳如期举行。


作为国内最早一批关注语音智能、智能音箱的媒体,深圳湾从单品、平台、生态,关注着行业里的一举一动,每一次的行业会议都聚焦当下的热门议题。


在 4 月的那场「WARE 2019」新硬件峰会上,我们聚焦「ON THE GO」的主题,探讨了随行 AI 场景的产品创新。


3 个月后,也就是这次峰会,我们将关注点放到了与智能语音相关的 AI 前沿技术和应用方案商,并赋予了「ALWARYS ON」的主题。ALWAYS ON 意在「无处不在和无时不在的语音助手」,探索这一愿景下,AI 技术有了哪些新的进展,行业面临了哪些新的挑战和机遇,又有哪些有潜力的新应用场景。


为了找到这些问题的答案,我们邀请了 9 位嘉宾,他们分别来自互联网企业、AI 和 IoT 技术平台商和方案商、元器件和芯片方案商、技术型创业公司,为我们做出一一的解答。



1三大趋势


2021 年每 4 个家庭消费电子设备中有一个集成语音助手


所谓春江水暖鸭先知,在普通消费者见到产品前,方案商、技术厂商就已经嗅到了商机和方向。


关于整体行业市场预测,LinkPlay 分享了一组数据:


2018 年,家庭消费电子(CE)设备市场总量达到了 20 亿台,其中 12% 集成了语音助手(VA),相当于 2.49 亿台设备具有语音交互的能力,这里不包括「work with」的设备。


在这些 VA 设备 ,远场设备占比 2%,大约为 4000 万~5000 万台。预计到 2021 年,每 4 个家庭 CE 设备中有一个集成 VA。


家电、车载、酒店等细分场景,催生新的技术热点;远场全双工、多模态交互,成为智能设备标配


在产品落地的场景方面,思必驰认为,智能音箱、手机之后,智能小家电、可穿戴设备等设备,将成为 AI 新一轮赋能目标。在万物皆可+AI 的趋势下,催生新的技术热点,包括全双工、分布式麦克风阵列、多设备联动的唤醒机制等,都将成为智能设备的标配


而在移动出行服务的领域,地平线认为,车载智能的竞争升级,能够提供极致交互体验将成为制胜关键,集成了手势、指纹、体征、眼球、语音等感知方案的多模态交互,是下一代人机交互的趋势。


在行业市场,酒店成为 AI 厂商新一轮的角逐。犀动智能科技指出,2018 年全球智能语音音箱市场(80M units)已经超过平板,互联网公司对于语音入口的争夺战,提升了用户认知以及产业链支持。而随着消费者对于智能语音、智能客控的接受程度在成长,酒店内的高频人流,将成为下一代 NLP 训练与落地的垂直细分场景。


通话降噪成为 TWS 新一轮产品竞争力的体现


随着 AirPods 引爆真无线蓝牙耳机(TWS)耳机市场,市场对体验更好的 TWS 产品的需求量加大,低功耗、体积小、体验好,成为新一轮产品竞争的重点。大象声科认为,通话降噪体验将成为 TWS 产品竞争力的体现。



2三大新发布


楼氏推出微型声学电控阀门,降噪交谈两不误


楼氏电子,70 多年来致力于研发应用于助听器和其他电子设备的微型声学元器件,在近年来一直在推动动铁、硅麦、智能麦克风等产品在消费硬件领域的应用。


降噪隔音和听取外界音,往往不可兼得。针对这点,楼氏基于自身在微机电技术研发领域的积累,推出全球首个用于耳机的微型声学电控阀门。


据楼氏电子席金苗介绍,采用楼氏微型声学电控阀门的耳机具备环境感知能力,能够自动控制阀门的打开与闭合,具有功耗小、没有延迟和失真等特点,方便用户在无需取下耳机的情况照常听取外界音和交谈。


席金苗透露,楼氏微型声学电控阀门正在进行量产前的最后准备,与海外合作伙伴打造集成阀门功能的 Demo 最早会在今年 Q3 亮相,预计明年年初量产。


△ 楼氏电子 席金苗(点击图片,查看完整演讲回顾)


大象声科亮相新技术,AI 通话降噪+骨传导,现场演示耳机通话降噪新境界


深度学习大规模应用在语音识别和语音合成当中,但是在语音前端信号处理当中,深度学习的应用只是刚刚开始。


2017 年成立的大象声科则是全球第一家大规模商用基于深度学习单通道语音增强方案的公司。在 2018 年年底,更是因为高通骁龙全球技术峰会上现场展示,获得了业内关注与认可。目前,国内多款智能手机都已采用大象声科 Vocplus Telecom 降噪方案,成功实现 AI 通话降噪功能,为成千上万的用户带来了更清晰的语音通话体验。


苹果 AirPods 引爆 TWS 耳机市场,蓝牙连接的稳定性问题得到解决之后,通话降噪更是重中之重。大象声科也将之纳入今年的工作重点之一。


对此,大象声科打造了 AI+bone sensor 通话降噪方案,将 AI 通话降噪和骨传导传感器高效融合,覆盖低信噪比全场景,不论是在地铁,商场,KTV, 还是风噪场景,都能大幅提升通话清晰度,并且仅需要一个麦克风,能够提高工程效率,节省硬件成本。


会上,苗健彰对该方案进行了首次公开演示。


△ 大象声科创始人兼 CEO 苗健彰(点击图片,查看完整演讲回顾)


犀动智能科技推出「犀动易聊」,现场演示非固定指令式的自然对话式体验


从 Google Assistant 退役创业的 Vic Shen,在本次大会正式亮相了他的创业项目犀动智能科技。聚焦在酒店语音服务垂直场景,犀动推出软硬件的一体化解决方案小犀管家,实现了 24x7 全天候的智能语音交互,并率先支持同时多语义识别,同时支持多轮对话以及双语并发。


Vic 表示,基于语音和影像的搜寻会占据 50% 搜寻的入口,基于此,犀动智能科技利用类影像处理的机器学习来处理语义理解,创造自然对话,多意图分析,为酒店客房提供「非固定指令式的自然对话式体验」


通过现场的演示,我们可以看到,犀动智能科技的对话系统「犀动易聊」,可以将多层选择过程简化为一个语音指令,通过卡片化的方式,呈现出房客多个需求并加以引导,再通过引入新的商业模式「全天候采购导引」来满足用户需求。


现阶段,单体酒店导入 AI 技术,进行智慧化转型的技术壁垒依旧很高,因此更需要可以帮助酒店进行成本流程管理优化的系统,并将线上内容和服务集成,产生新的服务收入。


△ 犀动智能科技创始人兼 CEO 沈书纬(点击图片,查看沈书纬专访)


3语音方案竞技


LinkPlay 推出 Voice Assistant 2.0 方案,更聪明,无处不在,并具有繁荣的内容和服务生态


作为智能语音的先行者,亚马逊 Alexa 认证合作伙伴,以及多家语音产品背后的技术力量,成立五年的 LinkPlay 已经积累了 200 多种硬件设备的语音智能化经验。


在会上,LinkPlay CEO 赵立峰讲述了近年语音设备的技术和产品化的演进,他认为,新一代语音助手(Voice Assistant 2.0)将更聪明,无处不在,并且具有繁荣的内容和服务生态。


赵立峰总结,不管是想做 Works With VA 还是 Built-in VA 产品的厂商,主要面临以下几个问题:一是产品定义;二是目前 VA 能力不足(在听清、听懂方面);三是割裂的 VA 生态系统,形成数据、产品运营壁垒;四是安全和隐私。


对此,围绕从硬件到提供「硬件+服务」的转化,LinkPlay 提供 Voice Built-in Solution (VBS) 的方案以及 LinkPlay 云服务,涵盖完整的软硬件系统、高可靠性/低延时的设备控制云、VBS API/SDK、控制 App(Android,iOS,未来加入 PC)、自动化测试和量产程序等完整的服务链条。旨在简化产品开发难度,提供新产品参考设计,协助客户快速上市,确保后续产品更新维护。


三年前,在 WARE 2017 第 I 季的峰会上,亚马逊 Alexa 首次在国内的第三方媒体平台做公开分享,随着 Alexa Voice Assistant 设备打响的,还有国内的「百箱大战」,包括 BAT 在内的国内平台厂商和 AI 厂商,也纷纷推出了自家的语音助手(VA)。而作为 VA 背后的厂商的 LinkPlay 经历了整个过程,感慨颇深。


当深圳湾问及 LinkPlay 对国内 VA 市场的看法时,赵立峰指出,国内百度、阿里、腾讯等平台大厂对 VA 的普及功不可没,但随着各家在自有品牌语音硬件设备的耕耘的重心转移,LinkPlay 也将合作方向转向致力于推动第三方设备语音智能化的平台合作伙伴


△ LinkPlay CEO 赵立峰


声智科技推出 SoundAI Azero,能够快速落地的一站式解决方案 


成立 3 年的声智科技是一家融合声学和人工智能技术的平台服务商。目前,声智科技已成为全球最大的智能音箱技术供应商之一,曾服务于 BAT、小米、华为、360,是一家「躲在巨头背后的服务提供商」,其技术实力已经被各大厂的「头牌」智能音箱所证明。


从智能音箱时代一路走来,声智科技销售总监周治国揭示了行业状况:中小企业面临着进场难的问题。与传统硬件相比,智能语音产品技术链条⻓、声学调试困难、内容聚合难、平台移植难、开发周期⻓。受限于团队的资金和技术能力,要把语音 AI 的用户体验成熟度做到产品级并实现量产,期间的挑战并不小。


为此,声智科技发布了全链条远场智能交互系统「SoundAI Azero」。该系统以远场语音交互和远场双工通话为技术内核,兼容主流芯片架构、硬件设计和声学结构,具有一站式 Turnkey 解决方案、全面的语音交互能力、高整合内容资源、协议兼容性强、两周实现快速开发等特点,可广泛应用于多种场景的硬件设备


AI+IoT+5G 背景下,行业需要能够快速落地的一站式解决方案。通过 Azero 系统,声智科技希望将语音引申到各行各业,用一套系统解决所有事情,降低中小客户在这方面的投入,还希望在各个细节做精、做细,帮助设备厂商又快又好地实现产品开发和量产。


△ 声智科技销售总监 周治国(点击图片,查看完整演讲回顾)


思必驰小家电和小型设备智能化解决方案,具有「去中心化」和「小而快」的优势


随着「万物皆可上云,万物皆可计算」的物联网时代来临,小到耳机,大到空调、洗衣机,几乎所有设备都有 + AI 的需求,对 AI 厂商来说,智能音箱之后,智能小家电是一个正在发展壮大的蓝海市场。


区别于智能音箱、手机,智能小家电具有主频低的特点,对语音交互功能的需求单一。针对智能白电、智能小家电和智能穿戴等设备,思必驰在今年推出了低功耗算法方案,帮助小设备快速赋能 AI。


结合产品应用场景,根据硬件结构评审和声学评估结果,思必驰低功耗算法方案提供相应的单项/组合项算法方案,主要可分为一级低功耗唤醒,二级唤醒验证,三级声纹验证。


目前,针对近场交互设备、手机、耳机、儿童故事机等终端,思必驰均已有成型、能够快速运用的低功耗解决方案。


面对 5G、物联网浪潮,思必驰始终夯实 AI 能力,将自己定位为一家市场需求驱动型技术公司,「技术厂商是规定不了客户需求的,我们所有的发展和方案输出都由客户决定。


△ 思必驰 CMO 龙梦竹(点击图片,查看完整演讲回顾)


地平线推出软硬件一体化全栈解决方案,将自动驾驶上的技术和经验,赋能到汽车座舱


提起地平线这家公司,大家对它的第一印象普遍聚焦在自动驾驶业务上。事实上,地平线也同时在积极开拓 AIoT 业务,将自动驾驶上尝试的技术和经验,落地到家居、消费电子、人机交互的等应用。


地平线多模交互产品总经理张宏志表示,多模态交互是下一代人机交互的趋势,核心在于「主动」。要做到这点,机器首先需要具备感知能力,精准识别人的需求,其次是针对场景、个性化提供服务的策略。 


以智能座舱场景为例,地平线将芯片、语音、图像技术融合在一起,提供软硬件一体化全栈解决方案,从情绪、视线、表情、手势等方面,对人机交互进行判断,交互对象从驾驶员向车内所有人转变,交互方式向主动交互转变,提供有针对性的交互逻辑。


张宏志认为,自动驾驶是人工智能时代的关键,自动驾驶的实现是一个攀登珠穆朗玛峰的过程,在真正实现的时候,也就是人工智能技术成熟、普及的时候。


△ 地平线多模交互产品总经理 张宏志(点击图片,查看地平线的会前采访报道)


犀动酒店服务数字化系统,小团队打造的酒店线上入口


近一两年来,巨头补贴,不仅使行业进入洗牌阶段,还一定程度上做好了市场铺垫。精明的创业者往往能从中挖掘新的机会。


2018 年 10 月成立的犀动智能科技(Aiello)就从酒店的垂直场景出发,为酒店行业提供「软件-硬件-系统」的一体化解决方案,以及 SaaS 平台。


犀动智能科技分享了一组关于酒店行业的数据:在国内和东南亚的一些酒店,语音控制已成为房屋更新方案的标配,大多成本控制在 200 元、500 元/间。据统计,国内大约有 1500 万个酒店/公寓房间(不包含 Airbnb 等民宿),在国内智能酒店、服务型公寓是一个蓝海市场。


相比家庭环境,酒店场景下的智能音箱,因客人流动性大,且高频次的特点,收集到的样本量往往更大。Aiello 的方案为酒店搭建数字化平台,帮助酒店提高服务效率,从线上切入满足线下住户需求,包括住中反馈、语音用户画像趋势分析、零售、旅游推荐等。


目前,产业互联网盛行,犀动智能科技认为,做 2B 业务要尊重传统行业,从传统行业的需求出发提供可行性方案,打造差异化,这也是中小型创业公司的机会。


4两大开源平台


Google TensorFlow Lite,助力实现低功耗、低成本的端上机器学习


在今年 Google I/O 大会上,Google Assistant 秀新肌肉:基于 Google 的神经网络和机器学习算法,Google Assistant 的 100GB 语音识别模型在运行中所占据的字节不到 0.5 GB,运行速度比前代的速度快了 10 倍,实现零延时、本地化。


Google TensorFlow 资深软件工程师王铁震认为,这显示了「The future of ML is tiny」的趋势,即深度学习的两大趋势:更小的学习、更强的芯片。


王铁震透露,目前 Google 正在探索如何将深度学习部署到 MCU 上,一旦得到广泛应用,也就意味着,智能硬件以后可以用更小的芯片实现本地化、更低的功耗,更低的低成本,真正让语音「无处不在」。这一成果也将被广泛应用在智能门锁、集联唤醒、能量采集等场景,有非常大的想象空间。


△ Google TensorFlow 资深软件工程师王铁震


Ubuntu Core,为安全、设备升级管理、软件服务收益保驾护航


Ubuntu 是开发者使用最广泛的 Linux 平台,可以将 IoT 设备连接到服务器和云。经过多年的发展,Ubuntu 已经从一个的操作平台演变成一套完整从云端到设备的生态链。在云端,为企业提供了 Ubuntu 服务器认证,自动化部署和 OpenStack 等解决方案。在设备端,提供专为 IoT 所设计的 Ubuntu Core。


Canonical 资深工程师和 IoT 架构师彭日廷表示,IoT 在与 AI 的融合过程面临着很多挑战,包括安全存在隐患、设备升级管理难、软件服务的收益难等。在这些方面,Ubuntu 从 Brand Store,Snapcraft,Snap 板块提供全方位的支持,方便企业管理和更新,确保设备的安全性。


△ Canonical 资深工程师和 IoT 架构师彭日廷


最后,编辑在文末还准备了本次大会的报道合集,以及往届 WARE 峰会的精彩内容,欢迎点阅。


微信号:shenzhenware

图文编辑:深圳湾编辑部


/ / / / / / / / / /  


// WARE 2019 · ALWAYS ON //



// WARE 2017-2019 历届精彩回放 //




快到「湾」里来

深圳湾正在招聘:

真知灼见的科技记者

四通八达的运营编辑

才华横溢的市场策划

技能爆表的活动运营

热情四射的社区达人


简历传送门:

Lynn@shenzhenware.com


●  


深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)



继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存