查看原文
其他

从蓝牙语音到大屏交互,剖析百度在对话式 AI 上的创新 | WARE 2019

shenzhenware 深圳湾 2023-11-28

蓝牙设备可以像 WiFi 设备一样具备语音交互的能力,这是非常有意义的事情。


- shenzhenware -


2017 年,伴随人工智能音箱行业的火热,基于 AI 的语音交互也正逐渐改变人机交互的方式。同时,集语音技术以及内容、服务生态的语音平台应运而生,这些语音平台大多背靠互联网巨头、AI 公司,试图发展成为「AI 时代的安卓」。


对于这些的公司而言,除了 AI 技术和内容闭环服务打通,他们更注重将技术、应用落地到产品,带给用户价值,这样才能反过来促进技术的进步,繁荣生态。


作为国内最繁荣的语音 AI 生态,百度 DuerOS 在产品落地方面有不少领先的成果。在最近由深圳湾主办的「ON THE GO:随行 AI 场景的产品创新」峰会上,来自百度智能生活事业群组的刘悦发表了主题为《百度在对话式人工智能上的创新探索》。


以下为演讲实录,内容经深圳湾整理和编辑。



人机交互发展:从人理解机器到机器理解人


每一次人机交互的迭代都在推动着时代和产品的发展。


我们简单回顾一下人机交互发展经历的三个阶段:第一阶段的 PC 时代,以鼠标和键盘的交互方式促进了 PC 设备发展,相关软件也应运而生。第二阶段的触屏时代,从过去的鼠标、键盘到触控手机,使得硬件的使用成本极大的降低。第三阶段,也就是目前,语音对话的人机交互方式的发展,使得我们理解机器成本进一步降低。


从人理解机器到机器理解人的交互方式的改变,催生了智能音箱、智能大屏设备、智能可穿戴设备、智能车载等设备的发展。



基于语音对话的人工智能产业已经全面爆发


从国外的市场来看,亚马逊 、Google、苹果、微软以及许多创业型的公司加入到这场智能化的变革当中,他们的竞争已经进入白热化阶段,并推动整个市场和产业的发展。


回过头来看,国内的市场情况也跟国外非常像。我们预测,2020 年,对话式人工智能在各个场景上的渗透将大幅度增加:智能家居(上升 27%)、智能车载(上升 51%)、智能可穿戴(上升 68%)。



中国市场的潜力非常巨大,我们发现,目前有非常多的音箱、大屏设备、穿戴设备、耳机等设备都在变成一个可人机自然对话的智能设备,基于语音对话的人工智能产业已经全面爆发。



小度自诞生以来取得的成绩


百度在 2015 年的时候发布了第一款小度产品,从那时候我们开始尝试和探索如何做一款这样的产品。至今,小度助手已经成为中国市场最繁荣的语音 AI 生态。


在 2016、2017 年,我们更多的持「生态赋能」的思路,不断跟业界的其他硬件公司合作,包括音箱企业、电视企业(TCL、创维等)、汽车企业、手表企业、耳机企业、手机企业等。我们把 AI 能力赋予不同场景下不同的硬件,让这些硬件成为可语音交互的设备。


2018 年,我们统计了搭载小度助手设备的激活数:从年初的 5000 万涨到 2018 年年底的 2 亿,至今这个数字还在不断提升。当然,激活数据并不能代表这个生态已经达到繁荣,只能从一个侧面反映了搭载的能力。而这样的能力是否真正被用户使用,以及用户是否接受我们给他的新交互方式?



实际上,我们也会非常兴奋地看到,从语音交互次数来看,用户的接受程度也在不断提升。从 2018 年 3 月到 2018 年年底,我们通过月语音交互次数的指标来反映用户交互频率,从最开始的 2 亿次到达去年年底的 16 亿次,这个数字至今还在持续上升,并且速度非常迅速。



从这两方面看来,小度已经变成了中国最繁荣的对话式人工智能平台。


这里面有另外两个指标,我也想分享给大家,一个是语音技能数量,目前小度已经有上千个各式各样的语音技能,我们自己只能做一些头部的技能,更多长尾的技能需要开发者不断提供,这些技能绝大部分都来自于我们社区当中对这方面感兴趣的开发者,使得生态变得更加健康和更加活跃。



另外,根据 Strategy Analytics 的统计,2018 年第四季度,小度系列智能设备的出货量提升到中国第二,增长率达到了全球第一,增势非常迅猛。从现在来看,小度逐渐进入千家万户,成为用户贴心可靠的助手,这也是百度在做对话式人工智能方面的理念和终极目标。



小度的产品发展经历


回顾一下小度的发展历程。在 2015 年的百度世界大会上,度秘发布;2017 年推出的 DuerOS 人工智能的对话系统,到后来发展到了 DuerOS 2.0、3.0,期间还发布了带屏的小度在家。2019 年 2 月,百度发布了小度电视伴侣以及小度在家 1S 这两个产品。


我们经历了从开始发布产品,到后面不断给第三方赋能,一直到后面自研硬件,一路走下来的过程。




百度对话式人工智能的创新一:蓝牙语音解决方案


接下来讲一讲百度在对话式人工智能所做的创新。除了大家熟悉的无屏音箱、带屏智能音箱,我们还在其他方向做了探索,今天借这个机会给大家来简单分享。


第一个是蓝牙设备。面对各种各样的蓝牙设备(蓝牙耳机和手环等),我们萌生出了给这些蓝牙设备赋能的想法——使得蓝牙设备可以像 WiFi 设备一样具备语音交互的能力,这是非常有意义的事情。


我们首先来看一下蓝牙设备的趋势:根据 SIG 的调查,截止到 2022 年,整个蓝牙设备全球铺货量达到 8.8 亿台。这意味着有很多蓝牙设备等待着我们去升级,对话式 AI 技术将对传统的蓝牙市场带来新的机遇。



从场景上来看,蓝牙设备也存在许多痛点。我们主要总结了三个场景,一个是家中,一个是路上,一个是在车内。在家中,智能音箱既支持 WiFi 又支持蓝牙,可进行语音交互。在路上有穿戴设备和智能耳机,苹果前不久发布第二代 AirPods 支持了 Siri 语音唤醒。第三个场景是车内,人在开车的时候双手被限制在方向盘上,这时候语音交互就会变成非常自然的交互方式。



基于这三个场景,我们怎么帮助用户提升他的体验,怎么帮助设备商更好地提升产品呢?这就是我们之前半年到一年时间探索当中希望解决的问题。



小度蓝牙解决方案


在 2018 年 7 月的百度开发者大会上,百度在国内率先提出了蓝牙设备的语音解决方案——DMA 蓝牙解决方案。在 11 月的百度世界大会上,我们发布了第一款基于 DMA 蓝牙协议的车载支架,这也是我们在车载场景上基于蓝牙解决方案做的实践产品。这个产品并不希望搅乱市场,我们更多是想告诉其他相关的厂商,这样的一个方案是 work 的、是被用户买账的。


△ 点击图片查看深度解读:一文解构小度车载支架,我们发现了语音交互为蓝牙设备带来的巨大红利


同时,因为精力有限,我们也不希望完全自己来做所有语音蓝牙设备,而是希望把蓝牙合作方案输出给更多合作伙伴,让大家打造出具备智能对话能力的蓝牙设备。


而做这件事情的时候,会给厂商带来一系列的问题,比如:


  • 用户是否有需求?对这样的产品感兴趣吗?

  • 是否会增加很大的生产成本?

  • AI 技术接入门槛高吗?是否需要投入很多人力和周期?

  • 有成型的方案帮助我们落地吗?

  • 语音能力、NLP 打包在方案中吗?

  • 可以给用户提供哪些内容资源?是否收费?



实际中,我们对这些问题也进行了研究和探讨:


小度的装机量、活跃度,以及小度车载支架的热卖,从市场角度印证了,用户对这个产品有非常大的刚需。


产品的功能方面,我们在小度蓝牙方案上基于不同的场景做深度的打磨,比如车载支架相应的车载场景,刚需的内容就包括娱乐、导航、接打电话,针对这些场景深度打磨的产品都会在小度 APP 上得以体现。


针对技术门槛,我们也做了很多优化,提供 SDK 的开发套件,把研发的门槛降到非常低。



DMA 整套方案是免费的一体化解决方案,包括语音技术、背后的内容资源和开放生态,以及第三方技能。



关于小度蓝牙的解决方案


接下来是具体的方案介绍,小度蓝牙的解决方案主要包含两部分,一个是小度 APP,第二个是 DMA 协议。DMA 协议的主要作用是帮助蓝牙硬件和手机上的 APP 之间进行对话式交互通讯。



通过我们提供的 DMA SDK,可以快速把 AI 移植到蓝牙设备,让数以千万的蓝牙设备瞬间变成可以对话的人工智能设备。


当这些蓝牙设备有了语音交互的能力,就能够让用户通过语音交互获取小度云端的内容,包括听音乐、有声节目、导航、控制家居等等。



小度的 DMA 语音解决方案有效解决了经典蓝牙协议的以下痛点:触碰和按键触发、语音输入延时明显、APP 之间的串扰和抢占等。


DMA 解决方案的语音交互不需要触发按钮,并针对远场的语音交互做了非常多的优化,在车内复杂的环境下,唤醒率达到了 97% 以上;DMA 解决方案的 BLE/RFCOMM 通道和 A2DP 可以同时使用,延时从 500ms-2000ms 下降到 200ms-300ms,不影响占用录音通道的 App。




百度对话式人工智能的创新二:大屏交互


今天还会跟大家分享我们另外一个在做的创新探索,即大屏体验。


「让用户放下遥控器」是我们做大屏探索时给自己设定的一个目标。针对找不到遥控器、找片很费劲、音质不理想的几大痛点,我们做了小度电视伴侣这样一个设备,它有很好的 Hi-Fi 音质,全语音远场交互,和全天候人工智能助手,这个产品最终的销量也远高于我们的预期。



在小度电视伴侣,我们专门设计的小度智能电视 UI 可以告诉用户,放下遥控器、试着通过语音来跟这个设备进行交互;



我们还创造了「大屏信息流」的概念,把好的内容通过信息流呈现,并通过语音交互做定制化的推送;



同时,这一设备的整套系统全面接入了小度语音助手,使得语音无处不在,它开机时就是智能电视,关上之后就变成智能音箱,语音交互一直在线……


针对电视上 APP 应用安装麻烦的痛点,小度电视伴侣搭载了 DuerOS 的语音技能,不需要安装,只需一句话就可以调用。



我们希望在后续中不断探索人机交互,以及人工智能如何赋能不同场景的智能硬件,希望对话式硬件被更多人使用。


微信号:shenzhenware

整理、编辑:大林 / 深圳湾

审校:森林木 / 深圳湾


/////////////



深圳湾 WARE 2019 第 II 季峰会开启盲定,点击「阅读原文」锁定门票!

文末留言,参与热评,有机会获得峰会门票!


DuerOS 大事记


// 最新动态 //

Q4 全球智能音箱报告:百度居全球第四

Q4 国内智能音箱报告:小度在家系百度出货主力

Q3 国内智能音箱报告,百度 C 位出道 

Q3 全球智能音箱排名,百度首次挤进前四

百度 DuerOS 全球手机语音助手第二

摩托罗拉首款智能音箱或搭载百度 DuerOS


// DuerOS 大事解读 //

小度 DuerOS 2018 年年度回顾

百度世界大会 2018 小度硬件解读

持续补贴智能硬件的背后

第二届 AI 开发者大会 DuerOS 3.0 解读 

超越语音交互的新商业模式探索

百度世界大会 2017 DuerOS 2.0 解读 

持续赋能的盘子比你想象的大

唤醒之旅深圳首场

语音智能技术的认知、落地和未来

WARE 2017 主题演讲

听清、听懂、满足

首届 AI 开发者大会 DuerOS 发布

人工智能时代的 Android


// 唤醒之旅 //


第 1 期 @深圳站   |  第 2 期 @深圳站

第 3 期 @北京站   |  第 4 期 @成都站

第 5 期 @北京站   |  第 6 期 @上海站

第 7 期 @深圳站   |  第 8 期 @杭州站

 第 9 期 @北京站    |  第 10 期 @深圳站

第 11 期 @上海站   |  第 12 期 @南京站

第 13 期 @北京站   |  第 14 期 @上海站


// 小度智能硬件家族 //


小度在家 1S

小度在家全新升级版

小度音箱 Pro丨小度语音车载支架

小度音箱 | 小度在家

渡鸦 raven H


// DuerOS 应用案例 //


华为平板 M5 青春版变身小度在家

歌华小果融合机顶盒

创维电视音响

Anker 智能音箱 | 蓝港小青 AI 音箱

极米无屏电视 | 国安广视 G1 机顶盒

小白音箱 | 音乐天使智能音箱

HTC U11+ 智能手机




快到「湾」里来

深圳湾正在招聘:

真知灼见的科技记者

四通八达的运营编辑

才华横溢的市场策划

技能爆表的活动运营

热情四射的社区达人


简历传送门:

Lynn@shenzhenware.com



●  


深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存