从蓝牙语音到大屏交互,剖析百度在对话式 AI 上的创新 | WARE 2019
蓝牙设备可以像 WiFi 设备一样具备语音交互的能力,这是非常有意义的事情。
- shenzhenware -
2017 年,伴随人工智能音箱行业的火热,基于 AI 的语音交互也正逐渐改变人机交互的方式。同时,集语音技术以及内容、服务生态的语音平台应运而生,这些语音平台大多背靠互联网巨头、AI 公司,试图发展成为「AI 时代的安卓」。
对于这些的公司而言,除了 AI 技术和内容闭环服务打通,他们更注重将技术、应用落地到产品,带给用户价值,这样才能反过来促进技术的进步,繁荣生态。
作为国内最繁荣的语音 AI 生态,百度 DuerOS 在产品落地方面有不少领先的成果。在最近由深圳湾主办的「ON THE GO:随行 AI 场景的产品创新」峰会上,来自百度智能生活事业群组的刘悦发表了主题为《百度在对话式人工智能上的创新探索》。
以下为演讲实录,内容经深圳湾整理和编辑。
人机交互发展:从人理解机器到机器理解人
每一次人机交互的迭代都在推动着时代和产品的发展。
我们简单回顾一下人机交互发展经历的三个阶段:第一阶段的 PC 时代,以鼠标和键盘的交互方式促进了 PC 设备发展,相关软件也应运而生。第二阶段的触屏时代,从过去的鼠标、键盘到触控手机,使得硬件的使用成本极大的降低。第三阶段,也就是目前,语音对话的人机交互方式的发展,使得我们理解机器成本进一步降低。
从人理解机器到机器理解人的交互方式的改变,催生了智能音箱、智能大屏设备、智能可穿戴设备、智能车载等设备的发展。
基于语音对话的人工智能产业已经全面爆发
从国外的市场来看,亚马逊 、Google、苹果、微软以及许多创业型的公司加入到这场智能化的变革当中,他们的竞争已经进入白热化阶段,并推动整个市场和产业的发展。
回过头来看,国内的市场情况也跟国外非常像。我们预测,2020 年,对话式人工智能在各个场景上的渗透将大幅度增加:智能家居(上升 27%)、智能车载(上升 51%)、智能可穿戴(上升 68%)。
中国市场的潜力非常巨大,我们发现,目前有非常多的音箱、大屏设备、穿戴设备、耳机等设备都在变成一个可人机自然对话的智能设备,基于语音对话的人工智能产业已经全面爆发。
小度自诞生以来取得的成绩
百度在 2015 年的时候发布了第一款小度产品,从那时候我们开始尝试和探索如何做一款这样的产品。至今,小度助手已经成为中国市场最繁荣的语音 AI 生态。
在 2016、2017 年,我们更多的持「生态赋能」的思路,不断跟业界的其他硬件公司合作,包括音箱企业、电视企业(TCL、创维等)、汽车企业、手表企业、耳机企业、手机企业等。我们把 AI 能力赋予不同场景下不同的硬件,让这些硬件成为可语音交互的设备。
2018 年,我们统计了搭载小度助手设备的激活数:从年初的 5000 万涨到 2018 年年底的 2 亿,至今这个数字还在不断提升。当然,激活数据并不能代表这个生态已经达到繁荣,只能从一个侧面反映了搭载的能力。而这样的能力是否真正被用户使用,以及用户是否接受我们给他的新交互方式?
实际上,我们也会非常兴奋地看到,从语音交互次数来看,用户的接受程度也在不断提升。从 2018 年 3 月到 2018 年年底,我们通过月语音交互次数的指标来反映用户交互频率,从最开始的 2 亿次到达去年年底的 16 亿次,这个数字至今还在持续上升,并且速度非常迅速。
从这两方面看来,小度已经变成了中国最繁荣的对话式人工智能平台。
这里面有另外两个指标,我也想分享给大家,一个是语音技能数量,目前小度已经有上千个各式各样的语音技能,我们自己只能做一些头部的技能,更多长尾的技能需要开发者不断提供,这些技能绝大部分都来自于我们社区当中对这方面感兴趣的开发者,使得生态变得更加健康和更加活跃。
另外,根据 Strategy Analytics 的统计,2018 年第四季度,小度系列智能设备的出货量提升到中国第二,增长率达到了全球第一,增势非常迅猛。从现在来看,小度逐渐进入千家万户,成为用户贴心可靠的助手,这也是百度在做对话式人工智能方面的理念和终极目标。
小度的产品发展经历
回顾一下小度的发展历程。在 2015 年的百度世界大会上,度秘发布;2017 年推出的 DuerOS 人工智能的对话系统,到后来发展到了 DuerOS 2.0、3.0,期间还发布了带屏的小度在家。2019 年 2 月,百度发布了小度电视伴侣以及小度在家 1S 这两个产品。
我们经历了从开始发布产品,到后面不断给第三方赋能,一直到后面自研硬件,一路走下来的过程。
百度对话式人工智能的创新一:蓝牙语音解决方案
接下来讲一讲百度在对话式人工智能所做的创新。除了大家熟悉的无屏音箱、带屏智能音箱,我们还在其他方向做了探索,今天借这个机会给大家来简单分享。
第一个是蓝牙设备。面对各种各样的蓝牙设备(蓝牙耳机和手环等),我们萌生出了给这些蓝牙设备赋能的想法——使得蓝牙设备可以像 WiFi 设备一样具备语音交互的能力,这是非常有意义的事情。
我们首先来看一下蓝牙设备的趋势:根据 SIG 的调查,截止到 2022 年,整个蓝牙设备全球铺货量达到 8.8 亿台。这意味着有很多蓝牙设备等待着我们去升级,对话式 AI 技术将对传统的蓝牙市场带来新的机遇。
从场景上来看,蓝牙设备也存在许多痛点。我们主要总结了三个场景,一个是家中,一个是路上,一个是在车内。在家中,智能音箱既支持 WiFi 又支持蓝牙,可进行语音交互。在路上有穿戴设备和智能耳机,苹果前不久发布第二代 AirPods 支持了 Siri 语音唤醒。第三个场景是车内,人在开车的时候双手被限制在方向盘上,这时候语音交互就会变成非常自然的交互方式。
基于这三个场景,我们怎么帮助用户提升他的体验,怎么帮助设备商更好地提升产品呢?这就是我们之前半年到一年时间探索当中希望解决的问题。
小度蓝牙解决方案
在 2018 年 7 月的百度开发者大会上,百度在国内率先提出了蓝牙设备的语音解决方案——DMA 蓝牙解决方案。在 11 月的百度世界大会上,我们发布了第一款基于 DMA 蓝牙协议的车载支架,这也是我们在车载场景上基于蓝牙解决方案做的实践产品。这个产品并不希望搅乱市场,我们更多是想告诉其他相关的厂商,这样的一个方案是 work 的、是被用户买账的。
△ 点击图片查看深度解读:一文解构小度车载支架,我们发现了语音交互为蓝牙设备带来的巨大红利
同时,因为精力有限,我们也不希望完全自己来做所有语音蓝牙设备,而是希望把蓝牙合作方案输出给更多合作伙伴,让大家打造出具备智能对话能力的蓝牙设备。
而做这件事情的时候,会给厂商带来一系列的问题,比如:
用户是否有需求?对这样的产品感兴趣吗?
是否会增加很大的生产成本?
AI 技术接入门槛高吗?是否需要投入很多人力和周期?
有成型的方案帮助我们落地吗?
语音能力、NLP 打包在方案中吗?
可以给用户提供哪些内容资源?是否收费?
实际中,我们对这些问题也进行了研究和探讨:
小度的装机量、活跃度,以及小度车载支架的热卖,从市场角度印证了,用户对这个产品有非常大的刚需。
产品的功能方面,我们在小度蓝牙方案上基于不同的场景做深度的打磨,比如车载支架相应的车载场景,刚需的内容就包括娱乐、导航、接打电话,针对这些场景深度打磨的产品都会在小度 APP 上得以体现。
针对技术门槛,我们也做了很多优化,提供 SDK 的开发套件,把研发的门槛降到非常低。
DMA 整套方案是免费的一体化解决方案,包括语音技术、背后的内容资源和开放生态,以及第三方技能。
关于小度蓝牙的解决方案
接下来是具体的方案介绍,小度蓝牙的解决方案主要包含两部分,一个是小度 APP,第二个是 DMA 协议。DMA 协议的主要作用是帮助蓝牙硬件和手机上的 APP 之间进行对话式交互通讯。
通过我们提供的 DMA SDK,可以快速把 AI 移植到蓝牙设备,让数以千万的蓝牙设备瞬间变成可以对话的人工智能设备。
当这些蓝牙设备有了语音交互的能力,就能够让用户通过语音交互获取小度云端的内容,包括听音乐、有声节目、导航、控制家居等等。
小度的 DMA 语音解决方案有效解决了经典蓝牙协议的以下痛点:触碰和按键触发、语音输入延时明显、APP 之间的串扰和抢占等。
DMA 解决方案的语音交互不需要触发按钮,并针对远场的语音交互做了非常多的优化,在车内复杂的环境下,唤醒率达到了 97% 以上;DMA 解决方案的 BLE/RFCOMM 通道和 A2DP 可以同时使用,延时从 500ms-2000ms 下降到 200ms-300ms,不影响占用录音通道的 App。
百度对话式人工智能的创新二:大屏交互
今天还会跟大家分享我们另外一个在做的创新探索,即大屏体验。
「让用户放下遥控器」是我们做大屏探索时给自己设定的一个目标。针对找不到遥控器、找片很费劲、音质不理想的几大痛点,我们做了小度电视伴侣这样一个设备,它有很好的 Hi-Fi 音质,全语音远场交互,和全天候人工智能助手,这个产品最终的销量也远高于我们的预期。
在小度电视伴侣,我们专门设计的小度智能电视 UI 可以告诉用户,放下遥控器、试着通过语音来跟这个设备进行交互;
我们还创造了「大屏信息流」的概念,把好的内容通过信息流呈现,并通过语音交互做定制化的推送;
同时,这一设备的整套系统全面接入了小度语音助手,使得语音无处不在,它开机时就是智能电视,关上之后就变成智能音箱,语音交互一直在线……
针对电视上 APP 应用安装麻烦的痛点,小度电视伴侣搭载了 DuerOS 的语音技能,不需要安装,只需一句话就可以调用。
我们希望在后续中不断探索人机交互,以及人工智能如何赋能不同场景的智能硬件,希望对话式硬件被更多人使用。■
微信号:shenzhenware
整理、编辑:大林 / 深圳湾
审校:森林木 / 深圳湾
/////////////
深圳湾 WARE 2019 第 II 季峰会开启盲定,点击「阅读原文」锁定门票!
文末留言,参与热评,有机会获得峰会门票!
// 最新动态 //
// DuerOS 大事解读 //
持续补贴智能硬件的背后
超越语音交互的新商业模式探索
持续赋能的盘子比你想象的大
语音智能技术的认知、落地和未来
听清、听懂、满足
人工智能时代的 Android
// 唤醒之旅 //
// 小度智能硬件家族 //
// DuerOS 应用案例 //
快到「湾」里来
深圳湾正在招聘:
真知灼见的科技记者
四通八达的运营编辑
才华横溢的市场策划
技能爆表的活动运营
热情四射的社区达人
简历传送门:
Lynn@shenzhenware.com
● ● ●
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。