查看原文
其他

对话景鲲:DuerOS要做语音交互时代的Android,有戏吗 | AI英雄

2017-08-03 网易智能

本文系网易新闻-智能工作室(公众号 smartman 163)出品。聚焦AI,读懂下一个大时代!

编者按:本文为AI英雄专访第26期,本期对话嘉宾为百度度秘事业部总经理、人工智能产品委员会主席景鲲,他如何看待语音交互技术的发展,如何打造DuerOS这款语音交互系统?又如何看待语音交互技术的落地应用与使用场景?

作者 | 小羿


急速转型、All in AI的背景下,百度已将宝押在了创立仅半年的对话式人工智能系统DuerOS上面。


在百度COO陆奇的整体规划下,百度大脑+百度智能云已经成为了百度AI战略的两大支柱,这其中,DuerOS又成为了百度大脑的最重要组成部分。


DuerOS创立于今年1月,归属度秘事业部,由总经理景鲲直接负责。依据百度的战略思路:iOS与Android是触摸交互时代的霸主,而语音交互会成为下一个人机交互时代,在这个新时代同样需要一个基于语音的人机交互界面,不同于触摸交互,语音交互受到了不同语言的制约,而百度要抢占中文语音交互系统的战略高地。


被百度寄予厚望的DuerOS,目标是要打造一个基于语音交互的全新开放平台,这个平台通过API、SDK为合作伙伴提供创新技术工具,输出AI技术能力,一起合作共赢。


近日,网易采访了DuerOS的直接负责人景鲲,他作为微软前首席研发总监、度秘事业部总经理、人工智能产品委员会主席,分享了语音技术的发展情况,以及如果让语音交互技术落地和发展应用场景。

All in AI,DuerOS首要解决听清、听懂的问题


在景鲲看来,语音交互技术首先要解决的是听清和听懂的问题。


在听清的问题上,百度主要做了麦克风阵列、回声消除、语音唤醒、远场识别几项技术。其中,自定义语音唤醒技术可能是百度收购KITT.ai以后具备的最大技术优势。


但目前的现实情况普遍是,虽然很多企业宣称其语音识别准确率达到了97%以上,降噪和远场识别做的也足够好,实验室数据足够亮眼,但在实际的应用场景中,还是会出现无法唤醒的情况。DuerOS同样面临着这些问题,如景鲲所说,近场语音已经基本上成熟,但是远场语音识别在不懂的环境下需要逐渐被攻克。


在听懂的问题上,景鲲宣称百度可能是国内唯一能解决听懂问题的。景鲲的理由是,解决自然语言理解的问题,关键是要做数据训练,而DuerOS借助百度搜索有了数据上的优势。"在人机交互的过程当中,其实就跟原来人们用百度搜索一样的,从关键字变成了自然语言,都是表达和需求之间的一个契合。“景鲲说到。也就说,如果DuerOS依托百度搜索,就可以调用十亿级的知识图谱实体、语音调用和音频数据、千亿的图片和网页等数据,这是DuerOS的最大优势所在。


即便如此,百度依然不能忽视人才的作用。今年以来,百度先后收购了渡鸦、KITT.AI等AI技术公司,以弥补自身技术上存在的不足。景鲲说,百度收购技术公司的思路基本上是,与自己技术有互补性,或者客户有特别强的需求但百度还不具备,我们就会考虑收购。据悉,渡鸦在人机交互方面有很多创意产品和应用,而KITT.AI在开源自定义上(如自定义语音唤醒词)有着很强的实力。


起步阶段:要想成为平台,首先让用户对语音交互有认知


根据景鲲的说法,DuerOS的目标是成为人工智能时代的Android。“在时代的变革过程中,Android从底层消费层入手,解决了基础的门槛,让很多人更容易进入这个行业来开发自己的手机,他们可以定义自己的手机,在解决一些基础应用需求的同时,也让整个市场更加丰富。我们希望DuerOS也扮演一样的角色。”


据景鲲透露,截止目前DuerOS的生态合作伙伴已经达到120家(包括硬件、芯片、方案、内容等领域厂商),但距离平台的数量级还差得很远,毕竟仅运营了半年时间。景鲲说,“我们希望一起打造高端的Case,一方面让他们自己的产品更好,另外一方面我们也能够覆盖越来越多的长尾。”


面对需求千差万别的开发者和厂商,DuerOS在普适性上似乎还有很长的路要走。作为平台,DuerOS如何去权衡厂商和个人开发者使用服务的完成度和自由度?对此问题,景鲲表示,不管开发者和厂商是直接拿来使用,还是进行二次开发,DuerOS都要提供一个至少能够完成基本服务的系统。


“百度正在抱着开放的心态来做这件事,比如很多合作伙伴希望把自己的内容和服务放到DuerOS的后台去支撑,后者仅提供听清和听懂的能力就可以了,这时候DuerOS也同样要支持。”景鲲说。


在DuerOS的内容服务接入上,景鲲认为不同产品、不同用户对语音内容服务的要求不一样,但用户的需求跟原来的搜索具有很强的联系。“我们希望DuerOS是一道门,用户通过它去获取原来百度搜索上已经连接的信息服务。”景鲲说。


对于目前的平台运营以及如何选择合作伙伴,景鲲说,目前来讲我们不会去挑客户,就算是一些个人开发者,百度也会去支持。“我们在官网上开发了很多不同的套件和解决方案,其实是希望每个小企业、大企业还有个人开发者都能够开发这样的设备。”


关于平台的商业化方面,景鲲告诉网易智能,目前DuerOS不会考虑商业化,现在最大的问题是怎么让普通消费者知道语音对话设备,让语音对话交互将成为一个标配。未来,新的人机交互模式势必会带来大量的商业机会和新的模式。“但是现在来讲,最主要的还是用户体验和用户认知。”


落地应用:看好家庭和车载等场景 智能音箱和电视需求或井喷


语音交互是一个全新的交互方式,使用场景和落地产品也在不断摸索中。陆奇曾说,人工智能落地最关键的是找到场景和商业模式,做出极致体验,并快速迭代。


基于这种思路,DuerOS首先将使用场景的重点落在了家庭、车载、手机等能够快速迭代的场景中。景鲲认为,这三个成精对语音的需求是逐渐的升温的,家庭和车载的需求是从0到1,手机上的语音助手以前就有,后续它的角色会越来越重要。据IDC预测,到2020年51%的智能汽车企业、68%的智能手机与穿戴设备企业都将在产品中采用对话式人工智能系统。


据景鲲介绍,DuerOS已经接入了120多家企业的应用和产品,比较重要的有,与国安广视合作推出的智能机顶盒,在长沙、石家庄等地都有开展机顶盒免费换的活动,直接打入普通家庭生活中。另外,百度与小鱼在家合作推出了分身鱼陪伴机器人,还与极米合作推出的激光无屏电视,都内置了DuerOS系统支持语音交互。

在产品品类上,景鲲认为智能音箱的需求将是井喷的。据景鲲透露,百度为深圳做智能音箱的方案集成商,尤其是给亚马逊Alexa提供解决方案的厂商提供了一种盒壳,只要把开发套件放进去,就可以很容易做出一款智能音箱。但是,景鲲并不认为这会造成大量同质化的产品流入国内,他认为外观、声腔、喇叭的不同,都可以做成不同的产品。景鲲希望这些品牌商和方案商,借助DuerOS直接将为Alexa生产的硬件带到中国来。在他们看来,如果系统门槛越低,集成越方便越便利。景鲲说,“对于这一部分的用户,我们是开创了一扇很容易进入中国市场的大门。”


其次,景鲲认为,智能语音产品已经成为传统家电厂商新的增长点,所以不管消费者是否接受,下一代的电视、空调、洗衣机可能都会带语音交互。在这其中,景鲲特别看好智能电视,“电视绝对是属于一个未来语音交互的重要载体”。景鲲还称,有语音的能力之后,用户跟设备的交互黏性以及活跃度会急剧提高。但具体的数据如何,景鲲称现在还不方便透露。


要想成为超级平台,还有很长的时间和很长的路要走


不久前,百度公布了2017年第二季度未经审计的财报。财报显示,Q2百度营收为208.74亿人民币,同比增长14.3%,净利润44.15亿人民币,同比增长82.9%。百度将这些增长归功为DuerOS带来的开放生态。实际上,语音交互的落地应用还处于早期,不管是在技术、内容服务还是场景打造上都还有很多的问题要解决。


景鲲认为,DuerOS想要成为语音交互时代的Android,首先要跨越技术的门槛。在Android和iOS出来之前,那个时候也有触屏,但是电阻屏很不方便。在那个时代,Android和iOS解决了屏幕的问题,解决了手触摸的问题,解决了这两个核心的技术问题之后,整个手机产业开始腾飞。


“我觉得本质是一样的,在现在也要解决听清、听懂这几个核心技术问题,这几个核心技术问题如果不解决,是不可能让整个产业有一个大爆发的。”景鲲表示,我觉得在现在这个时代 45 33502 45 15287 0 0 3649 0 0:00:09 0:00:04 0:00:05 3649,是一个技术的瓶颈期,攻克了技术瓶颈之后,语音交互的发展本质上跟Android时代是一样的。


面对语音交互领域国内外巨头的竞争和布局,景鲲称,大家看到的是一样的方向,就说明这是一个巨大的机会,而百度又是中文领域最大的搜索引擎,可以利用自己的优势做出最基础的生态。


就像陆奇所说,长期来看DuerOS对于百度意味着巨大的机会,但目前的工作重点是要打造好产品,以及健康的生态系统,这也是一大挑战。(完)


注:《AI英雄》系列专访文章所有权归网易智能工作室,每周四更新。围绕人工智能领域讲述一个人物故事,洞察技术趋势,捕捉行业机会,关注人的价值。转载请注明出处,违者必究!

点击阅读原文查看《AI英雄》专题

     

1、专访微软洪小文:下一个十年,AI应用将成兵家必争之地


2、专访地平线机器人技术余凯:我特立独行 不畏惧行业泡沫!


3、专访科沃斯钱东奇:人工智能落地还要十年,你很酷不代表你能存活


4、专访云从科技周曦:刷脸时代 一支”国家队”的独特”战法”


5、专访驭势科技吴甘沙:2021年实现L5自动驾驶很难 共享无人车可期


6、专访优必选周剑:人形机器人普及还要十年,90%创业太虚都会死


7、专访联想芮勇:以前大家把搞AI的当骗子 现在我希望AI是只"慢牛"


8、专访第四范式戴文渊:AI的Windows时代何时到来?


9、专访英特尔宋继强:如果机器人取代了你的工作,要学会灵活转型并与AI共处


10、专访图森未来侯晓迪:那些不能盈利却说要改变世界的人,不是骗自己就是在骗别人


11、专访Gowild邱楠:讨厌硬件免费,所有的付出都应该被尊重,今年低成本机器人会上量


12、专访码隆科技黄鼎隆:人工智能已装酷60多年 现在的核心是赚钱


13、专访微软黄学东:语音交互的技术前景到底是怎样的?


14、专访达闼科技黄晓庆:机器人的1G时代何时到来?


15、专访出门问问李志飞:人工智能将成为人类智商的延伸


16、专访ROOBO刘颖博:我如何走过机器人市场的那些坑?


17、专访英语流利说CEO王翌:为什么中国人学英语效率这么低?


18、专访百度风投刘维:哪些AI公司会在泡沫中死掉


19、对话哈萨比斯:AlphaGo告别围棋AI的故事刚开始


20、专访于尔根:AI早就有了意识 未来十年行业走向哪?

 

21、专访尼科:用脑机接口下载意识实现永生 还有多远


22、专访杨强:阿尔法狗已经是"上帝"?它还有致命弱点


23、对话尤瓦尔:AI替人类工作不可逆 智神将掌管世界


24、专访彭军:L3不适合商业化 无人车要考虑场景应用


25、对话李德毅:我们即将进入人机混合驾驶的漫长时代

扫描二维码,查看更多精彩内容


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存