查看原文
其他

百度的“助手”,成了谁的AI?

王金旺 雷锋网 2019-07-08

▲点击上方 雷锋网 关注


尽管有全双工的加持,小度仍可以说是百度面向智能语音生态的一盘棋局。

 文 | 王金旺 

“小度助手终于有了全双工。”不少业内人士会后感慨道。

在今年的百度AI开发者大会上,百度创始人、董事长兼CEO李彦宏开场首先秀了一波小度助手的新功能——全双工免唤醒交互。从李彦宏与小度对话演示过程中可以看到,小度智能音箱在初次被唤醒后,可以在没有任何模式切换情况下识别出李彦宏哪些话是在和观众交流,哪些话是在和小度交流。

交流过程中,不再需要唤醒词,而且在交互过程中可以识别出哪句话是和它讲,并准确作出应答。

开场这一趴,李彦宏亲自为小度助手(DuerOS)打了一波硬广,小度在这一趴的表现也确实争气,没有掉链子。


对于AI语音助手,全双工是个好东西


全双工对于一个AI语音助手或AI引擎意味着什么?这一点其实可以从其应用上来理解。

据雷锋网了解,AI语音助手就其应用而言,目前有两大出发点:

第一,交互。

AI语音助手之所以现在备受推崇,最主要一点就是其有可能成为未来的主流交互方式。百度副总裁、百度智能生活事业群组总经理景鲲在随后接受雷锋网在内的记者采访中谈到:“据贝恩公司此前的一份调研数据显示,未来人机交互方式中,语音交互将会占到30%左右。

在AI语音助手的交互应用中,一个很重要的能力就是多轮对话能力,这一能力训练较为复杂,涉及到诸如文本分析、自然语言理解等AI能力,包括小米的小爱同学、阿里的天猫精灵,以及国外谷歌的Google Assistant、亚马逊的Alexa,都在不断加强其AI语音助手(多轮)对话能力的训练和应用。

值得一提的是,此前主打EQ(情商)的微软小冰,在语音方面一直以全双工见长。而从此次在发布会上的小度助手表现出的全双工能力来看,功能性而言,也已经很完整。

雷锋网就此前体验和会场上观察认为,相较而言,微软小冰的全双工能力更注重聊天能力,小度助手的全双工能力更偏重功能性。

当然,就以往参加发布会经验来看,包括智能音箱在内的智能硬件,用户实际体验感要略差于现场演示的能力的精彩度(这一点有点类似广告与实物的差异)。

第二,功能性。

功能性一直是当下AI语音助手中表现不尽人意的地方,雷锋网此前也多次表示,AI语音助手至今还未能出现像智能手机中的微信、电话通讯等强用户粘性的应用。当然,小度助手此次在功能性上也有几个值得关注的升级亮点,下文将会继续剖析。


小度的5.0时代:四大能力的功能解析


在剖析此次小度助手升级的能力之前,值得注意的是,百度对智能语音能力,以及智能生活事业群组(SLG)有明显的政策倾斜。

包括此前的度秘事业部升级为智能生活事业群,为智能音箱持续硬件补贴,以及此次在百度AI开发者大会上,几乎贯穿整场、包括李彦宏、王海峰(百度大脑)、沈抖(移动生态)、景鲲(智能生活)、李震宇(自动驾驶)、尹世明(智能云)各位主讲嘉宾的演讲内容中都可以看到小度的身影。

也是凭借这样的助力,借着央视春晚、持续硬件补贴在内的这波百度内部政策倾斜,小度智能硬件也终于如愿起飞了,2019年Q1小度系列智能音箱出货量拿下了中国第一、全球第三的成绩。此外,景鲲在大会上也给出关于小度阶段性的数据:      

搭载小度助手的智能设备激活量超过4亿台,激活量超过800%;

截止2019年6月,小度助手月交互次数超过36亿;

小度的对话式语音技能开发者社区,有超过3.3万名的开发者,超过2400项优秀技能。

除了这些数据以外,小度助手此次升级的5.0版本的功能性也有所提升。除了前文提到的「全双工免唤醒」外,景鲲在大会上还特别强调了家庭信息流、家庭通讯与通知、DLNA投屏功能三大功能。

全双工免唤醒。据景鲲会上介绍称,这项能力使得小度助手可以一次唤醒、持续交互,并能辨别出「需要执行的指令」和「没有意义的对话」。据现场介绍内容显示,用户可以通过“小度小度,打开极客模式”触发全双工免唤醒功能,目前这一功能主要使用场景为音乐和有声内容场景,每次执行完用户命令后,屏幕左下角会出现彩色小度,并维持长达30秒的免唤醒连续对话。

据现场演示,这一新功能确实能满足日常交互需求。但这一新功能雷锋网还未实际尝试,实际应用场景中表现如何还有待看随后的用户反馈。

家庭信息流。这一功能背后有赖于百度APP的信息流及用户在家庭场景与小度互动数据,提供个性化推荐(包括个性化音频、视频、消息,甚至新技能)。

这显然是一个更聚焦家庭场景应用的技能,据雷锋网了解,这一功能其实百度此前已经在小度在家1S上悄悄上线,并运行有一段时间。就其向笔者此前推荐的内容来看,娱乐性内容偏多。雷锋网认为,这一能力其实在新技能的推广应用上有更多裨益。

家庭通讯与通知。小度电话通讯能力其实此前已经具备,此次更新的则是「小度电话大全」。这一能力其实是小度助手和百度地图的内部“联动”,小度电话大全集成了百度地图所有的PUI(Public User Identity,公有用户标识),可以让用户在小度设备上发现附近的商家、银行、医院等地理数据。

据大会现场演示来看,用户还可以在通话过程中将自己的地理位置语音控制发送给对方。

DLNA投屏。“无需任何配件,小度智能音箱大金刚就可以秒变电视。”这一功能其实是从笔记本、手机延伸到智能音箱中的功能,据景鲲透露,这一功能是由爱奇艺与小度两个团队共同经过6-12个月研发出的新功能。

智能音箱投屏功能的难点在于系统的兼容性,是因为现在主流的智能音箱系统采用的是Linux系统,但是现在主流的视频网站都是兼容Android和iOS。

据雷锋网了解,这一功能其实在实际应用中类似百度此前做的另外一项工作,通过为智能音箱配备对接传统电视的红外码库,进而通过智能音箱控制电视。在应用上的不同之处在于,前者针对的是智能电视的投屏功能,强调的是内容共享;后者针对传统电视的升级应用,同时更强调的是控制。

以上四项能力正是小度助手5.0版本升级带来的能力迭代。仔细斟酌可以发现,此次升级的能力,除了备受关注的「全双工免唤醒」是实质性的强能力升级外,其他三项能力均可以看作是小度助手在家居场景中的能力拓展。由此可见,目前的小度助手主要仍是针对家居场景布局和能力迭代,家居场景仍是智能语音助手今后最为聚焦的应用场景之一。

值得注意的是,此次小度助手直接跳过了4.0版本,发布5.0版本。对此景鲲向雷锋网表示,这主要有两方面的原因:

一方面,根据内部决策,小度助手版本迭代基本会是6个月的周期,小度助手4.0版本上线时,其实没有较好的发布时机,因而成了内部版本;

另一方面,智能投屏此类功能研发周期较长,4.0版本没有完全更新上线,因而此次跨过4.0版本,直接发布了5.0版本。

雷锋网注意到,不仅小度助手,包括百度大脑的百度整个AI体系均选择跨过4.0,直接更新到5.0,也就有了此次百度AI开发者大会上的全面进入5.0的势态。


小度助手的“主力”与“助攻”


小度助手的主力是“谁”?更多人认为是百度自家的智能硬件。

此次大会上,百度也再次更新了四款智能硬件:小度智能音箱大金刚、小度智能音箱PLAY、小度智能音箱PLAY青春版、小度在家1C 4G版。

智能音箱,新品而言,也是老生常谈。在硬件性能上,环形麦、红外遥控(红外发射器)等基本已成标配;软件性能上,则是随着版本代系统一升级。四款产品不同之处则是在于各自目标人群或使用场景定位上。大金刚换了金属包装,PLAY下沉到年轻群体,1C 4G版增强通话能力,同时也是百度首款可移动的智能音箱。

对于小度助手而言,其真正主力应该是开发者生态。

经过整个移动互联网时代及智能手机的洗礼后,企业竞争,尤其是巨头企业竞争,早已不再只是产品之间的竞争,而是生态之间的竞争。正如同最初手机的功能机和智能机的竞争,也早已转变为安卓生态和iOS生态的竞争;对于当下巨头企业,包括一些有远见或野心的中小企业,身处AI时代,也越来越多地涉足开源、构建生态。

据景鲲在大会上透露数据显示,小度的对话式语音技能开发者社区已经有超过3.3万名开发者,超过2400项优秀技能。此外,景鲲也表示,小度在家智能音箱上,第三方技能已经成为第一大应用,使用次数超过音乐和长视频。

在小度在家上,第三方技能已经成为第一大应用,其使用次数已经超过了音乐和长视频。这有点像智能手机时代,智能手机现在第一大应用已经不再是打电话,我们在手机APP上找信息、购物、看视频,这种第三方生态已经成为智能手机的第一大应用。

据百度官方在大会上公布的数据显示,目前小度助手已经接入智能家居厂商329家,同时技能开放平台5.0版本底层架构升级后,也增加或升级了诸如ER机制、内容直达、商品库、自动上线、稳定性监控等能力。在百度智能生活分论坛上,百度也邀请来生态合作厂商站台,包括教育领域的好未来、直播领域的虎牙、阅读社区的橙光、音频领域的蜻蜓等。

尽管如此,据雷锋网对行业的观察,用户对智能设备的需求太过发散,甚至没有太明确的需求,也正是由于需求不明确,创新上又没有哪一款应用能完美命中较为广泛的消费群体,目前的生态增长仍难以为包括智能音箱在内的以智能语音为主的硬件带来太多的刚性应用。

对此,景鲲在接受雷锋网在内的几家媒体采访时谈了自己的理解。

今天用户在智能设备上的需求在发散,这是我们看到的一个很好的现象。有点像最开始的搜索引擎,大家用搜索引擎是用它找网址,后来我们发现这个功能很好,可以输入更多信息,用以查天气、股票、楼市、医院在内的更多信息。所以需求一旦发散,技术的用武之地就来了,这就体现了技术的深厚。另外,整个价值对于用户的帮助也更大。所以我觉得,有屏幕的智能音箱已经进入到了一个新阶段。

除去硬件、生态,其实整场发布会也带来诸多与智能语音相关产品及应用,包括百度发布了面向远场语音交互的鸿鹄芯片,升级了百度APP,并在小度车载上与吉利合作,这些也都成为小度助手继续衍进的助力。


小度助手的商业化,初步尝试


智能音箱这一硬件,甚至智能语音生态如何实现盈利?这是当下面临的一个挑战,尤其在硬件补贴打到你死我活的中国,更是一个棘手的问题。

在今年百度AI开发者大会上,景鲲也首次对外提出进行商业化尝试。百度首先看上的,是当下已经相对成熟会员付费模式。具体而言,包含以下三方面:

  • 小度VIP会员。跨界内容、电商整合小度会员,包括将当下最热的音乐付费(VIP曲库)、音频付费(联合蜻蜓FM),以及诸如电商应用的优惠券发放等汇集到小度VIP会员中,并联和爱奇艺推出联合会员制。

可以看到,小度会员现在更多是在对小度用户培养付费服务习惯,包括与爱奇艺的联合会员,最终售价也是以爱奇艺的会员价格进行售卖。

  • 付费技能。小度助手上的付费技能生态目前已经有包括美团外卖、口袋故事在内超过了3万个付费单品。

付费技能一方面是在为开发者生态持续供血;另一方面也是对标较为成熟的安卓、iOS生态中的应用商城,提供开源生态模式的闭环链路。

  • 品牌技能。这是在智能硬件中有别于前两种向用户直接收费的技能,这一技能是面向品牌厂商提供定制化内容营销服务,类似此前电视上的广告创意,只是在投放上更“AI”。

可以看出,小度此次尝试的商业模式,无论是会员,还是品牌技能,都是相对当下已经成熟的商业模式在智能音箱上的应用。一方面,以此种商业模式覆盖更多生态合作伙伴;另一方面,也在培养用户使用付费服务的习惯。


百度的“助手”,成了谁的AI?


智能语音已经是一个老生常谈的话题,却也是人工智能引擎三大(文本、语音、视觉)应用场景中最受关注的应用场景。尤其在国内,各类智能硬件已经将语音助手作为标配,但语音助手由于在能力上,包括功能性、交互性上都低于用户预期,因而,虽然智能音箱市场销量稳步上升,但在技术性、AI性、商业能力上仍差强人意。

国内整个大环境仍处于一个“卖座不卖好”的困局——智能音箱销量持续攀升,多数应用能力尚偏鸡肋,用户并不满意。智能音箱厂商也赚不到什么钱,头部效应也开始显现。 

尽管如此,小度助手跨过4.0,进入5.0时代,从整体生态布局上来看,已然初局规模。

与此同时,百度也开始联合更多厂商布局生态,并开始思考小度的商业模式。目前来看,这样的新生态也被诸如教育、社区、音频类内容型产业看好,并形成合作互动。

蜻蜓FM创始人兼董事长张强在接受雷锋网采访时也表示,包括智能音箱在内的丰富的智能终端将会是音频市场接下来的推动力。

现在这个时代,手机几乎成了唯一的内容终端和渠道,在手机终端上,用户所有的交互行为都是基于屏幕的视觉交互,在这样的交互行为下,音频作为一个内容形态而言,它扮演的其实是配角角色,主角是视频和文字。

下一个时代,伴随着5G、IoT时代的来临,会有更丰富的智能终端,同时,并不是每个智能终端都是像屏幕一样与用户交互,诸如智能音箱这类突出语音交互体验的智能硬件一定会带来音频内容大量消费,语音交互时代的这些终端上音频应该是主角,也是我们最大的机会。

在这样“未来式”生态体系下,诸如Alexa、Google Assistant、DuerOS,以及小爱同学在内的AI引擎将会发挥出更大的能力和价值,成为各类产业和连通者和赋能者。

而在这样的未来憧憬中,百度的这一“助手”,又将会成为谁的AI?

推荐阅读

李彦宏和小度最强互动,王海峰发布鸿鹄芯片,百度音箱大变身

▎支付宝刷脸支付将上线美颜功能;特朗普:推特离了我啥也不是;三星承认折叠屏手机是赶鸭子上架

好看!小米自拍神机发布:100% 美图美颜,价格很诱人

▎Jony Ive 的离开,让苹果下一任 CEO 浮出水面了

库克怒批首席设计师离职内幕报道;小米回应注册快递商标;马斯克称5年内推出电动飞机


你还在看吗?

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存