查看原文
其他

前途未卜的智能音箱,语音助手还差一个杀手级应用

Rani Molla AI科技大本营 2018-12-16


作者 | Rani Molla

译者 | 刘旭坤

整理 | 非主流、Jane

出品 | AI科技大本营


近日,亚马逊推出了一款可以用语音控制的智能微波炉。至此,亚马逊推出的由 Alexa 语音控制的智能家居产品的数量已累计超过十种。由此,我们可以看到亚马逊推广自家语音助手 Alexa 的执念。


不仅亚马逊如此。Google 也一直在扩充可以用语音助手控制的家居产品,包括近期发布的 Google Home Hub,一款带屏幕的智能音箱。Facebook 则在上个月刚刚发布了 Portal,一款可以进行视频通话的智能音箱。苹果也有HomePod ,而其中至关重要的语音助手 Siri,则从 2011 年开始就出现在几乎苹果的所有产品中了。


随着语音助手的使用范围越来越广,用户对隐私问题的疑虑也是与日俱增,然而消费者对智能音箱似乎仍十分买账。智能音箱预计将会成为即将到来的美国感恩节和圣诞节购物季中的送礼佳品。更何况已经有超过 1/4 的美国人已经拥有智能音箱,并且每月会至少使用一次语音助手功能。


人们对语音交互的接受速度出乎意料地快。智能音箱的销量长红和各种研究机构对语音交互的信心也让隐然让语音交互的市场上泛起了泡沫:


  • Canalys 称两年内全球智能音箱总量将增加超过 200% 至 2.25 亿台。

  • 加拿大皇家银行资本市场公司预计到 2020 年 Alexa 带来的购物营收会超过 50 亿美元。

  • 市场研究机构 Juniper Research 称 2022 年全球在语音助手上的广告支出将从 0 增加到 190 亿美元,与当前整个杂志广告市场的规模不相上下。


虽然其中一些预测可能会成为现实,然而做出如此乐观的估计恐怕还为时过早。美国国家广播电台 NPR 和研究机构 Edison Research 联合发布的报告显示:约 1/3 的智能音箱用户在购买一个月之后新鲜感减退,使用智能音箱的频率也开始下降,且有接近一半的用户表示愿意回到没有智能音箱的日子。数据体现了人们对新技术一贯的热情,然而语音助手恐怕现在还不算一项革命性的技术。


现在,语音助手和智能音箱确能帮我们打开收音机、调暗灯光或者朗读天气预报,但是,想要颠覆人们的生活,只做到这些还远远不够。


语音交互到底有什么用


其实,语音是一种很有用的人机交互方式,但发展一直受到技术条件的限制。现在随着逐渐降低的价格和越来越快的网速,语音的处理可以转移到服务器上,也让智能音箱和语音交互赶上了发展的风口,改变了人机交互的方式。


听歌、听广播和听有声书成了智能音箱的典型使用场景。据统计,有 70%-90% 的智能音箱用户都用智能音箱在线听过歌,而有约 50% 用户则是天天都用智能音箱听歌。这些数据表示用户消费媒体内容的方式已经发生巨大改变。此外,流媒体音乐公司 Spotify 发现,通过智能音箱收听的用户比一般用户更愿意每天收听音乐,而且更倾向于在周末听音乐,或者专门听一些怀旧风格的音乐。



除了新兴的流媒体平台,传统的广播电台用户中也能看到智能音箱的发展。NPR 个性化与策展部总监 Tamar Charney 称,通过智能音箱收听 NPR 直播的用户从去年的 4% 增长到了19%。NPR 发现智能音箱用户增长的同时其他平台的收听率却并没有下降,这对依赖公众捐款生存的电台来说至关重要。用户收听时间越长,对内容就会越感兴趣(电台会在节目中提醒用户可以用智能音箱来听 NPR 广播)。Voicebot 博客与播客创始人 Bret Kinsella 也谈道:“智能音箱让人们重新开始听广播了。语音技术的杀手级应用就是播放音乐。”甚至连播客都在语音助手的应用下变得活跃了起来。根据语音控制播客的 APP ——Scout FM,其创始人 Cara Meverden 也说,智能音箱用户的播客收听率是手机用户的两倍。


使用智能音箱收听播客的用户比使用电脑或手机收听的用户更愿意让广告播完,而播客靠的就是广告收入。Meverden 也说道:“用户很少让 Alexa 跳过广告,因为让 Alexa 快进 30 秒跳过广告还不如就让广告播完。智能音箱用户其实更被动,语音接口提供什么,用户就接受什么”。


智能音箱的流行也带动了一些智能家居设备的使用,比如智能空凋、智能电灯、智能门锁,都能让用户在任意地点进行操控,而且现在这样的方式正在逐渐成为主流。Google 的语音助手已经可以控制超过 10000 种智能家居设备,亚马逊 Alexa 则更胜一筹能,可以与超过 20000 种智能家居设备兼容。


语音助手简化了很多之智能家居产品的设置工作,很多时候智能家居产品都能实现即插即用。


Google 产品管理和硬件总监 Micah Collins 谈道:“过去只有安装和设置智能家居设备的人才会使用它,但是现在语音控制在智能家居产品的可用性上带来了巨大的提升。”


这直接导致了智能家居设备销量的上升。IDC 数据显示,全球智能家居设备市场,包括智能音箱、电视盒子、空调、家庭监控和安全设备等的总销量预计今年将增长 27%,达到 5.5 亿台。



这已经直接影响到了整个智能家居产业。大多数的 Leviton 智能开关和插座都可以通过 Google 的语音助手或 Alexa 进行控制,在被问及开关和插座的智能化是否有助于提升销量使 Leviton 产品经理 James Shurte 表示:“肯定啊!智能家居产品就靠有语音控制才卖货。”


语音助手让智能锁具设备制造商 August 去年的营收翻了一倍。August 的联合创始人&CEO Jason Johnson 说道:“当用户购买了一个智能音箱后,他们接下来就想买点智能灯、智能锁试试,看好不好用。好用的话他们以后就会选择那些可以用智能音箱控制的家居设备。”


理想状态下,你只需要动动嘴,就可以控制房间的温度和开关门锁,或者让电视播放你喜欢的电影。听起来很酷而且科技范儿十足,但是这些工作没有语音技术的话也就是走几步的事,或者在手机 App 上完成。


尽管看起来智能音箱在流媒体和智能家居方面的功能很完善了,但是,如果智能语音助手智只能做到这些的话,那无疑要让人们大失所望了。因为离开了声控其实人们的生活一切照旧。



语音购物?别闹了


除了听音乐,控制智能家居,企业还期待用户通过语音助手来购物,但是这一现象还并未真正实现。大多数调查显示,曾通过智能音箱购物的用户只有约 20% ,这其中还有一半是好奇的尝鲜者。据 The Information 统计,在亚马逊智能音箱用户中通过 Alexa 购物过的比例不到 2%。无论数字是多少,至少目前不是零售商想要的。


实际上,根据 Voicebot 公司 5 月的一项调查指出,大多数人们还是喜欢去实体店购物。只有不到 1% 的美国用户说他们更倾向于用智能音箱买东西。



也许是作为回应,最新推出的智能音箱都加上了屏幕,亚马逊也给 Alexa 的购物指令打起了广告。这显示除了语音技术目前的一些局限性,尤其是在商业业务场景中。Google Collins 也曾谈及“对于纯语音技术产品而言,实现购物还有些为时过早,购物中更多的是视觉和触觉体验。”


在亚马逊和淘宝上买东西随便搜点什么都能蹦出几十页搜索结果,但用智能音箱搜索用户一般只能有一两种选择。能适合这种模式的恐怕只有廉价的日常消耗品而非服饰,比如说厕所里用的卫生纸,价格不贵,经常需要买,而且一般人不会费很多功夫来比较不同的卫生纸品牌。有用智能音箱购物经历的用户中 85% 都购买了智能音箱给出的第一个结果。


尽管大品牌都有提前布局智能音箱购物的意向,但目前还没有找到很好的切入点。智能音箱和语音助手们还在努力争取用户的信任,所以现在 Google 和亚马的逊智能音箱是根据用户的消费历史等信息在为用户提供最相关的产品。不过看看亚马逊和搜索引擎里的遍布的广告就知道当用户对智能音箱的搜索结果产生信任时,广告也不会远了。


商家们现在唯一能做的就是给智能音箱增加与自己产品相关的新功能。比如汰渍就开发了一款相当于智能音箱上 APP 的技能来教用户如何清除衣物上的各种污渍。这些新功能并不局限于单一的智能音箱平台(当然可能要开发多个版本)所以品牌可以在多个智能音箱上布局。为智能音箱提供芯片和软件的高通以及为智能音箱提供音响系统的 Sonos 也都在各个智能音箱厂家中间选择保持中立,让自家平台保持开放。这其实也是自然而然的选择,因为这样高通和 Sonos才能实现自身利益的最大化。


智能音箱的未来


智能音箱之所以是智能音箱,恐怕只是因为对着音箱说话比对着冰箱说话看起来更正常一些。当人们习惯了和设备使用语音进行交互,智能音箱应该也就完成自己的历史使命了。人机语音交互的重点是语音助手,语音助手具体在什么地方,在音箱也好在冰箱也好,其实并不相干。


有人预测未来上街购物随处可见的语音助手将能识别出你并给予个性化的推荐,然而目前的现实是我说话稍微快点语音助手就跟我说他/她听不懂。所以语音技术的走势如何目前还很难判断。


上世纪 80 年代鼠标 - 这一人机交互的新方式刚刚出现时也遭到了用户的冷嘲热讽,但现在我们知道以鼠标为载体的人机交互理念并没有错,只不过受到当时的技术水平所限制。早期鼠标精度不高,而且软件设计者也还没有找到发挥鼠标潜力的方法。四十年后的今天,鼠标或者触摸板已经成了软件和电子游戏设计中必须考虑的因素了。


语音交互比用鼠标进行交互更加自然更加直观,但目前也处在与当年鼠标类似的尴尬境地。


语音技术咨询公司 Rain Agency 的首席创意官 Will Hall 表示:“有新兴技术出现时人们总是习惯于把老观念往新技术上面靠。比如第一个电视广告其实根本就和广播上的广告一样只有声音,其后电视广告才慢慢地演变成为多种感官并用的展示方式。比如展示一辆汽车驶下高速的同时播放着音乐,这样观众既有视觉感受也有听觉感受。对语音技术也是同样的道理。”


除非有一天我们能找到一种只有借助语音才能完成的用例或者发明,否则语音技术只不过是把在线内容换了一种方式呈现而已。


原文链接:

https://www.recode.net/2018/11/12/17765390/voice-alexa-siri-assistant-amazon-echo-google-assistant


本文由AI科技大本营翻译,转载请联系微信1092722531。


AI福利精选


对于想系统学习人工智能的朋友,我们为大家准备了一个干货资源包,包含多家一线公司技术大咖30+精选讲义跟对方向,可以让你的学习事半功倍,欢迎扫码领取!



推荐阅读

专访百度熊辉:有人转AI纯粹因为好找工作,这样的人不是我想要的

三摄正普及,四摄在路上?谷歌逆天AI算法,只做单摄虚化

开源 | IBM、哈佛共同研发机器翻译模型的可视化工具

“基因编辑婴儿”惹争议,你或许不知道机器学习在脱靶效应中的作用?

下次面试若再被问到二叉树,希望你能对答如流!

亚马逊AWS发布AWS RoboMaker 可直接部署机器人

程序员的江湖 务必掌握这些黑话!

高达800万次下载量的npm包被黑客篡改了代码,你的设备或正成为挖矿机

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存