查看原文
其他

为什么阿里要和小米在智能音箱上死磕?

2018-03-23 阿司匹林 CSDN

点击上方“CSDN”,选择“置顶公众号”

关键时刻,第一时间送达!


作者 | 阿司匹林

出品 | AI 科技大本营(ID:rgznai100)


在三月科技圈扎堆发布季,阿里巴巴人工智能实验室在北京召开发布会,正式推出天猫精灵曲奇版、天猫路由、天猫魔屏 S1(智能投影仪)等多款产品,售价分别为 299 元、199 元、4999 元。


不过,这次发布会最大的亮点并不是 mini 版的天猫精灵,而是阿里如何为智能音箱引入视觉交互的能力。

AliGenie 2.0 的野望



为了在语音交互基础上更进一步,AliGenie 2.0 在第一代的系统的基础上增加了视觉能力和多模态交互能力。这里的视觉能力包括图像识别、人脸识别、物体检测。


AliGenie 2.0 首先将视觉能力落地在天猫精灵 X1,然而天猫精灵并没有推出一款“带屏幕的音箱”,而是推出了“精灵火眼”功能:通过现场发布的 XHolder 外设,及天猫精灵手机 App “精灵火眼”功能,所有天猫精灵 X1 用户都能连接自己的手机,为天猫精灵加一块屏幕。天猫精灵还能调用手机摄像头,具备视觉认知能力。


其中,XHolder 是专门针对天猫精灵 X1 的支架,售价为 49.9 元,本身并没有任何功能。按照天猫精灵产品经理杜海涛的说法,这就是一块塑料板。


不过 Xholder 的包装盒里有一个二维码,用户通过天猫精灵的手机 App 扫描这个二维码,就可以激活天猫精灵火眼功能。


据AI科技大本营了解,未来天猫精灵 X1 的用户将不用扫描二维码,就可以体验精灵火眼功能,而天猫精灵曲奇版的用户未来也有可能体验到这个功能,只是暂时还没有时间表。


目前,精灵火眼支持的功能主要是面向儿童和老人。


面向儿童使用场景:“精灵火眼”与国内出版社合作,精选了适合 3 岁到 8 岁儿童的 117 套图书,如《小猪佩奇》等热门 IP。使用的时候,只需将相应的卡片或者图书对准手机摄像头,系统将会自动识别,并自动朗读相应内容,有些甚至会有动画画面。这个功能主要用来帮助儿童识字,为儿童讲故事。


面向老年人使用场景:“精灵火眼”推出识别药盒的功能,能识别 4 万种药盒,只要扫一扫药盒,就能用语音播报药名、功效、过期日等信息,而这个功能主要是通过和阿里健康合作来。


https://v.qq.com/txp/iframe/player.html?vid=e0611vgaaq4&width=500&height=375&auto=0

电商、视频、音乐......阿里坐拥海量资源。显然,阿里希望将这些资源充分利用起来,加上自身的技术积累,两者相结合,实现人无我有,人有我优。


可以发现,相对于亚马逊 Echo Show 那种自带屏幕和摄像头的做法,阿里的这种方式可以零成本的方式实现视觉交互的升级。毕竟屏幕、摄像头、芯片这些,如今的智能手机都已经有了。


由于这种方式是需要利用手机自身的计算力来实现,因此低端手机的体验可能会存在一些问题。杜海涛表示,目前已经完成了所有主流设备的适配,但是计算能力弱的可能会有一些问题。至于对手机具体配置的要求,应该很快会公布。


流量入口之争


PC 时代,浏览器是流量的主要入口,鼠标和键盘是最普遍的信息交互方式;移动互联网时代,移动 APP 取代浏览器成了流量的主要入口,而主流的交互方式也变成了触控屏。


然而这些交互方式都离不开人手和人眼,因此在很多场景下并不方便,比如在厨房做饭的时候,在开车的时候。因此,在万物互联的物联网时代,很多科技界的人士都认为,语音将是下一代流量入口,而语音交互也将成为主流的交互方式。



包括 Siri 在内的智能手机端的语音助手,都未能让语音成为主流的交互方式之一。2014 年,亚马逊的智能音箱 Echo 问世,才成功为语音助手找到了真正的落地点,并迅速成为潮流,成为众多科技公司的效仿对象。


Canalys 的数据显示,2017 年全球智能音箱出货量突破 3000 万台,而今年预计全球出货量将达到 5630 万台。可以预见,以智能音箱为代表的物联网将迎来爆发的势态。


而阿里人工智能实验室负责人浅雪认为,下一代交互方式不只是听觉,还有视觉,甚至触觉等。亚马逊推出带屏幕的 Echo Show 其实也是为了解决语音交互在某些场景下效率低下的问题。未来,语音、视觉、触摸等交互方式的融合应该会是大势所趋。


实际上,早在 2015 年,阿里巴巴旗下的阿里智能就分别与飞利浦与漫步者两家厂商合作,分别推出了智能音箱产品 “小飞” 和“MA1/3/5”。不过,这两款产品的表现未能让阿里满意。


为了打造自己的智能音箱,阿里特意在 2016 年成立了阿里人工智能实验室(A.I. Labs),负责阿里巴巴集团旗下消费级 AI 产品的研发。


然而,看好这一趋势的并不只有阿里,BATJ 中的其他几家已经全部加入这一战局。


京东:早在 2015 年 8 月,京东就联手科大讯飞推出了叮咚 A1 智能音箱,去年又陆续推出了叮咚二系产品:叮咚 TOP 和叮咚 2 代等。此外,携带屏幕和摄像头的叮咚 PLAY 也将于近期正式发布,而且也会支持人脸识别。据报导,叮咚已经整合了京东微联、飞利浦hue、Home Connect 等10大智能家居平台,能够直接控制 20000+ 款智能产品。


百度:在去年的百度世界大会上,百度推出了旗下首款智能音箱产品 Raven H,售价 1699 元,这种价格显然不是奔着销量去的。而本月 26 日,百度将会发布智能视频音箱——“小度在家”,据AI科技大本营了解,其售价或在千元以内。不过,百度目前的策略并不是主推自家硬件产品,而是将自家的 DuerOS 打造成语音交互的安卓,通过吸引更多的合作伙伴,打造自己的生态。


腾讯:腾讯应该是 BATJ 里最晚进入这一领域的。腾讯自己不生产智能硬件,而是通过腾讯叮当 AI 助手这个平台来扩展合作伙伴。在近日举行的 AWE 2018大会上,营长看到腾讯叮当已经覆盖汽车、电视、耳机、音箱、机器人、手机六大常用 AI 场景的落地产品,包括长虹智能电视、优必选机器人、GGMM 音箱、1More耳机、PACEWARE手表、国光爱浪耳机等产品,只不过这些产品的完善度还不高。


和小米杠上了


虽然智能音箱玩家众多,但是小米AI音箱的出世,将智能音箱的价格拉到接近蓝牙音箱的水平,而且小米凭借着自家生态链企业,一出世就坐拥庞大的智能家居生态系统,外界的关注度颇高。


此前,小米AI音箱让天猫精灵模仿放屁声音的视频一度非常火爆,而在发布会现场,浅雪也已调侃的方式回应了这段视频。



可以说,小米AI音箱已经成为天猫精灵的劲敌。


价格之战


虽然小米AI音箱的发布时间要晚于天猫精灵 X1,但是小米激进的价格策略确实给阿里带来了不小的麻烦。


浅雪现场公布的数据显示,天猫精灵 X1 截止目前的销量为 200 万台。而去年双十一期间,阿里将天猫精灵 X1 的售价从 499 元降到 99 元,当天的销量高达 100 万台,相当于 8 个月总销量的一半。


价格战虽然好用,但是代价太高。如此高的补贴不可能成为常态,推出低价版的智能音箱也就顺理成章了。


首先,天猫精灵曲奇版,也就是 M1,价格为 299 元。


好巧,小米的AI音箱也是 299 元。


天猫精灵官方旗舰店的数据显示,曲奇版天猫精灵的预售量已经超过一万台。可见低价策略还是有效的,特别是在小米AI音箱仍然需要抢购的当下。



然而小米似乎已经准备好进行新一轮的价格厮杀。


就在上周,小米社区有网友曝光了小米AI音箱 mini 版,并表示其售价 199 元,将会在本月底发布。当然,至于什么时候能买到,估计又要拼手速了。


虽然小米的AI音箱从去年 7 月发布至今一直没能实现现货供应,但是它的价格摆在那。智能音箱和智能手机不一样,并不是必需品,再有更便宜的选择的前提下,消费者往往会持币观望,这也是其他厂商的压力来源。


生态系统之战


除了价格,与智能音箱配套的智能家居生态,也是影响消费者购买决策的重要因素。


去年十一月,雷军公布的一组数据显示,小米 IOT 平台已经拥有超过 8500 万个在网智能硬件设备,同时在线设备超过 1000 万,成为全球最大的商用物联网硬件平台。


不过杜海涛表示,这 8500 万台设备中,2800 万台是路由器,1700 万是手环,并不全是智能家居设备。


与此同时,浅雪在发布会上也给出了这样一组数据:


  • 可连接 4500 万家用电器

  • 72 个家电品牌

  • 39 种品类

  • 8 个物联网平台



浅雪向AI科技大本营表示,目前天猫精灵和合作伙伴是两条完全独立的线,此前在 CES 上发布蓝牙协议,也是为了方便在局域网内和其他智能家居直接通讯。


除了与智能家电互通互联之外,阿里还通过智能插座等方式,让非智能家电可以通过语音来控制。


这一系列的举措都说明了阿里对智能家居生态系统的重视。


当问及如何看待与小米的竞争时,浅雪表示,他们和硬件厂商是合作关系,而小米和这些厂商就是竞争关系。


结语


中国的智能音箱市场并不成熟,到目前为止,还未出现单品销量突破 1000 万台的产品。


没有销量,遑论生态。


浅雪在接受采访时直言道,“我的老板(马云)跟我说了,要靠我赚钱连水电费都不够交的。”这也意味着,阿里并没有准备通过硬件获取多大利润,而是意在 AI 时代的流量入口。


可以预计,为了抢占这个流量入口,智能音箱市场的价格战和生态链大战还会继续下去。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存