你还在用手机功放听歌吗?Siri也弱爆了有没有!
Echo是一款能够通过语音控制的智能音箱,人们能够在房间的任何地方下达指令,来让它播放音乐、阅读新闻、购物甚至是叫一份披萨。这个业务在提案之初并不受重视,然而今天Echo成为了消费者的宠儿,超级碗广告的主角,亚马逊的“下一个十亿美元级业务”。
2011年,当亚马逊硬件高级副总裁Dave Limp首次听闻关于 “Echo”这个产品的提案时,他第一反应是充满怀疑的。
2014年,当科技媒体收到Echo的第一代产品时,他们都在吐槽“作为播放器来讲,它谈不上专业;而作为虚拟语音助手来讲,它又不及手机自带的虚拟语音助手方便。Echo的未来发展前景还是非常令人担忧的。”
然而,今天Echo成为了消费者的宠儿,超级碗广告的主角,亚马逊的“下一个十亿美元级业务”。
为什么Echo能够在智能家居领域鹤立鸡群?
为什么总是手机?
在传统智能家居领域,科技厂商希望消费者用手机来控制家庭里的各种电器与基础设备,但是这真的是消费者所想要的“智能”么?在他们看来手机不过是遥控器的代替产品罢了!而亚马逊则希望Echo成为现代家庭“管家”,消费者想要干什么,无需摸着找手机,只要随口说一句命令,Echo就会为“主人”去操办了。
那Echo又是如何做到的呢?
早在2010年前后为了与苹果的Siri及谷歌的Voice等语音识别系统竞争,亚马逊也开始了对语音识别投入了重金进行研发,但是亚马逊与前两者不同,手机领域并非他的主场,因此它将自己语音识别技术的结晶“Alexa”融入了一款名叫Echo的蓝牙音箱。
不过,语音识别技术作为智能家居的核心时总是会面对如对命令音频内容的识别和理解,语音的模糊性以及环境噪音干扰等问题,那么亚马逊申请的这些专利中藏着什么独门秘籍?让我们从亚马逊众多的语音识别专利中一探究竟。
如何听到主人的命令
为了满足让用户可以在房屋的任何位置呼唤Echo,亚马逊的工程师开发了一种由多个麦克风列阵及音频信号过滤系统构成的自动语音识别处理系统(ARS),ARS系统中的麦克风列阵能够捕捉轻微的声音;而音频信号过滤系统,则能够辨别人类口音与诸如家电噪音等环境音,这两大独门“招式”让Echo拥有一对“顺风耳”在嘈杂的环境中辨别出主人的命令。
如何理解主人的命令
当Echo听到主人的“命令”后,他又该如何揣摩主人的意思去完成播放音乐,购买物品亦或者为主人打开某一件电器的任务?
为此,亚马逊设计了一套关键词识别(Keyword spotting)人工智能技术让Echo将收到的“命令”音频拆分为多个字段,与云计算系统中储存的关键词模型逐一进行对比,与之最为匹配的部分“理解”为主人的真意。因此,只要你来一句:“Alexa, can u turn the television on?”
你家客厅的电视就会被打开了。
“哪一个书呆子小时候没梦想过有一台星际迷航中的超级电脑?”
Echo只是一个智能音箱,但是Echo背后还亚马逊在云计算领域布局的超级服务器,因此Echo作为一个终端让世人看见以往只在科幻小说中看见的科技平台,科技服务于人类,未来又会如何?
亚马逊已经将Echo作为了研发的重点,它必然会不断进步,同时更多的科技巨头也会跟进这个领域,从掏出手机到随口一声,也许明天只要你动脑想一想呢?
往期回顾
你也可以睁眼做梦,Magic Leap价值45亿黑科技带你完美体验