查看原文
其他

语音、交互、软硬件集成和认证的苦甜 |【AI智能音箱登陆战】

李海进@米唐科技 芯片超人 2019-04-22

李海进,深圳米唐科技硬件研发总监


10年无线通讯产品开发经验,曾任富士康高级工程师、哈曼硬件部门负责人,曾负责多款电子产品设计、测试到量产的全过程,包括Amazon Kindle、Kindle Fire,Philiph、Sony数码相框,以及联想平板电脑等;曾建设性提出无线SAR法规通信功率回退机制;带领团队开发Intel双系统、二合一硬件产品并达到年百万级量产出货量。


故事的开始先从一个小故事说起......


开头先从一个小故事说起:我们的产品卖到美国去了。有个小朋友他的机器坏了,他妈妈打电话找到我们公司售后说要让我们维修。


大家都知道出口到国外的产品一般单体的维修成本非常高,我们这边建议他直接换,但是小孩的妈妈很坚持要修,她给出的理由是这个产品和他的孩子一起长大,她孩子已经把这个音箱当成好朋友了,哪怕外壳被磕伤了,她也不要换新的,只想修好带朋友回家。


从上面的故事我们可以知道:语音交互的产品不只是纯粹为了便捷,它已经存在了人性的东西在里面。


关于VUI语音交互的思考


从黑胶照片到智能音箱:


音箱类的产品其实发展已经有一百年了。从1877年的留声机到磁带机,再到后来的Echo,这么多的发展 其实是有两个东西在变的。一个是介质,另一个是承载介质的载体。


从黑胶片到智能音箱


到14年亚马逊推出Echo的时候,使得音频产品有了大脑,使音箱类产品变得智能。语音便捷的交互方式,可以成为下一代的操作系统。

 

行业的发展趋势:


从整个行业的交互方式来看:从一开始的计算器的按键交互到windows+PC 再到iPhone&Android,从手按到touch再到现在刚开始的语音交互。


14年亚马逊推出Echo后,语音交互渐渐地成为一个很大的热点,现在的语音交互就像早期的iosAndroid形态,以后会爆发成一个很大的生态系统。

在这个过程中需要一个工业化的量产过程


▐ 怎么才能工业化普及?


在这个工业化的过程中需要一个工业化的量产过程,怎么才能工业化普及?


1、需要高品质的语音输入

2、高性价比的声音回收方案

3、国内外AI系统软件接入的能力

4、国际化的产品视野和交互设计能力


语音助手和智能音箱的区别

 

智能音箱说到底还是个音响,语音助手则是植入到智能音箱里得核心,而智能音箱只是个载体。


载体可以有很多种,可能是音箱、车载设备、甚至是马桶.....


只要产品加入了语音助手,那么所有的产品都是可以进行语音交互的,就实现了我们所说的万物互联,万物有声。


Alexa是谁?


Alexa已经成了一个人机交互的助手,它已经成为了带有感情色彩的人机交互的平台。所以我们讨论Alexa的时候更倾向于讨论他是谁,而不是他是什么。

 

Alexa是什么谁:


 Alexa是由亚马逊开发的智能个人助理,内置在Amazon Echo之中,从而广为人知。

Alexa能够进行语音交互,音乐播放,制作列表,设置闹钟,流媒体播放,播放有声读物,以及提供天气、交通信息和其他实时信息。


Alexa还可以作为家庭智能化中枢,控制多个其他的智能设备。因为Alexa是住在云端的,所以可以特续不断地学习,从而每天都会变得更聪明。


 ▐ AVS又是什么


AVS是亚马逊的智能云服务,可让您作为开发人员使用麦克风和扬声器来语音启用任何连接的产品。


用户可以简单地与他们有Alexa功能的产品进行交谈,播放音乐回答问题,获取新闻和本地信息,控制智能家居产品等等。


sugr的一些方案



 Sugr Sense是一套完整的,软硬结合的,语音交互产品解决方案,助力音频硬件行业的合作伙伴,更便捷离效地整合Al语音服务、音频流媒体及物联网的应用等。


▐ 算法与DSP


增强语音输入和音乐播放的信号处理算法,以及在特定DSP芯片上的实现,包括:AEC,NR,ABF,AGC,PEQ等。算法以麦克风模组的形式提供给客户。


▐ 系统软件:


基于Linux和Android系统的Amazon Alexa软件解决方案,包括云端、App,嵌入式软件。软件以license的形式销售或者植入硬件模块一同销售。


▐ 硬件:


实现Amazon Tap&Echo兼容机产品需要的完整硬件解决方案,智能音箱形态的参考设计。为客户提供核心系统板或者整机解决方案。


 服务:


降低ODM或行业客户生产Alexa兼容设备的门槛,与亚马逊合作为客户提供预认证测试。同时协助客户对接Spotify/Pandora等北美商务合作。


最后的讨论


2007苹果的触屏手机的出现到2017年,短短十年间,触屏手机普及开来,按键机几乎被淘汰。可能未来智能手机会向可折叠的方向发展,但谁知道呢?


2007的按键机到今天的智能设备


从2014年亚马逊Echo的诞生到2024年,智能音箱或者说是语音交互又会走到哪一步呢?希望大家开动自己的脑洞,留言探讨智能音箱的十年......



点击进入米唐在【芯片超人】的方案旗舰店

可以直接联系他们哟!




欢迎加入认证方案商




下面是我们搞过的事情

【芯片超人课堂】

【芯片超人课堂】已开课程汇总

  IC外贸生意经&外贸英语沙龙

【AI 智能音箱】

 登陆战105页PPT | 89页PPT | 语音语义 | 技术方案 | 主控选型 | 供应链 | 资本视角

【芯片超人】

买靠谱货 | 912大促 | 停产料 | 黑遍电子业 | 骗子说 | 单片机 


 阅读原文加入【芯片超人】认证方案商

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存