查看原文
其他

美女与IT兽 | 30分钟就能做出一个智能音箱,一起吗?

数字转型的 微软商业视角 2021-04-22

· 本文内容分为:语音版+图文版(戳这里可以了解什么是【美女与IT兽】

· 应用场景:人工智能、物联网如何在行业中落地,产生商业价值?

· 收听/阅读时间:10分钟

· 掌握难度:★★★☆☆




上上周,“美女”给“IT”兽们立了一个Flag:


今天,就来还债...5个在不同行业中真正落地的解(清)(奇)(脑)(洞):

① 智慧医疗、② 智能咖啡贩卖机、③ 智能音响、④ 车联网、⑤ 智慧零售


上一期,已经讲了智慧医疗——机器学习在医疗行业的落地案例。


本期,将放送智能音箱快速智能化案例!



 ☟ 点开语音,让耳朵先迈进智能! ☟


-------- 我是文字版分割线 --------


我,依然是各位IT兽们可爱、博学、低调、人见人爱花见花开、谦虚又经常口不择言的微软云计算解决方案合作伙伴发展经理顾问微软认证云计算专家主播逗哏捧哏的阿霞——彭艳霞,你也可以叫我Grace~


今天我们再继续说:物联网和各个行业结合怎么快速落地,怎么在行业里产生影响,怎么产生商业价值。


接下来,我就要变身——高高瘦瘦无论长相还是行业经历都很资深的,米斯科技CTO Jason

他今天分享的是:如何30分钟做一个智能音箱!


接下来请把我当做Jason~~~


大家好,我叫Jason,今天我来讲讲智能音箱。

它通过声控、语音让我们可以控制家电,解放双手;也可以透过声音告诉我们资讯,让眼睛离开屏幕,把整个的智能带进我们的生活。


基本上做这样的一个产品,是一些工程上的分解,大概有几种方式呢?


☞ 用传统本地语音专用芯片,搭配控制系统

这种语音芯片很多,但有限制:① 识别的声音必须非常准确;② 它对模糊语义的辨识能力不强。


☞ 用电脑主板或者手机版搭配本地应用和云端应用,结合在一起形成一个智能音箱。

一个是电脑主板,一个是手机版只拿来做音箱有点可惜了,不划算!


☞ 本地应用跟云应用的这个结合

那未来产品迭代升级,你就要做本地跟云应用的开发,还要部署一个所谓的升级服务器,让本地应用升级......


一定要这么复杂吗?没有其他的方式来做吗?


30分钟做出一个智能音箱


这时我们想到——用Azure能在不能30分钟之内作出它呢?


用一个传统音箱,加一个有麦的声卡,加上一个最简单的IOT可以连接Azure的WiFi模块;接下来我们在Azure上面调用认知服务API,包括:Translator、Bing Search、LUIS还有CloudService来做业务逻辑处理,好了全部功能都有了!


主播插话:呃...好像冷场了,可不可以稍微照顾一下我这样的小白啊!!!


但的确就是这么简单!一个WiFi模块加上Azure,它就是一个Echo。


主播插话:那这个IoT的WiFi模块做了什么呢?


它只做一个非常简单的事情:把我们看得见的音频线变成看不见的无线音频线,把音频从音箱的麦克风传给Azure,Azure经过辨识、逻辑处理之后,再把声频经过这个音频线传给音箱播放出来。


Azure就是一个远在云端的大脑,处理了所有事情,只把声音播给我们的音箱,硬件基本上不用做任何处理。


我们先不纠结到底辨别率是85%还是90%,就一个简单的问题:

对于绝大多数音响厂商,如果可以基本不改动现在的设计,付一点云端费用马上就能变成智能音响,如果还能造点概念多卖100块,是不是门生意?


刚才我们看到这些Azure功能,是不是只能够做这个刚才说的Echo音箱或者是叮咚音箱这么简单的事情呢?


其实大家想想看,我们在Azure上面,只要改变一下逻辑,就可以把声控的这个功能带到比如——智能家居的场景、陪伴机器人的场景或智能学习机的场景......这些产品现在不要太火哦!


那如果再加上一些复杂的模块,像机器学习或者是大数据分析,事实上你就可以用在智慧工厂或者是智能会议室系统上了。


简单说就是,只要在你刚才看到的逻辑程式:


语音输入 ☞ Bing Search ☞ 语音输出


中间再多加一项——Bing Translator,就可以把它从中文变成你想要的60种其它语言,秒变翻译小助手,很多人在线上即时翻译或者出国时都有需求!


同样的产品,在某东上要卖3000块,还是不带屏幕的哦!

用我刚刚说的办法人人都能做一个出来~


插话Again:Azure的认知服务有这么强么?

确实这个地方要打个问号,现在微软是人工智能领域里比较领先的,不过对于一些个性化场景的实用性还有很大的距离——比如你让他懂四川话?陕西话?翻译个菜谱?

很可能水土不服啊对不!


微软大概在一年前也意识到了:自己的深度学习引擎进化速度超过了知识的灌入量,所以面对无穷无尽的世界,微软开放了Customer Speech API(说话人识别 API),让所有人的知识都可以灌入深度学习引擎,让智能更加智能!

试用 Customer Speech API


没完,总有人不满足单一的翻译功能!

那在这个翻译小助手之上,再加一层所谓的LUIS,或是机器学习之后,它就可以变成一个传说中的小冰机器人、对话机器人!

(机器人的诞生要不要这么轻易啊!)


那硬件上需不需要做改变?

硬件上,没有任何改变,还是相同的硬件!但是云端只要换一个程序,它就是另外一个东西。


快速智能化的最后一公里

说到这儿了我要往回收一下了:刚才我把微软Azure能提供的能力稍微美化了一点,其实,你要真用还是有一点点难度的,特别是硬件企业。


米斯就是原来这波硬件企业之一,可能因为我们接触的时间早,所以提炼出了这最后的一公里——让产品变智能化只需要30分钟

30分钟当然是夸张,但是也基本说明了速度的快。


解释一下,米斯在做两个“化”——第一是把本地云端化,第二是把云端电脑化


☞ 什么叫本地云端化?

我们大部分提供给客户的是三个东西:

· 第一个叫做蓝牙Mesh网络:因为不是所有的本地网络计算都必须透过WiFi或者透过大的点对点的连接方式,有办法形成一个不定型的网络组合,所以Mesh网络是我们觉得在本地IOT上一个比较适合的网络,它可以随时加入随时发出。


· 第二个是“智慧工厂”:一个本地端的数据采集跟控制盒。


· 最后一个是提供给很多传统非电子行业的“IOT智能大脑”:它有一定的计算能力,可以实现作为一个边缘计算向本地的一些LPC的语音端点处理,处理完后把重要的数据丢给Azure的认知服务,Azure再把所有处理过了之后的讯息回给它,它再去控制本地的其他端点,所以我们称它为最强的传统产业大脑。


☞ 什么叫云端电脑化?

Azure上就是Azure电脑化。

· 首先我们把Azure所有的认知服务打包:客户不用逐一订阅,打包之后可以调用任何的认知服务。


·  第二个是我们在做的Mix Service的Virtual Cloud Computer(已经预览了)这个是说,所有的IOT装置对于这个云端电脑来讲,就是一个所谓的周边,你不需要再去理解所有的服务器配置,只要一个会写本地win32的应用工程师,就可以开发出一个拥有复杂功能的云业务逻辑处理程序。


不用自己建AI团队,直接用顶级AI团队的研究成果给产品插上“智能”的翅膀,是不是好拽!

你也可以这么拽哦!


 好了,听了Jason说这么多,我也该变身回来了~

我的“助理”——微软物联网技术总监管震老师,对于人工智能最近有了许多新的思考,我看就不要跟大家说了......

哎呀谁扔的杯子…

好吧,但是他对人工智能与产业的结合的理解有非常独到之处。

如果想知道他密集增长了许多有趣的行业经验之后,都在琢磨些啥的...那就持续关注我的栏目【美女与IT兽】咯!


今天的案例就分享到这里,下一期我们将分享的主题是——共享经济,车联网!

. . .


后,我找了个地方来专门和你们一起探讨——物联网和人工智能如何落地!

☟ 长按识别以下二维码,网红在这里等你聊天! ☟


☟  戳蓝字回顾『美女与IT兽』前九期:

第一期:美女与IT兽 | 如果能说句话、挥挥手就能把事情办了,我们为什么还要做App?

第二期:美女与IT兽 | 人类想象力的极限在哪里?

第三期:美女与IT兽 | 物联网,千万别从头做起!

第四期:美女与IT兽 | 别光想着双12了,Hololens这次真要来了!

第五期:美女与IT兽 | 人工智能识别,已经走到哪一步了?

第六期:美女与IT兽 | 你可能没发现,这么搭建云服务性价比更高!

第七期:美女与IT兽 | 微软拥抱开源,你怎么玩?

第八期:美女与IT兽 | 开发与运维,除了相杀也可以相爱!

第九期:美女与IT兽 | 深度学习框架怎么选?选快的!


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存