查看原文
其他

美女与IT兽 | 人工智能识别,已经走到哪一步了?

数字转型的 微软商业视角 2021-04-22

· 本文内容分为:语音版+图文版,随你任选

· 应用场景:给你的应用加入人工智能属性

· 收听/阅读时间:10分钟

· 掌握难度:★★★☆☆



好久不见,2017的你怎么样啊?

真人版《美女与野兽》上映,Grace版【美女与IT兽】上线~


已过春分,泡一盏清茶,吹一吹软糯的和煦春风,听一听“软妹版”IT故事:


 ☟ 点开下面的语音 ☟

 

-------- 我是文字版分割线 --------


IT兽们,好久不见!

我是......微软云计算解决方案合作伙伴发展经理顾问微软认证云计算专家主播逗哏捧哏的——彭艳霞,好盆友们都叫我Grace~


3·15晚会曝光了“刷脸支付”技术的安全漏洞,#人脸识别# 这一话题瞬间上了“头条”:

(315晚会视频截图,不熟悉背景的同学可以戳☞这里了解)


做 #人脸识别# 的厂商们,当然也跟着收获了无数关注的目光~


微软在这方面的研究,我们说过多次~老朋友都知道——微软“人脸识别API”是微软认知服务全球20多种API的其中一种。

看过之前的文章,对“微软认知服务”多少有点儿印象,但了解的深入程度就...不好说了。

今天,我们就来好好说说——


微软认知服务到底是什么?

机器学习、人工智能这些技术在今天早已不是什么神秘的黑科技,自然的人机交互变得更为可能——应用可以加入智能属性,可以拥有人的智慧......

今天对于微软认知服务的详细介绍,就是希望可以让大家把智能带到你的应用里,让想法“照进”现实!


微软认知服务的出现,简单说就是:

 把高科技、黑科技以API(应用程序接口)形式开放给所有开发者

 让你的应用理解这些包括——文字、视频、图片、语音等形式的数据

 除了一系列API接口,微软认知服务也包括一些可以帮你训练数据的工具和系统

(认知服务有一个“机生目标”:做你应用的最!强!大!脑!)


前几期,我提到过好几个认知服务API的实际应用( 点这里进入☞ 快速复习通道),今天,我主要想聊聊上几次没讲的存货:

不常被点名,但特别受欢迎的2个API服务——



语音识别&语言理解智能服务


语音识别


拿你们熟悉的微软小娜举例,都知道她功能很多,但被称作“解语花”是因为她能——

一、接受语音的指令:比如我在去年的微软技术大会(Ignite)上,就用你们现在听到的这个声音,让小娜唱过陈奕迅的《十年》~

☟ 戳开视频,听小娜唱歌 ☟

https://v.qq.com/txp/iframe/player.html?vid=u1311sqqahz&width=500&height=375&auto=0


二、她还可以说话(这不是废话嘛~都会唱歌了!)


这里面,包括两层含义——首先,是语音到文字,进行语音方面的识别;再一个,从文字到语音,可以将文字变成人的声音输出。

接下来(就是见证奇迹的时刻):

当我们把语音识别语言理解智能服务(这部分接下来会讲)一起应用时,还可以对语意进行识别,也就是说——你的应用能像小娜一样,听懂人的指令!


老套路,我们又要讲知 识 点了(这段要求课后背诵~):


1音识别:有两种方式(目前),一种是REST,一种是客户端的SDK

· 现在所有API都有REST接口,所以它可以跨平台、跨设备,REST接受的是短语音,最长15秒

· 客户端的SDK,包括Windows、Android、iOS,可以接受2分钟的语音


语种上,语音识别API支持包括英文、中文等18种语言。


上一个简单实例,IT兽们就能秒懂:

短模式最后给你返回的是一个“n-Best”的结果,根据不同的确信度,最后给你确认值最高的,你自己怎么使用还是自己做决定。

 

2音输出

直接上实例——标黑加粗文字是实例中要合成语音的部分,变成声音后会播放出来:


3意图识别:跟“语言理解智能服务”要结合在一起看

把语音变成文字后 ➪ 对文字进行语意的理解、标注 ➪  再加上非监督式的自主学习——它就会变得越来越聪明,了解你发出的指令到底是什么意思以及你应用的逻辑。

好了,现在可以让它去执行指令了~

比如,帮你提前打开家里的电器,或者在手机里提醒你记得晚上9点要倒垃圾......



语言理解智能服务


这段是“操作题”,可以打开电脑边操作边听/读:

· 复制链接:https://www.luis.ai/home/index,在电脑端打开网页(只要有微软的账号就可以免费登录);

· 训练自己要进行语言理解的句子,让你的应用能够接受这些指令。

 

所谓训练,简单说就是:

我们可以对句子里的某些词打上标签,提取“意图”和“实体”,之后就会以一种统计的方式分析某词语出现的概率,来识别语义;

还可以结合上下文,自己进行自主学习,这后面并不是一个简单的规则,当你的应用说XX表示什么,实际上后面还有一些自主学习的结果在里面。


比如下面这个人说:“关于航班延误的新闻”,他想干嘛呢?

这里的意图:不外乎是想找新闻,这就是他的意图;

这里面的实体:比如新闻等等,这就是里面的实体。


如果你在训练方面不是太有经验,也没有关系!

当你打开上面给的链接时,会发现里面会有一个预置的Cortana(小娜)模型,你可以在这个基础上扩展,建造自己的模型;

建造好了以后可以发布,变成一个REST服务,就可以把这个服务当做API的服务接口一样去调用。



微软认知服务的商用计划

最后咱们说点儿实际的:

微软认知服务现已在全球版Azure上,上线24个API预览版;在世纪互联运营的中国版Azure上,也上线了3个API预览版。


这意味着什么?



热血沸腾了?想立刻捋起袖子开干了?

先压抑会儿,因为你还有一个和微软合作的机会未领取!



和微软合作可以...

微软希望在各位成长的过程中,扮演的不仅是你们的云服务供应商,还是各位的合作好伙伴,所以我们最近发布了『微软云生态合作伙伴计划』!


只要你有棒棒哒基于微软云 Azure的解决方案,我们就给你送去:

. 技术培训:丰富的技术能力增值支持,大量的技术培训,快速提升云产品应用和技术服务能力;

Ⅱ. 渠道拓展:微软为你拓展渠道,获得更多的业务和商务支持,帮助你在云计算领域取得成功;

Ⅲ. 营销资源:市场营销资源,微软会为优秀的解决方案做品牌背书,新媒体资源推广;线上线下活动、沙龙、研讨会、行业展会、峰会,甚至微软技术大会都带上你!

(我在Ignite大会上玩儿的甘来可识别表情的无人贩卖机,戳图片即可了解详情)

Ⅳ. 专家咨询:微软专业架构师团队作为你的咨询资源,帮你在垂直市场获得领先优势!


没完(第一次)!

除了市场&营销支持、业务支持、专业技术支持和培训增值支持......

微软云还给你实打实的优惠价格


没完(第二次)

如果你有兴趣,但是还不了解Azure以及Azure在你的方案中怎么用的——我们会有培训,甚至有直接帮你写!代!码!的服务….

谁可以遇到这种好事?

主要看心情...开个玩笑~看的,是看我们双方合作的空间和诚意!


说了那么的多,有没有表达清楚我们的诚意?

总之,只要咱们在一块,肯定能搞点儿大(好玩的)事!


如果你有需要微软帮忙的地方,现在就戳(文末的)按钮,直接告诉我们:


好了,今天就说到这啦,下期再见啦!


☟  隔了这么久,你大约把之前的《美女与IT兽》忘的七七八八了,戳蓝字可复习前面几期内容:

1、美女与IT兽 | 如果能说句话、挥挥手就能把事情办了,我们为什么还要做App?

2、美女与IT兽 | 人类想象力的极限在哪里?

3、美女与IT兽 | 物联网,千万别从头做起!

4、美女与IT兽 | 别光想着双12了,Hololens这次真要来了!


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存