查看原文
其他

微软认知服务:服务人人,融入万物,无所不在

2016-10-18 微软丹棱街5号

在大数据的时代,人工智能、机器学习、大数据分析已逐渐成为商业成功的一个关键推动点。特别是近年来人类在大数据和机器学习领域取得了诸多进展。


人工智能到底离我们有多远?我们应该如何利用智能技术将我们新的应用和企业服务提供一个更高层次的价值?或许在你的印象里,人工智能还是科学家的专利,科幻片的场景,或者“人机大战”。其实,微软带着“予力全球每一个人、每一个组织成就不凡”的使命感,已经将人工智能技术,并通过认知服务带到了我们身边。




记不记得一年多前,朋友圈里热传的可识别照片中人物年龄、长相、情绪的应用?比如How-old.net(微软颜龄)、TwinsOrNet.net (我们有多像)、微软表情等等。这些微软人工智能黑科技的实验性应用背后就是微软的智能服务——微软认知服务。




借助微软认知服务,开发者们就算没有人工智能的知识背景也能轻松开发出属于自己的智能应用。仅用几行代码就可以借助强大的算法开发应用程序,不论是iOS、Android或者Windows,都可以轻松完成跨平台、跨设备的配置。


就在近期刚刚结束的移动开发者大会上,微软亚洲工程院院长刘震博士分享了在人工智能研究与普及方面所做的努力。


“微软希望让每一名开发者都能够轻松运用人工智能技术。” 


下面我们就来还原提炼一下刘院长以《智能应用普及化》为主题的演讲,学习其中的精华。


1
AI的冬去春来


人工智能的研究历史已经有60年。1956年,在达特茅斯学院举行的一次会议上正式确立了人工智能的研究领域。最初,大家对于人工智能的研究主要是在数理逻辑方面,并且在自然语言、机器视觉等方面对后来的研究做出了贡献。然而很快,这项研究在70年代到达了瓶颈,人工智能的第一个冬天来临。


之后的人工智能研究集中在如何把知识传给机器,将人类的思维方式和我们学到的知识总结出来使得我们的应用更智能化。但到了80年代末90年代初,由于这个过程无法普及化,人工智能的第二个冬天来了。


终于,从90年代中期开始,随着算法的进化以及计算能力指数的提升,使得计算机能够很“聪明”,甚至能够一点一点地战胜人类。从国际象棋到自动驾驶,人工智能迎来了又一个春天。


2
智能应用的开放和普及


此时智能应用主要的推动力是数据。现在计算能力有了指数级的发展,数据能够大量的采集。所以,因为有了数据,有了人工智能,在各行各业中,那些还没有完全智能化的应用,都是大家的机遇。


有了数据和智能化以后,我们的业务就会得到新的突飞猛进的发展,这就是新的价值提升,毫无疑问产品会更有竞争性,更有竞争力。未来各行各业,生活的每一个地方,都会有智能化的出现。智能化出现之后,如何把数据提升到洞察力,如何能够提供到决策的层次,技术上,对大家都是一个挑战。同时,也是考虑到数据科学家怎么样能够进入我们的开发领域,开发团队。


从开发者的角度来讲,毫无疑问我们有我们的技能,我们也应该学进步的技能,但是真正能够把人工智能的技术从头到尾,从零开始学起,这首先并不是特别的现实,其次学了之后跟着人家走,也很难达到最高层次,那么应该怎么做呢?


最关键的一点就是站在巨人的肩膀上!


在这个领域里面有很多巨人,有谷歌、有IBM、Facebook、微软,这些公司不光是有很多人工智能和开发者的资源,而且都有数据,并且愿意把这些数据和工具开发出来,开放之后就是给大家搭了一个平台,这个平台上有我们的数据和算法。


更重要的一点是有一个模型,通过这种模型的应用,就可以直接把人工智能的精髓付诸于应用中,这就是微软认知服务的一个目的——让应用拥有人的智慧。


3
认知服务API案例


这些技术开放出来之后,开发者就可以轻松开发应用。现在来说,微软认知服务有哪些API呢?目前这套认知服务包括视觉、语音、语言、知识和搜索五大类共二十一项API。在此基础上该服务还会持续更新并补充新的API。那我现在就简单介绍其中几个API,看看利用这些API都能做些什么。



计算机视觉API分析图像:基于所输入图像的视觉内容分析出图像的视觉特征,好比输入图像后,可以将图像中的物体识别出来,并同时描述,就可以看图说话。


计算机视觉API读取图片中的文字(OCR):在图像中检测并识别文本。



计算机视觉API生成缩略图:生成高品质和高存储效率的缩略图。

关闭智能缩略功能


开启智能缩略功能


计算机视觉情绪识别API:识别图片或视频中人脸的表情来检测任务情绪。



计算机视觉人脸识别API:检测图片中人脸并识别属性,核对两张人脸是否属于同一人;从多张人脸中找出与所查人脸相似的人脸;根据识别的人脸进行分组;查询某张人脸,与提供的数据中的何人相匹配等。



语言理解智能服务API:使用来自必应和Cortana(小娜)预构的模型或开发者自己创建的模型。


例如,创建一个聊天机器人,首先解析业务逻辑,理解机器工作原理,如对话、说话的内容等。把这些都放在平台上,让机器来理解和定义,然后再把这些定义输入到聊天机器人的平台上,就可以产生聊天机器人。


这是整个的框架,我们提供了SDK,提供了连接器,然后再用认知服务来理解我们的语言。从开发者的角度来讲毫无疑问就可以通过一个聊天机器人的平台,直接注册进入到平台来用SDK,然后把聊天机器人接入不同的渠道,在不同的渠道里都可以通过聊天机器人来进行对话。


4
请关注微软认知服务


最后我想总结一下,开放对于开发者来说,毫无疑问就是有一个简化快捷的方式来开发智能的应用,对企业来说是一个更全新的体验。很多的应用都可以非常简单的开发出来,只要用一些API就可以了,我希望大家会后都可以试一下。


Microsoft认知服务



这是我们认知服务的公众号,大家可以扫描一下,得到一些新的信息,谢谢大家!



关注我们微软丹棱街5号如果觉得好,就鼓励一下作者吧~长按下面的二维码关注微软亚太研发集团官方微信!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存