查看原文
其他

【牛津计划】高兴,难过,还是生气?计算机替你察言观色

2015-11-12 牛津计划 微软研究院

微信公众号:微软研究院


人类天生擅长察言观色,但计算机就不怎么样了。




不过,这恐怕要被翻篇儿了。机器学习和人工智能领域的飞速发展使得计算机科学家能够打造更智能的应用,让机器可以识别声音、文字、图像等信息——甚至面部表情。微软牛津计划团队今天宣布了新工具公开测试版本的开放计划,旨在帮助开发人员更好的利用这些能力,包括面部情绪分析,进行智能应用的开发。


这些工具中,有许多已经成功应用于微软的产品了。牛津计划旨在帮助那些没有机器学习或人工智能领域专业知识背景的开发人员,在自己的应用中加入语音、视觉和语言理解等智能功能。


去年春天,微软发布了第一套微软牛津计划的工具。该项目的负责人表示,他们很快就吸引了众多的关注——从知名500强企业到规模很小但斗志昂扬的初创企业——他们渴求这些智能功能,却苦于没有机器学习和人工智能专家组成的团队提供技术支持。


“令人兴奋的是,人们对此兴趣浓厚,反应也十分多样。”微软技术与研究部高级项目经理Ryan Galgon说道。



情绪、视频、拼写检查和面部毛发




在机器学习的帮助下,系统得到越多的数据,就能够变得越智能。包括Skype Translator的实时翻译功能和微软小娜个人助理在内,这些技术也为一些重要突破提供了基础。


对于面部识别这类功能,系统可以借助一套训练图集,进行机器学习,从而学会识别面部的某些特质,随后即可应用“所学的知识”来识别它所“看”到的新图片中人脸的面部特征。


今天公布的面部情绪识别工具可用于分析人类八种核心情绪状态——愤怒、轻蔑、恐惧、厌恶、高兴、中性、悲伤和惊喜——这一切都是基于带有这些情绪的常见面部状态分析。




Galgon 表示,开发人员可以利用这些工具来创建一套系统,供商家观测人们对店内陈设、电影或食物等的反应。或者,他们还可以创建一种面向大众工具,例如实时通讯类应用等,应用能够根据从图像里识别出的情绪来提供不同的选项。


作为微软牛津计划的组成部分,面部识别技术还可以有很多其他用途,例如基于照片中人物的面孔对它们进行归类。


还能不能有更娱乐性的玩法?本周早些时候,为了支持和胡子有关的公益活动Movember(胡子月),微软发布了 MyMoustache.net(我的小胡子可爱吗?)(https://www.mymoustache.net/),就是通过这项技术来识别出照片中人脸的胡须并对胡须进行评价。此外,该网站还能为没有胡子的人脸自动在准确的位置加上胡子。




现在,面部情绪分析工具测试版已经向所有开发人员开放。此外,今年年底之前,微软还将发布其他几个新工具的公开测试版本。这些工具还会供一定的免费试用。


它们包括:


拼写检查:开发人员可以将这款拼写检查工具添加到自己的移动应用、基于云的应用或是其他产品中。拼写检查功能可以识别“gonna”等常用语、品牌名称、常见名称错误以及“Four”误作“For”等难以察觉的错误。它还可以不断增加短期内突然流行起来的的新品牌和新的表达方法。这款工具的公开测试版从今天起向公众开放。


视频:这款工具允许用户轻松地通过面部跟踪、运动侦测和图像稳定等功能来分析视频和自动编辑视频。它是基于部分与微软Hyperlapse相同的技术研发而成。这款工具的公开测试版将于今年末向公众开放。


说话者识别:这款工具可以通过学习个人语音特点来识别说话的对象。开发人员可以把它用作一种安全措施,因为人的声音就和指纹一样,每个人都是独一无二的。这款工具的公开测试版也将于年末向公众开放。


自定义语音识别服务:这款工具也被称为CRIS,能够应用于喧闹的公共场所等复杂的环境中,帮助人们更方便地自定义语音识别。例如,企业可用它来帮助团队在嘈杂的车间或热闹的购物中心内更好地识别语音。该工具也可以用于帮助应用更好地理解非母语说话者或残障人士等——这些用户在以往的语音识别上往往困难重重。这款工具将于今年年末向受邀人士开放。


人脸识别更新:除了以上推出的几款全新工具外,微软牛津计划中现有的面部识别工具将进行更新,并新增加了面部毛发识别和笑脸预测工具,这套工具还改善了对人脸进行的年龄估测和性别认定功能。

感兴趣吗?访问微软牛津计划网站(https://www.projectoxford.ai/)进一步了解和试用吧!或点击阅读原文观看相关视频。



相关阅读:


【开源】分布式机器学习工具包

【魔力胡须】教你在光棍节找到另♀一半♂~(男女通用!)




微软小冰住进微软研究院微信啦!快去和她聊聊天吧。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存