查看原文
其他

Torque:轻应用背后的大蓄势 微软语音技术厚积薄发

2015-02-10 微软研究院


Torque,为中国用户而来

此前,“微软车库”公开发布了一系列小而美的产品,它们全部由具有“极客创新”精神的微软员工在工作之外的时间构思和开发。Torque就是其中一款备受关注的人工智能类产品,它针对安卓平台开发,基于微软语音技术和必应大数据引擎,以小巧创新的界面为用户提供安卓手机和安卓智能手表上的革命性交互体验。用户在不切换当前应用程序的情境下,仅凭单手摇晃手机或轻扭佩戴有智能手表的手腕就可以立刻启动Torque语音交互界面。是不是像举手提问一样便捷?用户在输入语音指令后,就可马上获得答案——包括网络搜索、打电话、发短信、记笔记、设闹钟等常见操作。


可以说,Torque是一款化繁为简的产品。仅凭手势动作和语音输入,它就可以帮你打点好一切。当你在用手机浏览网页或阅读邮件时,需要查询资料,Torque能在不切换当前邮件界面的情况下,仅摇晃一下手机,就可以呼唤出移动搜索获取答案。当你在车来人往的街头,双手被刚刚逛街购买的“战利品”所占据时,轻轻扭动手腕,Torque就能轻松帮你找到周围适合歇脚的咖啡馆。


(摇晃一下即可进行搜索,查询天气、地点等)


Torque的最初版本由微软杰出工程师、语音技术专家黄学东和他的同事王嘉平、吴凌峰和熊炜开发完成。依托于微软语音技术20多年的积累,完成开发总共用了不到三个月的时间。Torque在英文中的意思是“扭矩”,同时又与talk谐音,将这款产品以Torque命名,四位开发团队的成员也是希望借此强调其轻轻扭动手腕就可以启动语音搜索的特性。采用了先进的深度机器学习算法,堪称世界一流的语音识别准确率,也让Torque拥有更为流畅的用户体验。


(黄学东和他的同事们)


为使广大的中国用户也可以体验Torque的单手操作带来的便捷和高效,现在Torque中文版在微软(亚洲)互联网工程院首席研发主管杜奕瑾和同事的努力下,带着满满的诚意来到了中文用户的面前,期待得到大家的关注和试用反馈。Torque中文版基于必应搜索的中日韩大数据,包含更为精准的地理位置信息,不仅整合了微软人工智能技术针对于中文的个性化、简洁的回答,而且对于中文的方言和中英夹杂使用的特殊习惯都能应对自如。


二十年技术积累,语音识别从幕后走到台前

不久前的Windows 10发布会吸引了全球亿万观众的眼球。在这场低调而又充满惊喜的发布会上,微软不仅正式揭开了Windows 10这款众人翘首以盼的新一代全平台操作系统的神秘面纱,还出人意料地展示了令业界眼前一亮的两款产品:Surface Hub和HoloLens。从这些产品中,我们不仅看到了微软拥抱移动互联网的决心和行动力,也可以察觉到一个新的趋势:一个语音交互的时代正向我们款款而来,语音技术从幕后逐渐走到了台前,从小众技术渐渐转入主流应用。深入集成到Windows 10中的Cortana让用户只要动动嘴就能轻松打理一切;而掀起科技圈热议的HoloLens就更离不开语音识别技术的鼎力相助了。


(Windows10系统中的Cortana)


以微软研究院为大本营,微软在语音识别领域已经开展了长达二十余年的研究,积累了丰富的研究成果和突破。这次的Torque便是微软将这些研究成果快速集成和转化成产品的又一个佐证。说到Torque,黄学东是一个不得不提的人物。作为微软的杰出工程师,黄学东现如今不仅担任微软公司的首席语音科学家,还同时领导微软研究院工程技术研发团队,全面负责微软语音技术和人工智能技术的研发和产品转化工作。1993年,在卡耐基梅隆大学取得语音识别领域丰硕成果的黄学东以语音技术专家的身份加入微软,受比尔∙盖茨任命负责组建了微软第一支语音识别研发团队。两年后,语音识别的Speech API就被成功地第一次集成到了Window 95操作系统中。同一年,独具慧眼的黄学东将当时任职于苹果公司的语音技术专家洪小文招入麾下,成为微软自然交互服务部门的创始成员和架构师。两位又于1998年共同参与了微软亚洲研究院的前身,微软中国研究院的成立。如今,洪小文已经是微软亚太研发集团主席、微软亚洲研究院院长,全面负责微软在亚太地区的科研及产品开发工作,以及与中国及亚太地区学术界的合作。


加入微软后的长达10年时间里,黄学东一直不遗余力地推进语音技术的发展以及促进技术向产品的转化。2004年,成功实现了微软语音平台全面构建的黄学东将目光投向了更远处,开始担任微软研究院产品孵化、内部创新的总经理,以期将研究院的精尖科研技术快速带入市场并服务广大用户。 而后,黄学东投身于一场声势浩大的内部创新之旅,进入搜索这一全新的领域,开始担任必应搜索的首席架构师,负责下一代网络搜索技术的研发。2014年末,受公司任命,离开语音领域10年的黄学东重新回到微软研究院,开始全面负责微软语音技术的研发。Cortana和Skype Translator这两款被寄予厚望的产品,其核心的语音技术目前正由黄学东领导的研究院研发团队和相应的产品团队紧密地合作迭代着。


回过头来看黄学东的微软20年之旅,Torque这款小产品恰如他过往旅程的一个缩影——语音识别+移动搜索+产品创新,这正是黄学东在微软所走过的20年。而与20年前不同的是,语音如今已走到了人们的视野中心,逐渐成为人机交互的主流方式。Torque的推出对黄学东和微软来说有着特殊的意义:这是一种全新的移动搜索的方式,我们无法闭门造车,预测用户对其的认可度。验证它最好的方法就是将其尽快地投入市场。这一点也正体现了微软的文化演进——鼓励员工大胆尝试,不惧失败,不在应用平台上设限,将产品尽快地交付到用户手中并获得用户反馈作为检验其有效性的关键所在。


一个全面开放、充满创新活力的微软

2012年至今,从微软研究院创始人Rick Rashid在二十一世纪的计算大会上公开展示实时语音翻译技术开始,到Cortana,再到前不久的Skype Translator,基于微软语音技术的产品给用户一次次带来惊喜。但与以上基于微软操作系统或产品的Cortana和Skype Translator不同的是,Torque为安卓手机和手表量身打造。黄学东希望通过安卓平台,Torque能被更多的用户使用。为非微软操作系统的用户提供服务,这已经不是耸人听闻的事了。2014年,我们见证了一个全新的微软的诞生。在Satya Nadella上任后,微软开启了全面开放的新时代,在“移动为先、云为先”的战略下不断推出跨平台的软件和服务,给用户带来惊喜。就如Satya所说的——只要是有屏幕存在的地方,不管采用的是什么系统,都将有微软的服务——黄学东希望在安卓这个拥有广泛用户的平台上,作为创新产品的Torque能服务大众,快速获得用户的反馈,并不断优化更新。


(微软小娜用户界面)


Torque中文版由微软(亚洲)互联网工程院的人工智能团队负责开发,并与位于美国雷德蒙总部和北京的微软研究院的研究员展开紧密合作。这支团队同时也负责微软人工智能助手Cortana中文版(微软小娜)本地化和开发,对于满足中国用户的本地化需求有着丰富的经验。目前Torque中文版本的迭代正在紧锣密鼓地进行着,每个星期都会推出一个新的版本。这支深根于本地的人工智能团队由曾担任微软雷德蒙研究院ISRC(Internet Service Research Center)组的研发人员的杜奕瑾领导。杜奕瑾也曾担任美国国家卫生研究院人类基因研究所程式组长,是台湾批踢踢(台湾最大社交网络)和番薯藤(第一个中文搜索引擎公司)的联合创始人。对于这次如此一拍即合的合作,杜奕瑾说:“必应大数据平台和人工智能技术为微软的人工智能产品提供了强劲的大脑,我们将其与微软研究院20年的语音技术积累通过Torque最简单也最自然地集成在一起,希望能为人工智能在中文市场的发展开创一块新的版图。”在微软总部密切关注着Torque中文版开发的黄学东表示:“中国将会是未来全球人工智能产品最大的市场,开发Torque中文版体现了我们对中国用户的承诺,同时我们也希望在用户的帮助下,我们能够快速提升和进步。微软研究院与中国的人工智能产品团队合作十分融洽,双方的全力投入使得中文版本很快得到了实现。”


结语

Torque为下一代的移动交互方式提出了新的构想,它或者还不完美,还有待提升,但它的问世不仅折射出了语音技术的兴起之势,透过它,我们也看到了一个开放的、崇尚极客创新的“新”微软!


那么,你还在等什么,赶快点击“阅读原文”下载试用吧!温馨提示,如果您摇晃手机后没有看到弹出窗口,请将Torque添加到您的手机安全和隐私设置“信任的应用程序”中再试用。




技能分享:长按屏幕中下方的二维码即可直接关注我们,get了吗!

如果觉得好,就鼓励一下作者吧


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存