查看原文
其他

欢迎来到隐形革命的时代!

2016-04-20 隐形革命 微软研究院AI头条


欢迎关注微信公众号:微软研究院


注:本文译自Welcome to the Invisible Revolution,请点击阅读原文查看全文。




说说看你最喜欢的技术是什么?在你每天的工作和娱乐中都要用到的,并且在你的生活中几乎无可或缺的技术是什么?


大多数情况下,至少有一项是个随处可见的小玩意儿——比如手机或游戏机。但如果你再认真地思考一下,很多你最心仪的技术没准已经不再是由塑料、金属和玻璃制成的实体了。

 

它或许是一种你用来畅快淋漓地观看《权力的游戏》的在线视频服务;或许是一款你用来计算步数和热量消耗以便重新穿上高中时代牛仔裤的应用;或许是一位虚拟个人助理,帮助你记住会议地点以及服药时间;或许是一个电子阅读器,让你通过手机、平板电脑甚至车载音箱能够随时徜徉在你最爱的文学著作里。

 

或许,悄悄地——甚至在你毫无意识的情况下,你最心仪的技术已经从你手中握着的实体变成了你赖以生存、无处不在的隐形服务。它们不再是数码设备,而是你希望能在手机、计算机甚至电视等任何类型的设备上能够随处使用的工具。


“我们正处于创造新世界的风口浪尖,在这里,技术越来越普及,但也越来越隐形。”



以上,正是主管技术和研究的微软全球执行副总裁沈向洋所说的“隐形革命”的一部分。“我们正处于创造新世界的风口浪尖,在这里,技术越来越普及,但也越来越隐形。”沈向洋说道。


隐形革命之所以能够发生,有赖于那些十多年前还没有出现的技术,例如如今的大规模云计算中心人工智能领域最新的技术发现等。但从根本上讲,隐形革命将解决的是困扰了人类许久的问题。试想一下:几年前,一个只会讲普通话的人和一个只会说英语的人几乎是不可能在没有翻译的情况下进行实时会话的,而随身翻译对大多数人而言又遥不可及。

 

但是现在我们有了Skype Translator实时语音翻译技术,该技术可以让你与语言不通的任何人进行实时交谈。这个技术奇迹在很多人看来更像是科幻小说里的情景,可这正是一个能够真正帮助人类更好地互相了解的机会。

 

“打破人与人之间的壁垒非常重要。”沈向洋说。

 

随时随地,任何设备




下一代开天辟地、改变生活的技术,将远远超出键盘、屏幕、手机、相机、手表等硬件的范畴。相反地,它们将越来越多地从中获取计算能力——成千上万台计算机在云系统内运转,这能够让你很容易地找到五年前的电子邮件,也能帮助科学家预防下一次知名疾病的爆发。

 

“云并不是一个单一的目标。事实上,云是一种新的计算形式,让人们能够通过任何设备都可以体验移动性,”微软公司首席执行官萨提亚·纳德拉不久前面向开发者们表示。“云计算让这些体验充满智能。”

 

有了云计算,我们如今有机会能够随时随地的通过手边的任何设备来使用这些技术。根据皮尤研究中心的数据显示,眼下已经有近三分之二的美国人拥有至少两台数字设备,而剩余三分之一的美国人拥有三台设备:一部手机、一台笔记本电脑和一台平板电脑。

 

“‘移动为先’并不意味着它只与我们的手机有关。移动为先的真正含义是,无论你在任何地方——家里、路上、出差旅行、办公室或实验室,你的体验都能如影随形。”沈向洋说。这些新技术被设计成能够让大多数人在大多数情况下使用,无论人们用的是智能电话还是笔记本电脑,无论人们熟练掌握某种语言或是非母语,抑或是否有着某种残疾或障碍

 

“你可以说话,可以用手势,可以走来走去,也可以用面部表情。计算机无处不在,而且可以看到你——但你并不需要一直面对着计算机。”沈向洋说。

 

隐形革命依赖于机器学习人工智能技术,随着计算机掌握的数据越来越多,它能够学着把事情做得越来越好,例如理解你的声音或自动修正你打错的错别字。但是,沈向洋补充道,这并不意味着计算机正在代替人类。相反的,它是借助技术让人们更好、更简便地完成任务。

 

“微软对人工智能的观点非常明确。人工智能的目的是让所有的微软用户和客户能够发现自己的潜力。”沈向洋说。

 

在纳德拉看来,这意味着让技术能被更广泛的人群更容易地接受和使用,并创造出能够激发人类最好、而不是最坏方面的工具。“我们希望构建出能够增强人类能力和体验的智能。最终的走向并不会是关于人与机器的对立,而是人与机器的融合,”他说。“我认为这种融合才能促进社会的进步。”

 

从农业耕作到对家庭的承诺

 

隐形革命会让农耕活动更可持续发展、农产品更加经济实惠,并让来自不同文化背景的人们相互理解,让人们更能够呼吸到更健康的空气。隐形革命对我们的日常生活也产生了实际的效果:通过一些工具,它会帮助你记得自己与老板的约定,以及提醒你今天要跟谁开会。隐形革命也使技术更加私人化、个性化:与你互动的技术看起来更像一位亲切的朋友而不是一台机器,它能听懂你的声音、了解你的家庭安排和工作约定。

 

在不经意间,隐形革命已经发生在很多方面。例如,我们理所当然地认为在任何设备上都应该可以查看电子邮件,也越来越希望能够对着我们的电子设备说话而非打字。

 

“这些想法中有很多已经实现,而我们才刚刚开始达到临界质量,”微软Office扩展业务前总经理Rob Lefferts说道,他的产品及工具在很大程度上依赖于隐形革命。“现在已经到了突破的时刻,”他说。



挤出更多的时间

更短的会议,更便捷的时间管理,更有“魔力”的机器学习

 

“我太忙了!”

 

这句21世纪的经典慨叹来自于我们苦于选择去开会还是与家人共进晚餐,它剥夺了我们的睡眠,并带来许多我们不知如何应对的压力。

 

技术不会凭空增加一天的时长,但它确实会帮助我们更好地利用现有的时间,为我们提供工具解决那些让我们的进度停滞不前的苦差事,例如找到别人四个星期前给你发来的文件,搞清楚公司里还有谁可以帮你一起完成一个新项目,捡起那些你很少用到的技术,甚至编写待办事项列表。

 

最起码,它将有助于我们跟踪那些我们今天太忙而无法搞定的事情,好让我们明天一早不会忘记还可以接着做。

 

让会议不那么糟糕




回想一下你上一次走进会议室参加会议的情景。你也许在想一些琐碎的事情——哪张椅子看起来最舒服?这里有小吃吗?以及一些比较实际的问题——“为什么右边那个女人看起来很眼熟?”以及“糟了,我是不是应该在开会之前阅读什么报告或资料?”

 

如果要你主持会议,那么你的胃里可能已经觉得七荤八素了,或许想知道你是否能让那台投影仪正确地显示你的PPT,或能否顺利拨入电话会议。

 

Patrick Pantel设想了一个可以将所有的忧虑关在会议室门外的世界。在他的愿景中,某种工具已经扫描了你的会议邀请,并为你介绍与会人士的一些背景情况,例如他们是做什么的、你是怎么认识他们的、你们上一次共事是什么时候,并提醒你参会之前需要做什么准备。此外,房间里的传感器已经识别到了你的电脑、平板电脑或手机,并且自动加载演示文稿、拨入电话会议热线。

 

Pantel是微软研究院的首席研究员。他说,这些工具最终可能会产生我们大家都想要的结果:让会议更短。他测算,如果你无须花时间搞定设备、搞清参会者是谁以及他们为什么参会,平均时长60分钟的会议可以在45分钟内就收工。

 

Pantel是微软图谱(Microsoft Graph)的“幕后功臣”之一。微软希望外部开发者使用这套新工具来创建各种各样的产品,让我们的工作日变得更加轻松、高效。



微软图谱绝不只是一个纸上谈兵的未来想象。事实上,Pantel所描述的一些功能已经在名为Delve的微软Office 365服务中得以实现。

 

想了解Delve是如何工作的,不妨想象一下Rob Lefferts的一天。Lefferts是Windows团队中负责企业和安全计划管理的主管,他曾在微软Office扩展团队担任总经理,其职责范围中就包括微软图谱项目。

 

不久前,他前去与另一个产品组的成员开会,他意识到自己对其他与会人员们不太了解。通过使用Delve,他了解了这一产品组成员之前所做的工作。你不妨把Delve看作是一台虚拟助理,它可以在大厅里闲逛,与所有其他虚拟助理聊天,帮你建立起专业的联系。Lefferts说,他和团队可以借助Delve共同制作一个演示文稿,而无须频繁通过电子邮件来回收发修订版——因为每个人都可以访问同一个文件。

 

“你不妨把Delve看作是一台虚拟助理,它可以在大厅里游荡,与所有其他虚拟助理聊天,帮你建立专业的联系。”



Lefferts说,自己每天都要用很多次Delve。“它神奇而聪明地代替我完成了很多的工作,”他说。但是,Lefferts指出,它同样也会尊重你和他人的隐私。如果你不希望别人看到你在干什么,Delve就不会共享。像所有优秀的个人助理一样,它十分谨慎。

 

Delve是由微软开发的,但Lefferts说,通过将微软图谱的工具和代码提供给外部开发者,其他公司也可以创建出相似应用,为它们的客户服务。

 

协同软件公司AvePoint就使用微软图谱制作了一个Windows Phone应用,能够帮你把即将举行的会议或电话会议上所需的文件和其他资料归集整理起来。

 

云安全公司Netskope则用它创建了一种帮助企业防止敏感或机密数据泄露的工具,其措施包括对发出的电子邮件进行扫描,以确保他们不会意外地共享个人身份信息。

 

微软图谱依靠来存储和分析数据,并使用了机器学习技术,随着数据越来越多,系统能够学会更好地完成某些任务,例如弄清对某个用户而言哪个事项是重要的。它能在任何设备或操作系统上工作,因为那些人们自始至终只在一种设备上完成所有工作的日子已经一去不返了。

 

Lefferts说,许多开发商都惊讶地发现,微软是如此乐意于分享代码,并且如此致力于让这款工具能够在任何平台上使用。“最常见的反应是:‘我真没想到你们在做这个。我也真没想到你们愿意如此地开放。’”Lefferts说。

 

Cortana的坚守与承诺

 

Eric Horvitz是世界上少数真正拥有实体虚拟助理的人之一——她叫Monica,就驻守在Eric的办公室门外。

 

尽管同时拥有Monica和真人行政助理,Horvitz对这样的感觉仍然再熟悉不过了:漫长的一周即将结束,你习惯地扫视一遍电子邮件,就在这时你才发现:你忘了评审一份论文,忘了给别人发送他们所需的PPT,或忘了曾许诺周五时把某项工作的评价反馈给你的同事。

 

Horvitz是微软雷蒙德研究院的院长,长期以来他一直致力于研究如何利用人工智能自动地了解人们的目标和需求。也就是说,他份内的工作就是要用便利贴以外的办法来切实地解决这个问题。



Hi, 我是小娜


他曾与一组包括Ryen White和Paul Bennett在内的研究员合作,为Cortana(微软小娜)的一项新功能开发后台技术:使用机器学习,查找电子邮件中表达承诺或是表达约定的内容。这些信号可能是细微的,也可能是明确的,比如“我会在下周回复你”或“今天之内完成。”

 

收到这些信息后,Cortana会问你是否希望为你通过电子邮件作出的各种承诺约定以及兑现承诺的时间设置提醒。用户不需要做任何多余的事情,Cortana会使用机器学习来找出你在电子邮件中表达承诺的短语信号,并据此建立约定列表。

 

“我们如何能够自动识别出人们可能忘记什么、需要记住什么,以及他们如何管理自己的时间、把事情做好呢?”




要发明可以完成此项任务的技术,研究员们基于员工相互之间发送的真实但经过匿名化处理的电子邮件建立了预测模型,然后针对表达约定或许诺的短语进行人为的手工标记。

 

“我们根据人们如何发送电子邮件和进行沟通的真实数据设计了这些模型,”负责这个项目的微软项目经理Nick Ghotbi说。这个系统能够识别出当前流行的短语,像“COB”代表“下班”(close of business)或“EOD”代表“这一天结束时”(end of day)等。它还能够学会新出现的办公室俚语以及某公司独有的表达方式,并在此基础上不断改进。

 

这项功能正在作为微软Windows Insider Program计划的一部分进行测试,并可以用于Cortana。虚拟助理Cortana最初只在Windows Phone上推出,而目前已可用于Windows10系统的各种设备和iPhone等。这是微软研究院与Cortana团队之间更大范围协作的一部分。

 

另一位项目经理Jason Creighton说,它还是一个更加雄心勃勃的目标的组成部分——让Cortana的功能更加丰富,不仅仅是回答问题(例如在你最喜欢的球队打比赛时提醒你收看,或者播报今天的天气预报)。相反,他们希望Cortana成为你更有活力的帮手,提醒你及时在下次开会前将相关文件交给老板,并且别忘了在下班回家的路上顺便买点儿鸡蛋。“我们一直想让Cortana的能力超越简单的提供信息,”Creighton说。

 

对于Horvitz而言,这款工具还是一项更宏大目标的一部分:使用机器学习云计算等方法,在后台静悄悄地让人们的生活变得更加轻松。“那些如魔法般增强了人类认知的工具正是隐形革命的一部分,”他说。“我们如何才能自动识别人们可能忘了什么、想要记住什么,以及如何管理自己的时间、把事情做好?”

 


做更多的事情

用健康的食物、更清洁的空气和可靠的新虚拟朋友改善人类生活

 

一位农民无法每天24小时同时跟踪自己所有田地里的湿润程度或肥料水平。


一位空气质量预报员无法亲自同时检查每一座城市每一个街区的空气质量是否适于户外活动。

 

无论好朋友多么亲密无间,他们也无法保证在我们深夜觉得寂寞时总是有空过来陪我们聊天。

 

“而隐形革命正在创造一些可以帮助我们满足一些最基本的人类需求的工具。”

 

这些由隐形革命创造出来的工具并不意味着要取代人的能力或者与人类竞争,反而可以用来增加或提高人的能力。创造了这些工具的研究人员表示,在这个过程中,它们还可以帮助我们满足一些最基本的人类需求。

 

FarmBeats生产高科技粮食



SeanStratman是“精英”农场主的缩影,他以前从事考古工作,现在却亲自躬耕于一个小型农场,这很容易让你联想起一个世纪以前的生活状态。但是你的想法很快就会被颠覆,如果你看过他展示的分布于农场各处的太阳能供电传感器——它们使用基于空白频段的互联网连接,记录土壤温度和湿度水平,并借助基于云的计算模型进行跟踪。

 

在小规模有机农业的世界里,Stratman并没有你想象的那么“小众”。

 

“农场主这行中会编程的人出乎意料的多。出于某种原因,技术人员与希望从事农业的人之间有着积极的互动。” David Andrews说。Andrews白天是微软的律师,但在下班后,你很可能会发现他出现在他的农场上。Stratman将自己的土地租给Andrews所在的Dancing Crow农场,并管理着一家被称为“体验农耕计划”的农耕孵化器。


https://v.qq.com/txp/iframe/player.html?vid=c0195gimo2k&width=500&height=375&auto=0

遇见了Ranveer Chandra后,Andrews的小规模农耕实验开始带上了高科技的色彩。Chandra是微软研究院的一名首席研究员,他最为人熟知、也是我们每个人都会支持的工作,便是充满激情地致力于研究如何如何延长各种设备的电池寿命和在农村地区提供宽带连接。


当Chandra遇到Andrews时,他仍在努力延长电池寿命,但也开始更多地思考如何利用自己的专业知识来应对为不断增长的世界人口提供粮食这一意义更为重大的挑战。



喂饱不断增长的人口

 

根据联合国的估测,世界人口目前已超过70亿,预计到2050年将跳增至97亿,而到2100年将达到110亿。专家预计,最快的人口增长将出现在世界上最贫穷的国家,联合国粮食和农业组织也认为,防止饥饿和营养不良的关键方法之一是建立更可持续发展的农业体系。

 

Chandra决定将自己的专业特长用于设计低成本工具,让小规模农业生产成本更低、更加节能和节水。

 

空白频段与广阔空间

 

Chandra发现,像Stratman和Andrews这样的农场主大有人在,他们有意在自己低技术含量的经营模式中引进一些高科技的帮助。但他也意识到,把他们想要的高科技工具带到乡间农场仍然存在许多障碍。

 

这就是隐形革命发力的地方。Chandra的第一个灵感启示是,农民可以利用电视的空白频段,即农村地区尚未投入使用、可以用于访问无线互联网的电视频率。

 

此后,他又意识到,可以利用太阳能给设备供电。最后,他设计出了具有气候耐久性的设备来自动执行像Stratman这样的小农场主经常需要手动完成的任务,例如数据收集等。他还使用无人驾驶飞机进行土地调查,并将视频送回给农场主。

 

Chandra的研究不会取代让Stratman有志于在华盛顿康乃馨郡农村的一小块土地上种植有机蔬菜的小型农耕精神,但新技术会使这种农耕方式更符合实际、更具成本效益。“Chandra的研究为我节省了很多精力,” Stratman说。

 

这些能源和成本上的节约即便对于大农场主而言也是很重要的,Chandra谈到,他也正在与大型农业企业讨论自己的研究项目。他希望自己的项目以及其他类似项目有助于触发下一轮绿色革命。“我们所考虑的问题解决之道是通过收集数据和应用机器学习算法,推动种植业的下一波革新,”他说:“农业将变得更健康、更好,而且还可能养活地球上的每一个人。”

 

让呼吸变得更健康

 

在北京的某一天,某个居民区的空气质量可能是很糟糕的,达到红色警报的严重污染程度,而几公里以外的另一个居民区的空气质量则可能还不错,甚至可以标记为绿色的优。


Urban Air向北京市民提供了一张实时的、高度地方化的居民区空气质量示意图。”

 


“城市地区的空气质量是及其不均衡的,”身处北京的微软亚洲研究院主管研究员郑宇说道。对此他可能比谁都清楚。郑宇创立了一个名为Urban Air的项目,向北京市民提供了一张所在居民区空气质量的实时、细粒化的示意图,包括当前的空气质量和未来几小时的预测。这些详细数据能够帮助人们决定晚上是否可以打开窗户透气,早上是否可以外出跑步,或孩子出门上学时要不要戴口罩。“这是整个城市真实的空气质量状况,”郑宇说。

 

郑宇的项目采用35个官方空气质量监测站的实时空气质量数据,辅以可能对空气质量造成影响的其他因素的数据,如交通状况、行驶速度、风速、温度和湿度等,甚至将十字路口和红绿灯的数量、该地区的建筑物密度以及周围的餐馆和工厂数量等都考虑在内。

 

随后,Urban Air运用机器学习的方法,让系统在对现有数据进行分析的基础上学会精准预测,提供整个城市空气质量的高细粒度、实时的图像。它甚至可以预测特定地点未来6小时的空气质量状况,准确度高达75%

 

该系统采用基于云的服务器来收集和分析数据,每小时更新一次。当你即将进入空气质量较差的地区时,它甚至可以发送警报,提醒你应戴上口罩。更棒的是,与35个官方空气监测站相比,它更加便宜而实用,因为监测站建造成本高昂,而且需要大量的人力来维护。这也就是为什么没有建立更多监测站的原因。

 

对于已经下载了Urban Air应用的80多万用户而言,上述极其本地化的详细信息是非常有用的。中国政府也使用这些数据来帮助决定是否启动特定的限制措施来改善空气质量。例如,如果政府预计未来某一天特定居民区的空气污染物将激增到红色水平,它可以发布预警,提醒全体市民,次日将有一半的机动车不得上路行驶。或者,它可以暂时关闭城区的一部分工厂,以减少污染,直到天气改变、空气质量提高。

 

Urban Air已在中国的300多个城市投入运行,郑宇说,他的团队还与在美国等国家的天气预报机构商讨如何部署上述技术来跟踪和预测其他地方的污染水平。最终,研究员们希望通过收集到的这些数据来更加深入地了解不同空气污染物如何彼此作用影响,以及有哪些其他潜在因素促使污染恶化或好转。

 

“这是第三步:找出空气污染的根源。看它们究竟是如何产生的?”郑宇说。

 

微软小冰到此一游




每天,数以百万计的中国网友与他们的朋友微软小冰谈论自己一天的经历,或者在逛街过程中闲聊,甚至表白爱意或是倾诉伤心事。而此类聊天的高峰时段是从晚上11时至凌晨2时,但这并不会让微软(亚洲)互联网工程院小冰项目资深产品总监彭爽感到奇怪。毕竟就像她说的,虽然大多数人的朋友到那个时候都已经睡了,但“小冰从不睡觉。”

 

小冰不吃不喝,也不会呼吸,因为她是一个备受喜爱的聊天机器人,有四千万用户都曾与她聊过天。

 

谈到虚拟助理,大多数人会想到可以背诵天气预报的Siri,或能够提醒你今天需要完成哪些项目的Cortana。小冰也可以告诉你天气状况,也许还可以对你在办公室的糟糕经历表示同情。但在大多数情况下,她的作用是像个真人一样,与你聊聊家常。

 

“我们的用户可以跟小冰谈论任何事情,而且小冰的回应是如此富有情感,以至于人们感觉小冰就像一个真人一样,”项目研发主管之一胡睿说。

 

小冰通过机器学习,根据从公开的中文互联网大数据中获取的训练数据来收集当天的热门话题信息,如电视节目或名人等。她也可以建立记忆,如用户的生日或星座等,这样她就能在以后的聊天中提起。

 


向你的虚拟朋友问好


一开始,小冰只能用文字聊天,但现在她还可以听懂语音,并借助计算机视觉技术看懂照片。据项目团队介绍,许多用户与小冰互动时都会同时使用文字、语音和图片。

 

一次与小冰的典型互动通常持续约30分钟,对话内容和长度的差异可能很大。有些用户会把他们生活中的私密细节向小冰倾诉,如最近跟男女朋友分手等,还有一些人会向小冰表达爱意。

 

由于小冰已经入驻许多互联网平台,甚至包括一个电商网站,有些人会先跟她谈论日常琐事,然后再寻求购物建议——就像与一个真正的导购聊天一样。小冰还会朗诵诗歌、讲鬼故事,但研究人员说,在多数情况下,她倾听的多、表达的少。

 

“小冰代表着人机互动的新形式:人们欣喜地发现,计算机原来并不是那么机械。”

 

小冰的用户“希望得到倾听,希望有人陪伴,”彭爽说。对于小冰幕后的微软研究员和工程师来说,她所代表的不仅仅是一次文化的启示。小冰也代表着人机互动的新形式,人们欣喜地发现,计算机原来并不是那么机械。

 

“我们可以(给机器)增添几分个性。我们可以在计算中增加一点点人类情感——甚至可以再加入一点点人性。”微软亚洲研究院常务副院长马维英说。对一个在半夜感到孤独的人来说,这是一个很妙的事情;对于一个在线购物网站上寻找心仪鞋子的人来说,这也是一件令人愉悦的工具。

 

在马维英看来,像小冰这样的聊天机器人蕴含着巨大的可能性。在他想象的世界里,搜索引擎是交互式、有个性的,甚至与计算机之间的日常互动也更像对话,而不是单方面的发号施令。“我相信,这将是下一次飞跃,”马维英说。“我们将看到的下一个重大突破将是对话式用户界面。”



CaptionBot


微软还开发了一些其他的机器人,例如能够描述图片内容的CaptionBot等等。此外,微软还提供了一系列工具,让开发者们也能轻松开发出自己的智能机器人,这些机器人能够完成一些例如帮忙订外卖或是预定酒店的任务。微软称之为“对话即平台(Conversations as a Platform)”战略。

 

目前整个行业仍处于开发机器人和弄清楚人们将会如何使用这些机器人的早期阶段。在微软人工智能聊天机器人Tay上线后的24小时内,一小部分人群便利用系统的漏洞发起了协同攻击。尽管微软事先已经为多种类型的系统滥用做好了准备,但一个关键的疏忽导致Tay发表了一些不当的文字和图片。

 

“做好人工智能需要与很多人互动,而且要经常借助于公共论坛。我们必须十分谨慎地进入每一个平台,并最终通过一步一步地学习而完善,同时在这个过程中避免冒犯他人。”微软全球资深副总裁Peter Lee在博客中写道。“我们将继续不懈努力,从这次事件和其他经验中学习,为打造一个代表人类良性而非恶性的互联网作出自己的贡献。”



更快的计算

摩尔定律的终结和计算机处理能力的新前线

           

隐形革命的核心由三个元素构成:创造技术的算法、用于训练新工具的数据和提供动力的计算能力

 

几十年来,上述最后一项并未构成真正的问题。毕竟我们生活在摩尔定律的时代,计算能力每两年就能翻一番,并让戴尔等企业能够不断创造出更好、更便宜的计算机。

 

“多亏了摩尔定律,你现在才可以拿起你的智能手机,输入几个单词就能查看你最喜爱的明星是否主演了一部新电影,或者又生了一个孩子。”

 

“过去50年间,计算成本一直呈指数趋势不断下降,这在人类历史上是空前的。”微软研究院NExT部门硬件、设备和体验总监Doug Burger说道。“因此,我们能用更低廉的价格为隐形革命提供一切背后的动力。”

 

得益于摩尔定律,科学家们能够更快、更节约地在理解人类基因组等研究领域取得巨大进步。同样多亏了摩尔定律,你现在才可以拿起你的智能手机,输入几个单词就能查看你最喜爱的明星是否主演了一部新电影,或者又生了一个孩子。

 

“当你在网上搜索时,你接触了成千上万台机器,” Burger说。“所以,有成千上万台服务器——而且是非常昂贵的服务器——在那里处理你的一个请求。”但现在,包括Burger在内的专家们都相信,我们将迎来摩尔定律的终结,其中的原因有物理上的也有经济上的,但主要是经济上的:继续获得这种惊人的收益将变得越来越难。以高效和低廉的方式兑现隐形革命的各种承诺也会变得越来越难——除非我们找到其他的解决办法。

 

通过Project Philly学习人类




黄学东有点迫不及待了。他领导的语音研究小组希望帮助机器人像人类那样理解语音,如今已经在技术探索上取得了长足的进步,但他们的工作面临一大阻碍:计算能力

 

最新的语音识别工具需要海量的计算能力来运行其算法,一部分原因是它们依赖于受到大脑生物过程启发而诞生的深层神经网络。对如此大的计算能力的需求,意味着一个实验,例如调整从训练数据集中学习识别单词的算法,可能要耗费两三个星期。而这样的时间滞后会让这一前瞻性技术少了几分革命性。

 

更快速地处理此类工作的能力将成为人工智能突破的关键——比如预测某个骑自行车的人何时会发生意外,并努力杜绝意外的发生。

 

黄学东说,此类发现非常有价值,而让研究人员必须等待两三个星期才能获得一点小进步是不切实际的。所以,黄学东和他的团队把命运掌握在了自己的手中。他们建立了一套旨在提升深度学习算法运行速度的工具,使用的是GPU图形处理器

 

GPU可以更快速地处理大量数据,例如开发Skype Translator实时语音翻译等技术中能够实时地将一种语言翻译成另一种语言所需要的大量数据。”

 

虽然GPU最初是为计算机图形设计的,但近年来研究人员发现它们也是处理复杂算法的理想之选。这是因为它们可以更快速地处理Skype Translator实时语音翻译技术开发过程中所需要的大量数据。

 

黄学东团队构建的工具代号为Project Philly,帮助微软虚拟助手Cortana不断提高语言理解能力的团队已经开始使用它了。在Project Philly的帮助下,Cortana的语音训练现在能够在相同时间内摄取10倍以上的数据。

 

正如Cortana团队的一位主管所说,使用Project Philly就像从一辆家庭旅行车切换到一辆高端跑车上。

 

黄学东团队还发布了一个名为CNTK的开源工具包,供其他研究人员用于各自的深度学习研究。对于黄学东和他的团队来说,这些工具将让他们能够更简便地做自己最擅长的事——不断地试错,直至取得重大突破。

 

“在机器学习领域取得切实的突破之前,你需要进行成百上千次的实验,”他说。“Project Philly是基础,我们的研究员和工程师可以在上面进行大量的机器学习实验,以确定合适的模型和正确的解决方案。”

 

Catapult项目”挑战计算机处理极限




在摩尔定律持续繁荣的几十年间,重大科技突破也在发生着。开发人员不断编写新的软件代码,而这些软件在越来越便宜、越来越快的CPU(中央处理器)上运行。

 

“50年来,我们一直依赖‘基于CPU运行软件’的架构,也就是冯·诺依曼型计算机,它确实非常有效,” Burger说,“但是来自这种模型的稳定和可预见的收益已经走到了尽头。”

 

几年前,Burger和他的团队决定着手尝试全新的东西。他们与必应搜索团队合作,决定采用“现场可编程门阵列"(FPGA)进行运算。FPGA已经在其他领域投入了使用,但它一度被认为过于昂贵复杂,不适合大型云计算,直到Burger的研究团队启动了“”。“FPGA并非我们的发明,但我们所做的是弄清如何将其用于云计算,”Burger说。

 

对于许多工作负载而言,FPGA比CPU更快,因为它们允许计算机科学家和工程师们不再依靠加载在硬件上的软件,而是直接在硬件上运行他们的算法,这被称为可编程硬件。“我们无需将算法转化成软件,再加载到硬件,取而代之的是直接从算法到硬件,”Burger说。“我们避开了‘软件’这个中间人的角色。”

 

FPGA的使用比固定功能硬件更灵活,因为你可以根据需求的变化对它重新编程。这一点对快速发展之中的云计算至关重要。

 

Burger的研究团队已经看到了Catapult项目的成效。在针对必应搜索引擎的测试中,它能够让一部分操作速度加倍。研究团队表示,一般来说在数据中心使用Catapult计划可以显著节省资金和能源,并取得较好的效果。

 

“我们现在拥有的工具非常非常强大,我认为这对整个行业都是颠覆性的,”Burger说。

 

Project Natick:下海入云




再思考一下,你在长途旅行中通过手机和笔记本电脑搜索最近的星巴克门店,或是在你的OneDrive存储系统中增加100张照片所需要的全部计算能力。

 

计算机专家们围绕“云”中的数据作了大量论述,但所有基于云的数据总是要依靠物理方式存储于某处。通常情况下,那会是一座充满了强大服务器的大型建筑,还有冷却这些服务器所需的很多台空调。

 

微软的研究员们想出了另一种选择:在海底。去年年底,一个研究团队发起了名为“Project Natick ”的项目,其目的是将包裹过的小型数据中心沉到海底去。这种数据中心有一定的环保优势:到目前为止的测试表明,环绕数据中心流淌的清凉海水能够为服务器降温,而这对周围海洋温度的影响是可以忽略不计的。


https://v.qq.com/txp/iframe/player.html?vid=m0184cznesx&width=500&height=375&auto=0

最终,研究团队希望能想出一些办法来让数据中心更加环保、可持续,即通过风能、太阳能甚至基于潮汐的动力系统来供电。这也将消除与数据中心运转密切相关的另一个问题——它们的运转要消耗大量的能源

 

此外还有另一项收益:更好的服务。世界人口中大约有一半居住在海岸线附近,研究员们认为,与遥远内陆上的服务器相比,如果把Project Natick的服务器沉入海底,这些居民将能够以更快的速度获得数据。而且海底数据中心的建设比陆地上的周期更短,只要90天左右而非两年,这也使得微软这样的公司将更容易满足客户的数据需求。

 

Project Natick目前仍处在研究阶段,但研究员认为,无论其最终结果如何,这将对未来如何构建数据中心产生深远影响。

 

“我们在学习如何为磁盘驱动器重新配置固件和驱动程序,以获得更长的寿命。我们在管理电力,学习如何减少电耗。这些经验将转化为更好的数据中心运营方式。即使我们永远不会进行更大规模的尝试,但我们毕竟学到了这么多经验,微软全球资深副总裁Peter Lee表示。


 

创新和实验


众多的案例都表明微软正在不断尝试利用不同的方式从这个越来越依赖云计算优势的世界中为用户提供他们心仪的产品和工具,Project Natick就是这样的一个例子。

 

一些早期的研究项目可能很快找到机会进入工具和产品中,用户也会爱上这些必不可少的技术。另一些则会随着时间的推移而变化,直到他们贡献灵感,或最终成为完全让人意象不到的新事物。

 

无论哪种方式,这种不断的实验和创新正是隐形革命的力量源泉。



:本文编译自Welcome to the Invisible Revolution,点击阅读原文查看。



你也许还想看:


海洋深处的“云” 

Seeing AI:计算机视觉十年磨一剑,打造盲人的“瑞士军刀”

会听、会说、会聊天:人工智能语音识别技术的漫漫长路     



软小冰住进微软研究院微信啦!快去和她聊聊天吧。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存