专访微软全球资深副总裁:中国AI正在爆发式崛起,千万不要复制美国,要建立自己的模式,才能做领导者
记者 | 周翔
编辑 | 鸽子
近日,在微软亚洲研究院与哈工大共同举办的第十九届“二十一世纪的计算”国际学术研讨会上, Peter Lee 博士作为微软全球资深副总裁, 也来到了现场。
AI科技大本营非常有幸采访到这位微软研究院的核心领导之一。对话中,Peter Lee透露了很多信息。
谈到微软在 AI 研究和 AI 产业化方面布局这个问题时,他表示微软对新技术、新机会非常重视,投入得非常多,微软现在领先 20 年。
微软研究院每年在研发上的投入超过100亿美金,但走的事 “Small R(esearch), Big D(evelopment),即研究少,开发多的策略。
目前,微软暂无计划自己做自动驾驶汽车,只希望为其他做自动驾驶的厂商赋能。
关于芯片,微软只做两类,一类是给边缘设备端用的,另外一类是给云端用。“对于边缘终端设备,我们有一个 HPU,是给 HoloLens 用的,它是一个非常强大的3D机器学习的芯片。”Peter Lee在对话中谈到。
谈及微软人工智能及微软研究事业部的最新进展,Peter Lee提到两件事:
一个是刚研究出的新型卷积神经网络—— deformable CNN,“比如说都是狗,但是有的狗是在跑,有的是躺着的,有的是站着的,有的只有一个尾巴,这个时候一般的机器就识别不出来了,但 deformable CNN 就能认出来。”Peter解释道。
另一件事则是应用方面一个叫做微软 InnerEye 的项目,它能让放疗的放射束更精准地瞄准肿瘤,而不伤害好的组织。并且可以让放疗的时间从原来的 2 小时缩短到 10 分钟。
而对于中国的AI发展,他的评价非常高:
在中国,大家可能看不太清楚,但是我在美国,每年可能就来中国两三次,在我们眼中,中国的AI正在爆发式崛起,迅猛发展。
如果说这次AI泡沫不破裂,我有足够的理由相信中国将会成为 AI 市场的驱动力量。
中国不要去复制美国的模式,要真正建立起属于中国自己的模式,才能做领导者。
而在如何激励团队这个问题上,他则半开玩笑半认真地说道,“虽然我对我们开发的AI技术非常自豪,但是我也会告诉研究人员,我对着我的狗讲话的感觉还是比对机器狗、机器人讲话更有成就感。”
以下为AI科技大本营与Peter Lee的对话实录,AI科技大本营做了不改变原意的编辑,呈现如下:
微软的 AI 布局
AI科技大本营:您在微软主要负责什么工作?
Peter Lee:我是 2010 年加入微软的,我现在主要负责微软研究院旗下新体验与新技术部门(New Experiences and Technologies, 简称 MSR NExT)的工作,包括微软亚洲研究院、微软研究院新技术部(MSR Technologies)、FUSE 实验室、微软研究院特别项目部(MSR Special Projects)以及多个孵化项目团队。我的老板,也就是沈向洋,主要负责借助我们的研究能力来探索一些新的商业机会。
AI科技大本营:现在每年微软的研发投入是100多亿美元,所以我想知道AI的占比大概有多少,还有AI专门的研究人员大概有多少?
Peter Lee:首先它是研究和开发两部分,应该是比 100 亿美元再多一点的,但是开发部分实际上是包含了产品开发那部分投入的,所以这样比较下来,研究的部分可能占的就比较小了。现在只算到研究和开发,其实它的边界是比较模糊的,有一些基础研究可能是一周,有一些项目可能是十年这么长。我没有一个具体的数字,但是分到研究的部分是少的,分给开发的部分是多一些,所以我们常说“Small R(esearch), Big D(evelopment)”。
说到 AI 专门的研究人员,今天另外一位嘉宾 John Hopcroft 博士,图灵奖的获得者,两年前他是做计算机科学理论研究的,但是现在也在做 AI 。因为 AI 确实吸引了太多人的想象力,现在每个人都在想着怎么做 AI,所以可以说几乎每个人都是和 AI 沾边的。
AI科技大本营:微软在 AI 研究和 AI 产业化方面有怎样的布局,最看好哪个领域?
Peter Lee:其实现在我们对于人工智能的理解还处于比较早期的阶段,还有很多关于人工智能的东西是我们不理解的。微软希望提供工具和一些基础框架,能够让其他人借助于此来进行进一步的研究。
现在的大型科技企业要么是在研究实验室这方面进行了大量的投资和投入,要么也都是对于这些新的技术、新的机会非常重视,投入得非常多。我觉得微软现在领先 20 年。
AI科技大本营:现在 AI 领域不只包括深度学习算法,还包括 AI 芯片,比如说谷歌的 TPU 和苹果的 A11 Bionic 芯片,微软在芯片领域有自己的规划吗?另一个是自动驾驶领域,微软一直没有什么动作,未来会如何布局?
Peter Lee:关于 AI 芯片,我们有两类,一类是给边缘设备端用的,另外一类是给云端用的。
对于边缘终端设备的,我们有一个 HPU,是给 HoloLens 用的,它是一个非常强大的3D机器学习的芯片。
在云这边我们的投入主要是在 FPGA 上。在两个月之前,我们还发布了一个深度学习项目,叫Brainwave,它能够做这种实时的深度学习。现在已经用我们这个 Project Brainwave 来驱动我们的 Bing 搜索引擎了。
现在选择 FPGA 也是非常重要的一个决定,因为从发展的速度来讲,它已经远远超过了 ASIC 和 TPU,而且它也能够支持更灵活的变化,因为我们知道这种深度学习的算法也是在非常快地进行演进的。所以,我们觉得这个(FPGA)相较于 ASIC 和 TPU 还是有它的优势的。
关于自动驾驶。首先,很多大的主流汽车厂商都是微软的客户或者是合作伙伴,他们现在也都在做自动驾驶,他们所有部署的这些自动驾驶都需要云以及人工智能技术的支持。我们现在看到这些客户的工作进展也感到非常兴奋,不只是在自动驾驶这方面的进展,它给我们的云也带来了一些新的工作流。
当然对微软来说,我们没有计划自己做自动驾驶汽车,但是我们非常愿意为其他做自动驾驶的厂商提供技术支持。我们不希望和我们的顾客进行竞争,而是希望结成合作伙伴关系。
微软亚研院的分工和定位
AI科技大本营:据我了解,微软去年成立了 AI&R(微软人工智能及微软研究事业部),他最重要的研究方向和研究任务是什么?
Peter Lee:在过去很多年间微软在 AI 的研究领域都做了大量的投入,但是在过去这几年我们希望有更多重点的研究领域。所以,AI&R 可以分为五个目标。
第一个是希望能够把 Bing 以及 Bing 搜索引擎的这部分收入提高一倍。而且,不光是从Bing当中赚取更多的收入,还要将 Bing 整合到其他的微软产品中。
第二个就是希望增加聊天机器人或者是智能助手小娜的使用量。我们希望每天能够有十亿人使用我们的聊天机器人。
第三个目标就是能够把人工智能融入到我们所有的项目和服务中去。比如说在今天早上我讲话的同时就立刻能打出中文字幕,这个就是由我们 AI 的技术所支持的,我们希望把这个技术用到我们的 PPT 或者是其他的产品当中。
再有就是我们希望能够进一步普及我们的AI技术,能够创造更多的工具和平台,能够让每个人都使用到AI技术。
第五个是我主要负责的一块,叫研究孵化,主要是能够找到一些新的发现和一些新的商业机会。
AI科技大本营:微软去年成立了AI&R部门之后,这一年多来有哪些进展吗?
Peter Lee:进展有很多,包括基础研究层面以及应用层面。基础研究层面有很多,没法一一列举。但是我还想讲一个,我们研究出了一个新类型的卷积神经网络—— deformable CNN(可变形卷积网络),它有很多应用的范围,比如在计算机视觉方面,比如说都是狗,但是狗有的是跑的,有的是躺着的,有的是站着的,有一些只有一个尾巴,那个时候机器就无法识别出来,但是人可以知道这都是狗,而新的 deformable CNN 神经网络就能很好地解决这个问题。
应用方面也有很多进展,其中我们有一个叫做微软 InnerEye 的项目,就是利用高级计算机视觉的技术,帮助放疗变得更加精准,使得放疗的放射束能够更精准地瞄准肿瘤的部分,而不伤害好的组织。我们可以让放疗的时间从原来的 2 小时缩短到 10 分钟。
AI科技大本营:微软亚洲研究院和其他研究院的分工有什么不同吗?主要专注于什么?
Peter Lee:亚洲研究院这块属于刚才我讲的第五个目标,也就是叫做研究孵化。但是,亚洲研究院本身也是非常特别的,它有几个特别之处,首先是它从研究的质量、人才、研究的效率方面,这几个因素结合起来,可以说是全球最高的一个研究室。
AI 现在在中国的势头非常猛,微软亚洲研究院一方面促进推动了这个势头,另一方面也从这个势头中获取能量,所以说亚洲研究院处在一个非常特殊的位置。打个比方,父母可能对每一个子女的爱都是平等的,但是有些时候还是会给某个子女特殊的关照,亚洲研究院就是这样一个地位。
竞争与合作
AI科技大本营:现在除了微软之外,其他的一些公司,比如说Google、百度、阿里巴巴,他们也都想做平台化的公司,您认为什么样的平台化的公司最后才能胜出?微软主要努力的方向是什么?
Peter Lee:我觉得最终每一家企业都能胜利,但是这里很重要的是一定要进行大量的基础研究投资。我们微软在这方面已经进行了大量的投入,而且还在不断地增加我们的投入,谷歌也是如此。
在现在这个阶段很重要的一点是吸引更多的AI人才,有的时候你也要承诺给这些研究人员,让他们可以在任何场合开放地谈自己研究的项目,去发表他们的论文,可以和任何人谈论他们的研究。
各大公司或研究机构的这些研究人员彼此也是有竞争的,他们也想自己的研究可以胜出,但更重要的是大家是朋友,也是同事的关系,包括我们和阿里巴巴、亚马逊、谷歌这些的关系。所以现在是非常特殊的一段时期,尽管我们在竞争,但我们其实也是联合起来一直想为世界带来更有价值的AI技术。
AI科技大本营:现在AI竞争这么激烈,微软是靠什么去吸引顶尖的AI人才,又是怎样防止顶尖AI人才的流失?
Peter Lee:我们自己觉得自己还是非常幸运的,而且我们相信微软的号召力量非常强大,不只是在全世界范围内,在中国,微软的号召力、招募力也非常强。
我们当然对于人才也是有选择性的,我们会选择中国最顶尖高校的最好的这些人才,而且往往我们选择了他们,他们也会选择我们。
我们的优势是这些人才加入微软或者是加入微软研究院之后,在他们整个职业生涯当中都会做得非常成功。如果你看一下现在中国的这些大的科技企业,大部分身居要职的领导们都曾经在微软有过一段经历。所以我们觉得如果你是人才,微软选择你,你一定要来我们这儿工作。
我们也非常希望一代又一代的新一代的人才不断地流入我们微软研究院。当然有一些人他们成长了之后,到一些其他大的企业,甚至还和我们微软竞争,但是他仍然是我们微软大家庭的一分子。
AI科技大本营:刚才谈到竞争,现在谈合作。微软最近跟亚马逊在AI方面的合作很多,比如说微软的Cortana 和亚马逊的 Alexa 是可以互相唤醒的,为什么微软会选择和亚马逊在 AI 方面进行合作?未来微软和亚马逊在 AI 方面是否还会有更多的合作?
Peter Lee:首先从战略的角度来说,我们希望我们的AI技术可以很开放,微软云完全可以支持我们所有的开放,我们有 CNTK,同时也支持TensorFlow、Caffe 和其他的工具。
提到我们和亚马逊Alexa的合作,在智能助理这方面,Alexa它主要是能够提升购物体验,我们希望能在 Windows 10 上,在电脑桌面上就实现这种购物的体验,借助于我们的 Cortana(小娜),与亚马逊的Alexa实现合作。
还有就是 Bing,Bing 也能让 Alexa 从中获得补充优势。
微软是一个开放的平台,开放对于鼓舞内部士气非常重要,因为研究人员都喜欢开放的氛围。
从业务的角度来说,与Alexa的合作,是一种很好的商业化方式,能提升我们在云消费上的增长,帮助我们赚到更多收益。从这个角度来看,这会让我们的股东也更加满意。
AI 发展到哪个阶段了?
AI科技大本营:现在AI的很多技术已经发展得很好了,但离应用还是差那么一点点,您是怎样看待现阶段 AI 应用的用户体验?
Peter Lee:用户体验非常重要。虽说人工智能,特别是机器学习这一块发展得非常快,但是大多数的人工智能系统还是非常脆弱的。刚刚提到的这种脆弱性就会大大地削弱影响到用户的体验。
举个例子,比如你问一个聊天机器人一个问题,你想规划自己的旅行,想订机票,你问他从哈尔滨飞北京都有哪些选择,它会回答你,但是如果你再追问一个问题,这些机票哪些是最便宜的?它可能就不知道如何回答你了。这就是它的脆弱性的体验。
还有,机器在理解人的意图和需求方面,还有比较大的挑战。
当然,我对我们开发的AI技术非常自豪,但是我也会告诉研究人员,我对着我的狗讲话的感觉还是比对机器狗、机器人讲话更有成就感。所以我们还是要继续往前推进AI技术,最终能让人真正地感到他们的需求被满足了。
这种实验性的项目,比如小冰,他们不光是要解决人的问题,而是希望最终能够真正了解人的需求。
AI科技大本营:AlphaGo Zero 不需要从人类的对局经验和数据中进行学习,你觉得这是未来的趋势吗?
Peter Lee:这确实是个非常热门的话题,现在我们也非常想让AI能够学习某些问题或者是某些结构,现在在我们的实验室当中在进行对偶学习的研究。对偶学习,比如说将英文翻译成德文,就能够使用在德文中的英文知识来进行对抗式学习。
我们从研究中发现,相较于从人类直接获得训练数据,这个方法在实验结果上表现得更好。从人类的行为中获得训练数据,首先它的成本非常高,非常昂贵,还有就是有隐私方面的风险。而在对偶学习的研究中,我们发现机器学习通过无监控的自我学习,无数据的学习,有时候是能创造新的可能的。
比如,在你能非常具体地定义某一个任务,比如打游戏,或者翻译任务时,就能让机器在没有数据支持的情况下来进行自我学习。
但是,如果这个任务很复杂,或者它本身属于开放性的问题,比如做一个商业决策,或者是给一个行业公司进行业务规划,对于这类没有清楚定义的广泛型的问题,我们还不知道 AI 这种学习模式能否可行。
AI科技大本营:现在有学者认为AI还处于比较低级的模仿人的阶段,它还是一种形似,不是神似,您是怎样判断 AI 现在的发展阶段?
Peter Lee:首先大多数现在的AI都是基于机器学习的,而大多数现在的机器学习又是源自于大数据的。现在大多数的大数据又是人类活动和思想的一种输出。所以,就像您刚刚提到的,有些学者的说法从某种意义上来说也是对的,AI 现在还在模仿人的行为,而不是去有自己真正的一些思考、思想。
不过,在我们的研究实验室中,我们正在研究一些更为高级形式的机器学习。
比如,暂时不让 AI 从数据中进行学习,而是从它的任务结构中进行学习,我们会发现,这些 AI能 产生自己的想法,一些并不是从人身上学到的想法。
AI科技大本营:您认为有没有很完美的人工智能,或者它的实现还要多长时间?
Peter Lee:这个问题可能比较难回答,现在更多人可能是想着奇点来临的问题。机器的智能已经超越了人,或者是超越了人自己能够理解的范围。但是我们现在不知道的是这种人工智能的潜力是否有局限性,是否有一个边缘,比如我们知道光速和声速是有局限,有边缘的,但是我们不知道的是AI的潜力是否有局限性,也就是因为不知道,所以可能对于是否有完美的 AI 或者是要有多久才能有完美的 AI 这个问题很难回答,我们唯一能确定的是这种机器智能和人类智能是非常不同的。
中国的 AI 是否存在泡沫?
AI科技大本营:Peter您是怎样看待中国AI发展的,与美国相比又有哪些差距?中国的AI创业方面是否存在泡沫?
Peter Lee:从我的职业生涯来讲,AI泡沫已经发生过几次了。但是这次和以往几次经历的泡沫不同,尽管现在的AI,从掌握的知识上来看还比较早期,比较初步,但是现在已经有非常成功的AI应用能够影响到人类,并且已经产生了非常成功的商业模式,不仅仅是对于微软,对于很多其他公司,这是以前的泡沫没有经历过的。
我无法预测说这个泡沫会不会破灭,但是现在我们比较清楚地看到了整个AI行业已经有一些成功的商业产业从中能够赚到收益了。
关于中国,我想说两句,在中国,大家可能看不太清楚,但是我在美国,每年可能就来中国两三次,在我们眼中,我看到了中国AI爆发式的崛起和非常迅猛的发展。
如果说这个泡沫不破裂,我有足够的理由相信中国将会成为 AI 市场的驱动力量。
如何评价阿里的达摩院?
AI科技大本营:阿里巴巴最近成立了专门研究AI方面的达摩院,说未来达摩院要自营自立,Peter是否认为大公司的这些研究院可以做到自营自立?这个研究院以商业化为目的的研究和基础研究之间要如何平衡?
Peter Lee:我觉得首先阿里巴巴是做了一个正确的决定的。比如说以微软为例,大概在20多年之前的时候还是一个10亿美元市值的企业,我们就已经决定要成立微软研究院了。虽然说阿里巴巴做这个起步比较晚一点,但是我觉得他们会做得很好。
关于如何来平衡,在微软研究院我们分为两块,一个是偏研究,一个是偏应用。
偏研究这一块是很独立、很自由的,可以去探索任何感兴趣的研究领域。
偏应用这一块是我的同事、我的朋友,微软研究院院长及技术院士 Eric Horvitz 来负责的。我们希望利用技术,直接来做一些项目,做一些改变。
有些时候我们也竞争或者是争吵,有些时候我们会非常紧密地来合作,但是我们之间的摩擦也往往能够给微软带来一些非常重要的影响。事实上,我们用于语音识别的技术就是来自于这种摩擦。
所以具体来说这两块具体怎么平衡?是 50:50,还是 60:40,还是 35:65,不好讲,但是这两部分的争论也好,或者是摩擦也好,最终都将提升我们生产力的效率。我猜阿里巴巴也能从我们这里学到很多东西。
AI科技大本营:自营自立的研究院是可能的吗?
Peter Lee:现在虽然说大家都在探讨 AI,这是非常令人兴奋的,但是有这样一个倾向,可能有的研究员更倾向于一些短期的、实际的能产生技术影响力的研究,虽然我们不可能直接告诉这些研究人员说“你们不要只想着短期的实际影响”,但我们确实希望他们能更多 57 33406 57 19068 0 0 7014 0 0:00:04 0:00:02 0:00:02 7012从长期的、更基础性的课题出发、做一些关于AI的深入思考、做一些深入的研究。
每个公司的企业文化不同,是因为它的基因不同。微软亚洲研究院在中国做了很多年,最终它的研究才被世界和中国广泛地认可。
现在中国也是处在这样一个时期,它即将成为最重要的一个市场,也将具备最重要的研究生态系统。所以我希望中国能更加关注长期的研究。
我们现在的有些研究想法就是来自中国,比如聊天机器人(小冰)。所以我最大的一个希望就是中国不要去复制美国的模式,要真正建立起属于中国自己的模式,才能做领导者。
精彩课程
一百天人工智能工程师学习计划——全程实战案例,从机器学习原理到推荐系统实现,从深度学习入门到图像语义分割及写诗机器人,再到专属GPU云平台上的四大工业级实战项目。100天内完美掌握人工智能工程师必备技能。