微软亚洲研究院的“哈利·波特”:Thomas Moscibroda
欢迎关注微信公众号:微软研究院
在微软亚洲研究院,有一位名为Thomas Moscibroda的研究员几乎是无人不知、无人不晓,江湖人送外号“哈利·波特”。Thomas认为他这么“红”是因为他“老外”的外形让他在人群里比较显眼,但熟悉他的人都知道,比他外形更深入人心的是他对研究的热情与专业。
这位在学术界和工业界都玩的游刃有余的“歪果仁”身上的标签有很多。他是微软亚洲研究院系统算法组首席研究员,也是清华大学交叉信息研究院“姚班”的兼职教授。他是瑞士人,却同时掌握德语、法语、英语、日语和中文等多门语言。他曾经在2年内发表了20篇论文,平均一个多月就能发表一篇超高水准的论文。他博士毕业就直接进入了微软雷德蒙研究院,开始了理论和应用的跨界研究。
寻向所志,微软之缘
抱着“想多尝试一些不一样的东西,让生活能够充满变化和新意”的想法,从瑞士的苏伊士联邦理工学院(Eidgenössische Technische Hochschule Zürich,简称ETH)毕业之后,Thomas选择了美国作为他事业的起点。Thomas在博士期间的工作是主要以理论研究为主,进入微软雷蒙德研究院之后,他可以将理论与系统相结合,还有机会兼顾理论研究和工业应用。五年之后,再次怀揣着体验不同生活的想法,Thomas将眼光投向了微软遍布全球的其他研究院。他坦言,因为有机会在微软研究院这样的大型跨国研究机构工作,所以换个国家工作的想法就不再是天方夜谈。
在微软雷德蒙总部工作期间,Thomas曾多次与微软亚洲研究院的研究员有过工作上的往来,因此结识了不少这里的研究员们,自然而然的微软亚洲研究院便成为了他心中的一个理想选择。在他看来,微软亚洲研究院是一个年轻而充满朝气的研究机构,有许多年轻的人才,有许多奇思妙想的创新,还有诸多领先世界的顶尖技术,她正在不断的发展壮大,提供了许多颇有潜力的机会。
此外,Thomas对亚洲文化还有着热切的向往。他热爱旅行,他游历的足迹遍布全球,亚洲的文化和美食深深吸引了他。当Thomas最终来到了这个位于北京的“全球最火的计算机实验室”时,他发现了更多的惊喜。开放的研究环境、谦虚努力的研究员,友善的同事朋友,这一切都让他非常享受在这里的工作。
志同道合,和而不同
金棕色头发、细边框架眼镜、淡淡的笑容,让Thomas收获了“哈利·波特”的名字。不仅外表如此,同事们眼中的Thomas也如哈利·波特一样乐观、勇敢、聪明,为研究院注入了新鲜之风。他带领的系统算法组可以算是微软亚洲研究院最多元化的研究组了。
多元化首先体现在该小组的文化背景上。以Thomas为例,他出生并成长于欧洲,但在美国和中国都有过很长一段时间的工作体验。多元的文化体验为他带来了广泛的兴趣爱好,下班后,他常在健身房挥汗如雨;周末,他的身影出现在唱诗班的合唱队;年会上,他是唱歌表演的超级明星;就连微软亚洲研究院附近的六家星巴克的细微差异,他都了如指掌。对了,你还可以跟他讲讲中文,绝对有惊喜。此外,来自巴西的Börje Karlsson则是个不折不扣的“啤酒狂人”,他对北京啤酒地图的熟悉程度可能远超任何一个在这片土地上生活了多年的老北京。不同的语言、肤色带来的并非隔阂,而是文化多样性与兼容并包、自由开放的氛围。工作中的他们与中国的研究员们志同道合、并肩合作,生活中他们有人是背包客,有人是中国通。他们享受着完全不同的生活方式,也为微软亚洲研究院带来丰富多元的风气。正如系统算法组的主管研究员闫莺所说,“跟他们一起工作,会让你的心胸很开阔,在不同的文化、不同的经历中,看到不同的东西。”
多元化同样还体现在该小组的研究领域上。系统算法组包括云计算和移动感知两个方向构成,因此,该小组最大的特点是每个人的研究都是围绕着云计算展开的,但是很少有两个人是做一模一样的方向的。组员里有研究数据库的,有研究大数据的,有研究理论的,有做电池的,有做IoT的……这样的小组构成有一个天然的好处,每当开组会的时候,Thomas会让大家分享自己手头上项目的研究进度,并让大家一起展开讨论。这样一来,每个人都能从自己专业的角度对项目给出建议,而小组成员便有机会跳脱自己专业领域的思维框架。由于每个人的研究领域又各不相同,项目一旦建立便会自然分工,每个人都可以从事自己擅长的方向。这种互补型的多元化项目合作无论对项目的完整性还是研究员的个人成长都是非常有好处的。
微软亚洲研究院 系统算法组
想带好这样一个多元化的研究小组,在其他组员们看来Thomas的独门秘籍是扎实的算法和理论背景。研究员闫莺博士甚至形容他为“他就像是一个活字典,只要涉及到算法,无论是图、排序还是调度,他都能十分清晰地帮你理清思路,并总能找到问题的关键,且视野宽广,指导你如何对项目进行包装。他提出的建议都十分具有针对性,并能将整个团队高效的整合在一起。”更让人感动的是,作为“老板”的Thomas十分注重尊重每个人的时间管理,并更是不遗余力帮助员工进行职业规划与发展。
心之所向,行之所往
不想当将军的士兵不是好士兵,这一点几乎在每个行业都不例外。作为一个有清晰目标,有远大理想,有明确方向的研究员来说,创造属于自己的影响力(make big impact)则不容置疑。
Thomas总结道:对于一个研究人员来说,通常有三种方式来创造属于自己的影响力。第一种方式是最传统的方式,即学术影响力,从最基础的科研开始做起,通过自己的研究成果和技术创新来影响世界。第二种方式是行业影响力,进入工业界,为一个企业的产品部门或是研发部门贡献力量,解决产品中的问题,影响产品的决策,通过产品来影响无数用户。第三种方式则是社会影响力,虽然并不直接影响产品或是学术界,但能通过别的方式侧面带来影响。
当Thomas来到微软亚洲研究院时,虽然工作和生活的环境发生了巨大的变化,但不变的是Thomas对于研究的热爱和追求。他的激情也深深影响着系统算法组的研究员们,他们共同朝着相同的目标努力——创造更大的影响力,这也是研究的乐趣所在。
基础研究——学术影响力的源泉
其实在微软,有很多基础研究项目,它们通常耗时多年才会开花结果,大家并不能一下子就用上这些研究成果,但微软始终坚持在基础研究上的投入。Thomas笑言他们组所从事的系统算法也许不是“最性感的工作”,但却意义重大。
系统算法组的工作主要是基于底层系统的研究开发,对数据库、云计算等从算法层面进行性能提升,但这些研究却在隐形地提升着每一个人的计算体验。不久前,微软亚洲研究院开源的GraphView就是这一类工作最好的证明。
GraphView是一款中间件软件,方便用户使用关系数据库 SQL Server 或 Azure SQL Database 高效地管理和处理大规模图数据。在过去,SQL等关系数据库是重要的数据处理方式,数十年的研究让SQL等关系数据库广泛应用于企业环境中,但近年来,随着图数据的大量增加,传统的关系数据库被普遍认为在图数据管理上效率低下。因此,企业管理和开发人员不得不采用专门针对图数据开发的原生图数据库,并投入大量的人力和物力来维护新的系统以及二次开发原生图数据库中那些还未成熟的功能。
而Thomas和他的团队坚信,关系数据库无法高效管理和处理图数据的传统观念并不准确。因此陈亮担任了该项目的负责人,花了两年时间开发了GraphView这款中间软件。GraphView能够将关系数据库SQL Server及Azure SQL Database转化为图数据库。通过智能地使用关系数据库的数据结构和系统功能,GraphView在物理数据表达以及系统运行行为上和原生图数据库完全一致,从而填补了关系数据库和图数据库之间的鸿沟。
也就是说,作为一款基于SQL的图数据库,GraphView提供了原生图数据库所支持的全部功能。更重要的是,GraphView继承了关系数据库领域数十年的科研成果,例如最新的矢量化查询优化技术(Vectorized Query Execution)等等,从而可以提供市面上原生图数据库难以媲美的性能。可以说GraphView一次解决了原生图数据库的多个问题,并成功结合了关系数据库的众多优点。
开发图数据库和关系数据库中间软件的想法可能并不算是独一无二,但GraphView作为最终成果确是独一无二的。两年时间内,系统算法组的研究员们朝着这个目标日益完善自己的研究,当GraphView最终完成,走向开源,让更多的人可以接触并使用时,陈亮形容说:“这是对于任何研究员来说都是值得高兴的一刻。”
工程与产品——行业影响力的核心
系统算法组的很多研究成果都已经成功应用到了微软的各个产品和服务中。正如Thomas所坚信的那样,一个伟大的工程或产品都会带来极大的行业影响力。而微软亚洲研究院系统算法组与微软Azure部门向来合作紧密。
Azure是微软基于云计算的操作系统,它能够为开发者提供一个平台,帮助开发可运行在云服务器、数据中心、Web和PC上的应用程序。但与之对应的是,Azure需要体量庞大的数据中心作为支持。如何不断提高数据中心的工作效率是产品组一直在改进的方向。
很长一段时间以来,数据中心的利用效率始终无法实现100%,这个问题困扰了无数专业人士。此外,用于云计算的每台机器的维护成本都很高,每1%的资源背后涉及到巨大的成本。除了预留出的缓冲区外,是什么造成了利用率不高呢?Thomas和系统算法组的研究员陈洋花了很长的时间建构了一个复杂、庞大而完整的模拟器来模拟整个Azure的机器、规则、行为,一旦Azure有想要做任何更新,研究员很快就在这个Azure模拟器上能进行模拟、了解资源利用情况,并依据模拟结果进行决策。这样无论产品组想在Azure上新增任何的功能,事先都会在这个模拟器上跑一遍。此外,研究小组还提供了绝佳的地调度和资源分配的算法,将Azure的利用率提高了十多个百分点。
对Azure来说,Thomas与其他研究员们的这一完整的模拟器成为了一个重要的第三方,为Azure的改进提供了很好的基础。一组数据更是证明了Thomas所追求的行业影响力:在全球,目前Azure共有4.25亿活跃用户,57%的世界500强公司都在使用Azure,而且每月的新注册用户还在以10万的数量增长。在Azure上有60兆的数据储存,每月有超过7兆的储存交换,每天有2千万个SQL数据库在Azure上运行,而Azure上的网页更是有超过600亿的点击量。这其中每一步数据交换的效率提升,都受益于微软亚洲研究院系统算法组在其算法上的一次次改进。
更好的未来——社会影响力
Thomas和实习生们
除了学术影响力与行业影响力,Thomas也希望自己的工作能够带来更多的社会影响力。在微软亚洲研究院有众多与高校的合作项目和相关机制让研究员们在做好研究之余也能够抽出时间来培养计算机领域的后备力量。
Thomas在一次对外代表微软亚洲研究院的演讲上,遇到了清华“姚班”的创始人、2000年的图灵奖获得者姚期智博士。姚期智博士被Thomas的演讲的研究理念和前瞻性所打动,盛情邀请Thomas去清华大学担任兼职教授。而微软亚洲研究院本身也十分鼓励这样的机会,有着大量研究员在国内及国际高校担任教职的先例。从那以后,Thomas每周都会抽出一天的时间去清华大学授课,帮同学们答疑解惑。
Thomas每次去清华上课的时候都会带上一盒巧克力。他鼓励学生们在课堂上积极提问或是发表自己的见解和看法。当有同学能够提出一个很好的问题时,或是出现Thomas无法解答的问题时,他都会奖励同学一颗巧克力。工作之余,Thomas也会经常带自己的学生和研究员们出去“解放思想”。在一次体验密室逃脱游戏的过程中,这群智商超高的人在全程英文交流的情况下几分钟之内就解完了所有谜题,“逃”了出来,连店家也惊叹这是他开店以来见过解谜最快的一群人!Thomas还经常给研究院的实习生答疑解惑,无论你和他的研究领域是否相近,只要你在他的“咖啡时间(coffee break)”去找他,他总会欣然的和你聊上几句,从一个过来人的角度给出宝贵的经验。
就是这样一个“哈利波特”式的研究员,你和他的交流总会碰撞出许多类似于“魔法”一样的灵感闪光,他也用它独特的人格魅力,让每一个和他接触过的人都印象深刻。每一天,Thomas在上班和回家的出租车上和司机的捧哏的过程中都能加深对中国的印象与热爱,而位于中国北京的微软亚洲研究院,也始终敞开着她的胸怀迎接着来自世界各地有想法的研究者。
你也许还想看: