科学匠人丨张宸:“笨小孩”的逆袭
编者按:最好的科学家常常也是最好的哲学家,就像笛卡尔、马赫、伽利略、爱因斯坦……他们心中有星辰大海,眼中有人类未来,但同时他们又是孤独的,因为长期坚持研究是一条孤寂之路。正如信奉长期主义的微软亚洲研究院主管研究员张宸,用他的经历向我们讲述了他的长期主义哲学——定义重要课题,呈现重要结果,但求推动技术进步,莫问一时荣辱。
九零后的张宸是一名典型的研究员,瘦高个子、戴着眼镜、说话斯文有条理,言语之间充满了严谨却又不失幽默的“方法论”。如果按论文引用数量计算,他在中国工程科技知识中心统计的“人工智能芯片设计领域世界最有影响力学者”排行榜上排名前35;如果按照“第一作者论文”计算,他全球排名第4。对于人工智能和系统研究,张宸坚持“因为相信才会看见”。在他看来,做科研像是孕育一个新的生命,研究者需要付出极大的心血,怀胎十月,经历各种心理和生理上的折磨。但它是充满希望的,你会坚定地相信它注定会在未来的某一天带着光芒降临,然后改变世界。
张宸踏入人工智能研究可以说是“误打误撞”。大学本科专业是电子工程的他对自动控制和智能机器人很有兴趣。因为读了《Artificial Intelligence: A Modern Approach》这本书,张宸第一次对人工智能产生了系统性的了解,并越来越感兴趣。
“那是一种拨云见雾的感觉,就像站在巨人的肩膀上,以往想不通的问题忽然就解决了,从此我对人工智能的兴趣就一发不可收拾。”那时,人工智能在国内更像是一个前卫的概念,尽管身边不少人提醒他选择了这个专业方向未来会很难就业,但张宸却选择了相信。
在北京大学读博士期间,张宸主要研究深度学习定制化加速器的设计与编译问题,从2012年至今,他见证了深度学习芯片从无人问津到炙手可热,也发表了多个具有影响力的工作。2015 年,张宸发表并提出了第一个人工智能加速器设计的优化分析模型,创新地结合了循环变换与屋顶模型。该工作后来被众多人工智能硬件设计研究参考引用,包括谷歌的 TPU、英伟达、微软和赛灵思等 AI 巨头的加速器论文。根据 ACM Digital Library 统计,截至2020年11月,该论文在 FPGA 会议上连续五年保持下载量排名第一,并成为1995年创刊以来总引用量最高的论文。
随着人工智能芯片进入大爆发时期,张宸又敏锐地发现如何将硬件的性能最终传递给用户是人工智能领域亟待解决的问题。于是他通过人工智能芯片的编译和自动化框架,结合深度学习系统框架和 FPGA 定制化加速器,设计了一套编译和自动化设计流程“Caffeine”。这篇论文的创新性得到了广泛认可,并获得了2019年 Donald O. Pederson 最佳论文奖。这也是该奖项自成立以来,第一次授予来自中国大陆的学者。
张宸(右二)获得2019年 Donald O. Pederson 最佳论文奖
如果这样看,张宸就像大多数“学霸”一样,一路一帆风顺,但其实他在自己心里却一直都是一个“笨蛋”人设。“因为在我人生的许多阶段,凡是取得不错成绩时都要先心平气和地接受自己是个‘笨蛋’。”
跟同龄的孩子相比,张宸启蒙晚,错过了幼儿园加减乘除的基础教育,从一年级开始就是班上最差的学生之一。“别的同学做作业一小时,我要做一整晚,那时候我经常哭着问家人我为什么这么笨。可他们从来不骂我,而是让我不要在乎什么排名,只求做完所有题目,学懂书本上的知识。大概过了三年多的时间,我反而慢慢地赶上了同学们的进度,有时还能拿到第一。”正是这样的经历让张宸意识到,凡事要看的长远,不要在乎一时一刻的荣辱,就把自己当作“笨蛋”也没什么大不了的。成功固然是好,但失败也并不可怕。最可怕的其实是骄傲自满的情绪,这会让人在取得成绩时忽视自己的缺点和隐患。
如今已到而立之年,张宸更是成长为了一个“长期主义者”。在 Google Scholar 上,他不算一个高产的作者,但论文引用总量已接近2000次。他坚持研究要精心打磨,定义重要的课题,呈现重要的结果,“但求推动技术进步,莫问一时荣辱”。
2015年的某天,凌晨三点,洛杉矶发生了一次短暂的地震。当时 UCLA 大学(美国加州大学洛杉矶分校)空无一人的计算机大楼里,只有张宸一个人。他赶紧趴到桌子下面避难,在地震摇晃中,他琢磨着要如何活着走出这栋大楼,内心充满恐惧。不过当地震停止的那一秒,看着空荡杂乱的大楼,张宸突然觉得豁然开朗,“那段日子刚好研究遇到了瓶颈非常煎熬,跟遭遇地震的心情很像,就像一个人站在荒原里,不知道应该去往何方,抑或是止步于此。经历了那次地震后,内心的压力反而没有了,完成后的论文也获得了奖项。”这个特别的经历无意中塑造了张宸对科研的态度,“我永远记得当时的导师丛京生教授告诉我,‘不唯书、不唯上、只为实’,不要盲信权威,也不要盲从主流,独立思考,去做你自己该做的事情。”
张宸在 UCLA 期间的 “荒野旅行”
后来,在微软亚洲研究院的工作又让张宸完成了跨领域研究的蜕变。在北大上学时张宸就对微软亚洲研究院充满了向往,“这里既能接触到工业界的问题,也能和国际学术前沿保持紧密的联系。”毕业前,张宸曾经一度对自己的研究方向产生了迷茫,在2017年加入微软亚洲研究院系统和网络组后,张宸很快就确定将稀疏和加速作为自己主攻的方向。
在他看来,上一代 AI 芯片的基础研究工作已基本完成,大量的工作已经进入应用和商业落地阶段。而随着 AI 算法的规模不断扩展,传统方案的瓶颈也逐渐显现。人工智能系统的性能还需要千倍万倍的提升才能真正满足下一代 AI 应用与开发的需求,在云计算与人工智能时代,系统结构的设计会发生根本性的转变。所以硬件必须与系统、编译器、算法深度结合,因此张宸在系统组致力于研究下一代分布式的、“端”与“云”深度结合的、高能效高性能人工智能系统。
“在微软亚洲研究院,我能充分感受到科研自由的力量,可以从领导、同事和环境中获得定力,不会被外界的浮华所影响,静下心来做研究。”张宸表示,想要做出有影响力的研究更需要那种打破常规、不破不立的决心。“保持坚定信念的同时,不要刚愎自用,也不能闭门造车。其实科研就是在荒原上走出一条没有人走的路,导师和同辈们的经验就是我的指南针,我要不断地向大家请教,修正自己前进的方向。而我也会将这样的心态传递给后辈。”
张宸在微软亚洲研究院二十周年庆典上
关于做研究,张宸有一点自己独特的心得体会。他说,我们从小受到的教育常常是“在规定时间内,正确地给出所有题目的答案”,但科学研究首先是要“定义问题”,其次才是“解答问题”。定义一个好问题非常困难,需要在浩如烟海的信息中去繁化简,探索从未思考过的角度,在“无数”可能的定义中找出最有价值的那一个。这是做研究最有趣、也是最具挑战的地方。张宸表示,因为常常需要质疑和被质疑,所以自己只有依靠“信仰”才能在不断的质疑中保持“坚定的立场”,才能在科学的迷雾之中开拓“科研问题”。
今年6月,英伟达发布了一款 GPU 安培架构,其中首次引入了为深度学习设计的稀疏张量单元(Sparse Tensor Core)。张宸欣喜地发现,该引擎中用的稀疏化方法和其团队2018年发明的方法非常相似。“这是个很有商业价值的发明,但仅仅是稀疏化应用的第一步,这一步操作能够把通用硬件的性能提升一倍,说明我们此前的研究是很有意义的。”
这些年,人工智能的成功离不开大型、多层的深度神经网络模型。而训练和运行这些巨大的模型需要数以万亿的计算量。为了解决更复杂的问题,人工智能(深度学习)模型还在进一步变得更大、更复杂。因此,高性能人工智能硬件与系统成为推动人工智能应用与算法发展的重要生产因素。当然,提升效率的方法有很多种,但张宸基于他在系统领域的积累,选择了稀疏化这个方向。
张宸发现稀疏化这个领域看上去很热,刊发的论文也不少,但再仔细研读这些论文就会看到这里面有实际应用价值的少之又少。在两三个月的钻研之后,他找到了其中的关键:核心在于要解决一对矛盾——模型稀疏的不规则性和硬件加速所需要的规则性。规则性让硬件的加速比更高,不规则性则可以保证模型的精度,如何平衡这组矛盾是整个问题的难点。“我们最深入的洞见是发现了在这两个绝对矛盾之间有一个空隙,并利用了它,也就是结构化的细粒度系数。”
在张宸看来,稀疏化是提高人工智能芯片效率的关键技术。过去的人工智能算法主要靠“大力出奇迹”,绝大部分的“智力”靠的是大模型、大规模的“记忆”。然而下一代模型,人工智能算法不仅规模越来越大还要学会“进化”,学会消减冗余和无用的东西,就像人脑的学习历程一样。“驱动人脑这样高级的智力系统只需要20瓦,那么20瓦的智能计算机就是我们的终极目标。未来的人工智能系统不仅需要支持大量的计算,更需要学会精简计算。”张宸认为,“稀疏化”与“结构化”将会成为下一代神经网络的主流特征,未来的研究也将从人工智能的这些特征入手,重新设计人工智能硬件与系统。
早些时候,还没有太多人能看到稀疏化的未来,但现在它的潜力已经初见端倪。如今,稀疏化的方法能够使系统效率提高2-5倍,那么未来达到1000倍也未必不可能。“大家有时候过于重视短期的影响,而忽视了长期的影响,就像十年以前我们还在担心因为选择人工智能专业而找不到工作。如果我们站在今天再去想十年以后,谁也不知道会发生什么天翻地覆的变化。”
未来的世界,智能设备无处不在,从家用电器、穿戴设备到自动驾驶。而硬件与系统不仅是这些应用的载体,更是他们的心脏。我们注定需要重新改造我们的计算机和计算系统,它们将是“端”与“云”的深度结合。给智能设备提供“心脏”,让每一台智能设备都有强力的“云大脑”作为后盾,是未来的技术落地场景,也是张宸的目标。
你也许还想看: