晴天霹雳,上周末AI圈突然传出噩耗:商汤创始人汤晓鸥教授于2023年12月15日晚去逝。
现在媒体的口径是“睡梦中不幸离世”,原因有人说是心梗,也有人说是呼吸暂停症状。当然,海外还有一堆人瞎造谣,都不可信。汤晓鸥教授最著名的身份是“AI四小龙”之一的商汤科技创始人,但他从2019年开始就逐渐淡出了商汤的管理,精力更多放在教育和科研上。他今年只有55岁,说一句英年早逝并不过分,AI圈者都在刷屏致哀。而且令人难过的是:类似的事儿去年发生过一次了。2022年6月,旷视科技的首席科学家孙剑也是突发疾病,抢救无效逝世,年仅45岁。旷视是“AI四小龙”中的另外一家,孙剑和汤晓鸥更是相熟多年。事实上,汤晓鸥最著名的一篇论文,就是2009年跟孙剑和何恺明一起合作发表的Single Image Haze Removal Using Dark Channel Prior。
这篇论文是关于图像去雾算法的,是计算机视觉领域顶级会议CVPR的2009年度最佳论文。这是CVPR历史上第一次有中国团队获奖。
论文第一作者何恺明,是汤晓鸥在香港中文大学的博士生,也是孙剑在微软工作时的实习生,他目前任教于MIT,学术成就甚至超越了两位导师。
回望2009年的这篇论文,三个作者中有两个已经英年早逝,令人唏嘘。
而且这些英年早逝,发生在AGI革命爆发、中国AI产业被部分封锁、业界正在焦虑追赶的背景下,所以有好事者第一时间就跟阴谋论联系在一起。
这两天笔者跟很多从业人员聊起了汤晓鸥,发现他的分量的确极重,影响力难以复制。
在科学领域,他一手把香港中文大学MMLabs打造成全球人工智能重镇,而他自己也是计算机视觉领域的顶级科学家,论文被引13.9万次。
在政策领域,他是科技领域为数不多能够“上达天听”的学者。在2018年11月举办的民营经济座谈会上,汤晓鸥是10个发言的人之一。
在商业领域,他创办的商汤曾经是中国最耀眼的AI创业公司。尽管技术和商业化频繁遭遇争议,但目前市值仍然超过400亿港币。
所以,他的逝世是中国AI届的巨大损失,影响难以估量。
但业界在讨论汤晓鸥的“难以复制”时,还不在上述的三点上,毕竟中国的企业家很多,科学家很多,转型企业家的科学家也很多。
大家提到最多的,是汤晓鸥培养人才的模式,用一个朋友的话来说就是:“在他的调教下,顶级人工智能人才如同流水线一般被锤炼出来。”
这位朋友给我扔给我一个网址页面,来自汤晓鸥创办的香港中文大学MMLab,上面记述了实验室所有已毕业校友的去向和履历。
笔者翻完页面上134名学生的履历,笔者对汤晓鸥教授的重要性,有了更新的认识。
一路高光的履历
在解读汤晓鸥如何培养人才之前,我们先来复盘一下他本人的经历,原因很简单:汤晓鸥自己的履历,给未来的学生们打了一个模版。
由于长期在香港任教,所以不少人以为汤晓鸥是一个香港人,但实际上他是一个地道的东北人,于1968年出生于辽宁鞍山。
汤晓鸥从小成绩优异,1985年毕业于当地重点中学鞍山一中。可能是受到家乡工业重镇的影响,汤晓鸥报考了中科大的精密机械与精密仪器系。
年轻时的汤晓鸥 来源:B站up主xoooooooo
1990年本科毕业后,他前往美国罗彻斯特大学攻读硕士,一年后,他申请到了麻省理工学院的博士项目,专业是应用海洋科技(Applied Ocean Science and Engineering)。
这个博士项目,是由MIT和世界著名的海洋研究机构伍兹霍尔海洋研究所(Woods Hole Oceanographic Institution,简称WHOI)联合培养。
伍兹霍尔海洋研究所,马萨诸塞州
这个研究所位于麻省南部,距离MIT的校园一个半小时车程。在1985年,正是伍兹霍尔研究所设计的机器人,找到了沉在海底的泰塔尼克号。
也是在这里,汤晓鸥发表了大量跟声纳和图像识别相关的论文和报告。
在后来的公开发言中,汤晓鸥说这是他对人工智能开始产生浓厚兴趣的起点,尤其是当他看到机器人使用声纳和摄像头在海底自由地探索时。
WHOI潜水机器人 Jason Jr.探索泰坦尼克号, 1986年
1996年博士毕业后,汤晓鸥前往香港中文大学任教,2001年他创办了香港中文大学多媒体实验室(MMLab),主攻计算机视觉。
这一实验室如今也被认为是商汤科技的前身。
此时计算机视觉虽在国际上有广泛讨论,但在香港属于彻头彻尾的“前沿技术”,基本相当于当年奥本海默回美国开设量子力学课。
没有成熟的学术圈,就意味着这个实验室既吸引不到学生,又拿不到研究经费,更何况在香港,优秀的本地学生去美国深造早已成为共识。
但很快,汤晓鸥就想到了一套解决方法——从内陆招生。
第一个生源地就是母校中科大。通过自己的接触和校友的介绍,汤晓鸥很快就挖掘到了王晓刚、陶大程、林达华、曹亮亮等优秀学生。
汤晓鸥从科大招的第一个学生是王晓刚,后来不仅成了他的妹夫,还跟他一起创立了商汤。
商汤科技研究院院长王晓刚
2005年,汤晓鸥开始在微软亚洲研究院(MSRA)兼职。微软亚洲研究院位于北京市海淀区,最不缺的就是来自清华北大的实习生。
通过这个途径,他进一步拓展了生源,邀请优秀的年轻人前往MMLab访学或者求学,如何恺明,颜水成,徐东,崔靖宇等人。
解决了生源问题,下面就应该解决培养问题了。港中文MMLab后来被称为“中国计算机视觉的黄埔军校”,必定有一套独特的培养体系。
这套体系的核心密码,就在于四个字——顶级会议。
勇攀顶级会议
先普及下计算机视觉领域的三大顶级会议:CVPR、ICCV和ECCV。CVPR全称是“计算机视觉和模式识别会议”,每年举办一次,基本都在美国,偶尔也去其他地方,论文接受率大概是20~30%。ICCV全称是“计算机视觉国际会议”,每两年举办一次,地点全球流动,比如19年在首尔,21年停办,今年在巴黎,论文接受率也在20~30%。ECCV全称是“欧洲计算机视觉会议”,每两年举办一次,跟ICCV错峰,举办地点主要在欧洲,不过去年在特拉维夫,接收率跟上面两个差不多。计算机科学由于发展速度快,所以学术大牛会优先选择把成果发在会议上,而不是出版周期长的期刊。因此计算机的学术影响力,就看顶会。比如CVPR,在最新的Google学术出版物的排名中,CVPR只排在Nature、新英格兰医学和Science之后,在柳叶刀之前,高居第四位。从2001年成立开始,汤晓鸥就把这些顶级会议,设置成了学生们的标靶。雷锋网的一篇报道描述了这种氛围:“以顶会‘死亡线’(Deadline)为目标制定科研规划,在投稿前熬夜备战冲刺,并且阅读大量的科研论文。”汤晓鸥的学生也非常给力。在他的指导下,王晓刚在硕士两年里发表了5篇CVPR和ICCV论文,林达华则在两年里发表了7篇顶会论文。
香港中文大学教授林达华
最终,这些顶会论文成了更高舞台的敲门砖:王晓刚和林达华硕士毕业后都去了麻省理工学院攻读博士,两人后来都回到了MMLab执教。从港中文硕士走向麻省理工博士的还有薛天帆(本科清华,现香港中文大学教授)和周博磊(本科上海交大,现UCLA助理教授)等人。我在2010年八月一进实验室就闷头苦干三个月,顺利在十一月份提交了自己在汤老师和晓刚老师指导下的第一篇论文,也成为了我的第一篇CVPR论文。从此初出茅庐,开始了我在计算机视觉领域的探索。而更多潜在的生源,被这样的案例所吸引,越来越多的优秀学生加入MMLab,实验室形成了培养人才的正向循环。汤晓鸥认为冲击顶会是在跟全球的同行竞技,他把做研究比做“论剑”,认为“要论就要到华山论剑,不要去太行山、大别山论剑。”另外,他还非常重视原创研究。在灌水论文横行的当下,港中文MMLab的论文质量很高,多次拿到顶级会议的“最佳论文”称号。2009年,港中文MMLab和微软亚洲研究院合作的论文夺得了当年CVPR的最佳论文奖(本文开头提到的那一篇),MMLab的江湖地位骤然提升。
汤晓鸥和何恺明, 2010年
2010年后,汤晓鸥将目光逐渐转向深度学习。在2011年到2013年期间,MMLab在ICCV和CVPR两大顶会上发表了14篇深度学习论文,占比超过一半。而在商汤成立(2014年)之后,“卷论文”的传统也从香港带到了上海。2018年汤晓鸥在一场发布会上公布了一个数据:过去几年全球各类机构在顶级计算机视觉学术会上发布的论文数量排行中,商汤位列第三,仅次于微软和卡耐基梅隆大学。拥有顶会论文的加持,汤晓鸥学生的职业路径显然也是顶级的。
黄埔军校,实至名归
我们统计了香港中文大学MMLab的134名毕业校友的去向,发现大致可以分为三类。
第一类方向是高校,根据统计有50名毕业校友去了高校担任教职,最高的自然是麻省理工,最低的也至少是国内211/985高校。
第二类方向是企业,有84位学生选择去了科技公司,人数最多的自然是商汤,有18名校友追随汤晓鸥的创业。其他去企业的学生也进的也都是顶级科技公司,比如华为(6人)、腾讯(6人)、Google(3人)、微软(4人)以及Meta(3人)等。第三类方向是研究机构,如上海人工智能实验室和深圳先进技术研究院等,其中有6名学生加入了汤晓鸥主持的上海人工智能实验室,另外至少还有5名校友在这所实验室里兼职工作。在这些校友中,我们挑选了比较有代表性的一部分人,履历如下所示。
在前往高校的校友中,有相当一部分人已经自己成为硕导或者博导,如王晓东、林达华、赵峰、王利民等,为中国AI行业培养出更多的人才。
而何恺明则是汤晓鸥为全人类培养的人才。用一位业内人士的话来说:“仅凭ResNet,何恺明就在人工智能的史书上拥有名字了。”何恺明的发表的论文“只有”69篇,但引用量就高达51.2万次。他加入麻省理工之后,马上就成了MIT被引用次数最多的科学家。
何恺明文献和引用统计,Google Scholar
林达华在悼念汤晓鸥时写道[2]:汤老师的一生,倾尽心血,就是要为年轻一代的学者创造一个成长的空间,为国家也为全世界培育原创的力量。从MMLab、商汤、到上海人工智能实验室,都是他为年轻人打造的一个个成长的舞台。
在2023年的世界人工智能大会上,汤晓鸥做主题发言,他没有讲产业趋势,没有讲前沿突破,而是讲述了三个学生——王晓刚、何恺明、林达华——的成长故事。这充分说明了一件事情:在他心里,学生才是最令他珍视的。
壮志未竟的事业
从2019年之后,汤晓鸥的精力就主要放在了一家新成立的机构——上海人工智能实验室上。目前在UIUC任教的曹亮亮回忆:
上次回国跟汤老师聊天,我就傻乎乎的问他,即然商汤已经不需要太多精力了,为什么不休息或者退休,为什么要付出那么多力气去搞上海AI Lab。晓鸥说我们一直要瞄准最高水平,这样才有能力去改变这个社会。使命驱动着汤晓鸥,而大量出身MMLab的学者则追随他的脚步,加入了这家新成立的实验室,如乔宇、欧阳万里、侯跃南、王佳琦、高鹏、邵文琪、吕照阳、庞江淼等。
在今年6月,上海人工智能实验室联合武大、商汤的关于自动驾驶通用模型的论文,从9155篇作品中脱颖而出,获得CVPR 2023年最佳论文奖。
而论文的牵头作者,是汤晓鸥的学生王晓刚带出来的博士——汤晓鸥传承的第三代已经独当一面,这离MMLab的成立也已经20多年。
但命运的休止符,落在了这个格外寒冷的冬天。在AI浪潮席卷而来之时,中国人工智能领域还要在焦虑和追赶中继续前行。
全文完。
[1] 致敬汤晓鸥:将港中文建成中国计算机视觉黄埔军校,陈彩娴、黄楠,雷锋网[3] 商汤科技创始人汤晓鸥睡梦中离世,你对他有哪些记忆?知乎
关于「新硅NewGeek」:我们以AI为圆心,追踪科技领域的方方面面,努力用最简单的方式阐述技术是如何改变世界。敬请关注。