专访商汤科技联合创始人林达华丨一名AI人才,需要多少栽培?
原创:谭婧
林达华,现任MMLab掌门。MMLab是香港中文大学多媒体实验室,也是港中文-商汤联合实验室。掌门的大部分时间花在全球多个实验室里,所以北京的记者想面对面采访,未必是件容易的事。
最终,我们约见在人工智能(AI)界武林门派相聚的大场面——世界人工智能大会。
“全球智能领域最具影响力的科学家和企业家相聚于此地”的俗话,就不必提了。
拜见武林一流门派掌门人,脑中会有“作拱手抱拳状”的想法。谁知,他几句中英文混搭的表达,马上把我拉回到AI的世界。林达华说话间始终带着一种professor(教授)上课时特有的细腻与耐心,仿佛既可求教,亦可与其争论。
修炼上乘武功,需入名门,拜名师。在学术界,地势高是一种相对优势,虽然不是绝对优势,但是,研究者所处的平台往往能起到决定性的作用。在很多怀抱着AI成才梦的学生眼里,MMLab是名门,林达华是名师。
今日的老师,亦是昨日的学生。
时间拉回到2012年,林达华获得美国麻省理工学院计算机科学博士学位。“当初为什么不留在美国?”他应该不是第一次被问到这个问题,而且,他也已经做出了自己的选择。
他笑了笑,给出了一些细节原因。
他说:“中国内地和香港都有很好的环境,加入MMLab可以迅速地投入到研究工作中。香港中文大学和汤晓鸥老师都给了很多支持。”
可见当年,他选择研究平台的时候,没有太多犹豫。
“在麻省理工求学最大的收获是什么?”
他的回答是,接触到不一样的科学文化,学习到不同的研究思维。
他又强调:“研究创新讲求的是思维碰撞,我格外看重。”
这是一个需要被格外重视的要点,也是练功的不二法门。
他告诉我,碰撞,从而得到很多创新成果。这不仅是他的体验,也是汤晓鸥老师的理念。既然重要,他就进一步解释了“碰撞”。
他说:“汤教授也曾讲过,新思想有赖于碰撞与交流。碰撞出来的想法对实验室做创新很重要,使研究者站在世界前沿。”
回忆起在香港中文大学的研究生时光,他谈道:“早期的人脸识别还没有用到深度学习技术。我在麻省理工之后的学习,更偏统计学习与概率建模。回到香港中文大学任教时,正好身处深度学习的浪潮中,做的是深度学习。”
一个周期,往往是一个研究人员的半辈子,机会留给有准备的人。
林达华有一个很高的起点,而他继续在这个高起点上积累,尽全力把学术研究和学生们推上一个新高度。
五年弹指一挥间,从2015年到2019年,MMLab累计拿下99篇CVPR,38篇ECCV,51篇ICCV,9篇NIPS。
如今的MMLab不再是一个武林门派,而属于一派武林联盟。
2019年是一个里程碑。
这一年,商汤科技及他们与多所全球知名学府共建的联合实验室,总共以57篇论文入选ICCV。算上同年CVPR被接收的62篇论文,累计有119篇论文入选全球两大计算机视觉顶会。
人们常说,一切科研成绩的背后,都是刻苦的钻研、扎实的训练。其实还有更重要的后半句,这是更值得探索的关键——“什么是有效的训练?”
有了《九阳真经》,也得讲究如何以正确的法门练功,走火入魔了怎么办?
“做research(研究)最重要的是什么?”
林达华说:找到真正的挑战在哪里。
迈入MMLab,林达华希望学生,特别是刚进入学术研究领域的学生能够深刻理解的第一个问题是:做research(研究)最重要的是什么?
“答案并不复杂。”林达华说。
“做研究最重要的是,找到真正的挑战在哪里。很多研究人员在实验室里面拍拍脑袋,做一篇论文。虽然这个论文可能很成功,但是没有什么应用的价值。因为学术界想象的问题和产业落地需要解决的问题,它们之间有很大的gap(鸿沟)。”
他停顿一下,强调:“研究人员在AI落地的过程中接触到了真实的需求,从而发现学术界根本没有注意到的事情。”
“MMLab的学生,不发非顶会论文,不发没有突破的论文。”
这句话代表着林达华对学生的期望与要求。他不想让学生在学术的路上有“另一种”学术思维和习惯。
在他的世界里,优秀与非优秀不是两个不同的标准,而是在做两件截然不同的事情。
论文对学者的学术高度有决定性意义。但是,从林达华对学生的栽培,从他对学术教育的理解来看,他的汗水不会浪费在——仅仅写出“漂亮”的论文。
他要的是高质量的创新,这是MMLab文化中更深层次的动机。
一心只想打败别人的,会成为武林高手。一心思考创立武功门派的,会成为武林宗师。
只要稍微打听一下,就能得知,今日的香港中文大学MMLab绝不缺生源,很多基础扎实、成绩优秀的学生慕名而来。
林达华这样描述刚刚迈进实验室的学生,“很多学生第一年来MMLab,有一定的知识储备,但是对如何做研究还处于起步阶段。”在他眼中,每个学生的可塑性都非常强。
他直言:“MMLab对学生的期望是,毕业之后独立开创一个方向,带一个团队。” 比如他看到,有不少他的学生毕业去了商汤就能直接lead(带)团队。
“进了实验室之后,学生会接受什么样的训练与培养?”
也许是第一次被问到这个问题,采访时,林达华静静地思索了一会,拿出了一个“三阶段理论”,让我不得不迅速进入“记录练功要诀”的状态。
他强调,MMLab没有独门培养秘籍,恰恰相反,这是一个AI领域的研究者必然经历的三个阶段,也是人才培养的规律。
第一个阶段,懂得怎么做一个project(项目),突出一个“领”字。
他会告诉学生,要做一个什么项目,往哪个方向探索,技术路线是什么。学生会在他指导之下,在师兄的协助之下,逐步自主完成一定数量的项目。
在一开始的时候,他会与学生一起仔细地讨论“教授的指引与期望”。林达华强调,在这个过程中,绝对不会强迫学生去做不愿意做的事情。他在说“绝对不会”这四个字的时候,特意加了重音。
因为,学生要做的事情,虽然是紧跟教授指引,但是学生必须提出自己的想法,明确自己感兴趣的地方。
他再根据学生的想法,围绕这个问题在学术上是不是真的有价值,朝这个方向做下去会不会遇到一些根本性的障碍等问题来来回回沟通。
这个过程可能会用一个月的或者更长时间。他认为,过程本身就创造了教学的意义。
他强调:“目的是教授领着学生找到一个长期深入做下去的学术方向。”一开始,他可能会给学生较多的指导,观察学生,了解学生一步一步学习适应的情况。学生在这个阶段会在有指导的情况下,逐步开展研究。
此时,林达华第二次强调,MMLab的学生不会发没有突破的论文。因为目标定的低,是浪费学生时间。
他认为,思维方式和研究习惯的养成异常重要。如果从一开始就定位发非顶会论文,会养成“另外一种”思维方式,这种思维方式,不在实验室培养体系之内。这是从学生需要的视角再次去解读为什么不发非顶会论文。
第二个阶段,突出一个“独”字。
林达华说,他会和学生一起定一个方向,但不会有细致入微的guidance(指引)。学生恐怕需要自己找资源,大多数尝试甚至连数据集都没有。
在林达华眼中,MMLab在很多比赛中名列前茅,那只是对学生的锻炼。
他自信而又坦诚地说:“我们已经完全超越了‘刷榜时代’,锻炼学生用AI解决问题的能力,在我给他们制定的第一阶段的长跑中就已经完成了。”
第二阶段的重点任务是开拓一个方向。
“我们会讨论这个方向的目标是什么。可能连数据集都没有,那就得自己建,把算法做出来,设计实验,坚持到完成。这个时候,学生需要养成独立完成一个高水平的项目的能力。”
林达华在描述“科研探索者”一种拾阶而上的人生之路。多少练武之人一步一个石阶的攀爬到“壁立万仞”之下,抬头一望,四字凛然。
他继续介绍,第三个阶段,也是毕业前的一个关隘,突出一个“闯”字。学生自己找到研究方向,独立产生研究思路,坚持到底。
他再次强调了一下重点:“自己找挑战,自己找问题。”
“踏踏实实地经历以上三个阶段,基本意味着毕业后可以独挡一面。”这是林教授的教诲,也是他心之所愿。
“学生个人的情况会有所不同,有的偏思考型,有的偏实践型,有的偏工程型,我希望每个学生毕业后都会形成一条独具个人特色的研究路径。”
他又补充道。
“独具特色”一词被林达华格外看重。从某种程度上讲,这个词里包含一种“高质量创新”基因。他言语中透露出那种对学生与生俱来的特色的珍视。
“无论学生是偏好研究还是偏好工程,都会找到自己的位置。有的学生毕业后愿意去商汤科技,因为今天的商汤科技已经是一个计算机视觉领域的大平台。有的学生愿意去美国继续深造。”
林达华乐意看到种子发芽,拔节成长,至于选择未来奋斗的土地是热带雨林,还是高原盆地,他不会给限制。
他的任务是把学生培养出来,并带有MMLab的基因。
从培养一个个,到培养一批批。
汤晓鸥教授于2001年创办了MMLab,十几年过去了,它早已孕育出别具一格的研究文化。“我们如何理解MMLab的团队文化呢?” 林达华答道,“我们当然有自己的文化。”但是,思考了一会。
他说:“这也是我第一次总结实验室的文化”。
第一、尊重。
尊重学生的创新想法。这里强调的不是分配研究想法,我们的角色是导师(adviser),这个角色的重点是引导学生形成研究的想法。
教授并不会在一线接触数据和代码,如果随便地指手画脚很可能会干扰学生的创新思维。
学生需要自己找到真正有价值的挑战。当学生形成想法,他会抛给学生第一个问题——为什么这个问题之前没有解决?
休想让他直接告诉学生,你该做还是不该做。
这个问题可能做完文献综述之后,也未必思考得清楚。文献综述只是回答这个问题的其中一个环节。
为了解释这个关键问题,他马上举了一个例子,像极了课堂上老师回答学生的追问。
“以时序算法为例,学生可能会说,以前的方法受制于十秒内存的限制,处理几分钟或者更长时间视频分析遭遇到困难,我要研究的问题和前人研究的有何不同之类的介绍。”
林达华说,这个问题不能让学生僵化地回答,他会要学生尽量具体地回答,研究的问题和论文A有哪些不一样,和论文B有哪些不一样。”
第二,价值。
假设这个研究已经做出来,价值在哪里?
他强调不局限于学术价值,而是给人类社会带来的价值。
“还是以时序分段网络为例,解决这个问题,就意味着拓展了AI处理视频时长的能力,以前处理不了的视频,现在可以通过技术手段处理了。”
他借用具体的研究来解释思考问题的方式。
“如果要在学术上有所行动,首先要回答清楚这两个问题。如果这两个问题能够处理好的话,需要研究的问题实际上就已经成立了。”
他强调,一个学术问题,不需要一堆问题来定义,一到两个根本性问题就能够将这个问题定义清楚。Adviser(导师)这一角色重点是在引导学生创造有价值的想法。
教与学,答与问,日日修炼,夜夜参悟。