新晋85后诺奖得主John Jumper:导师愿意给自己做PPT的编程高手
The following article is from 小王随笔 Author 小王随笔
加星标,才能不错过每日推送!方法见文末动图
新晋诺奖得主John Jumper,拥有深厚专业知识和工作经验,善于教学,言谈幽默,工作高效,注重实际效果,这样的人很自然地能在一个团队中成为核心和领导。高智商、高情商的正常的不古怪不乖张的人就是我们需要的复合型人才。
热烈祝贺 John Jumper 获得2024年诺贝尔化学奖!
太赞了!太赞了!!太赞了!!!
John 是我的师兄,早我一年入校,早我两年入课题组。我们有两位共同的博士导师:Karl Friedric Freed (1942-) 和 Tobin Roy Sosnick (1961-)。
Karl 出生于1942年的纽约市布鲁克林,有一个年长4岁半的哥哥 Jack。哥哥热爱化学,中学就在自己家的地下室搭建了一个功能齐备的化学实验室,上小学的弟弟也能参与进来。Jack 在1962年因研究电子自旋共振从哥大取得了化学博士学位;翌年,Jack 拿到康奈尔大学化学系的教职,而 Karl 刚刚从哥大化学系本科毕业。
仿佛在追赶哥哥的脚步,在1967年,Karl 获得了哈佛的化学物理学博士学位,师从 William Klemperer(1927-2017),研究电子共振光谱,博士论文标题是:Theoretical studies in molecular spectroscopy(分子光谱学的理论研究)。同年,哥哥Jack成为康奈尔大学副教授,取得终身教职。很快,在1968年,Karl 接受了 Stuart Alan Rice (1932-) 的邀请,来芝大化学系任教,至今。26岁就成为芝大化学系正教授的 Rice 是目前芝加哥大学化学系最资深的教授,可能也是芝加哥大学化学系目前最接近诺贝尔奖的人。
可能终究还是兄长稍胜一筹,Jack 在1976年成为美国物理学会会士,1994年被评为美国艺术与科学院院士;Karl 则分别在1983年和2007年成为美国物理学会会士、美国艺术与科学院院士。
我曾向 Karl 问起 Jack,二人实在长得太像了。Karl 谦逊地说 Jack is a much better chemist than me(哥哥是远比我好的化学家)。
图:卡尔(左,芝大化学系官网),杰克(右,康奈尔化学系官网)。
Karl 是一位非常老派的、数学物理功底极扎实的理论化学家,属于在黑板上裸推公式讲课的那一种,曾在1970、80年代担任过芝加哥大学化学系的系主任以及 James Frank 研究所所长,长期在系里讲授量子化学等理论和计算类课程。授课时,Karl 简直是 GPA 杀手,常年使得课程平均分保持在30几(满分100)。我们好奇,难道 Karl 像《灌篮高手》中的安西教练,年轻白发魔,年老白发佛?我们这帮小屁孩真是太幸运了。
其实并没有。Karl 解释说,你们看看那些大联盟打棒球的,击球成功率只有30%,也配拿百万美刀的薪水。上我的课,能拿个30分,相当可以啦~
这个笑话太冷了……
Karl 就是这样,像是一个孩子,总爱说冷笑话,每三句就有一句笑话,常常是他自己先笑起来;但是,一旦谈到学术,他双眼则直直地看着你,炯炯有神,仿佛此刻对他而言周围都不存在了。时至今日,我犹然记得,第一次与 Karl 同桌吃饭,他问我们:What is the difference between molecular modelling and simulation?分子模拟与分子模拟的区别是什么?都是模拟,区别是什么?
Karl 身体不好,罹患帕金森症几十年,看上去比同龄人更老一些。2016年的一天凌晨,Karl 突然中风,所幸 John 就住在隔壁,及时将之送到校医院,才并无大碍 —— 这件事却实实在在吓坏了组内所有人。这之后,Karl 只能在晴好的天气里请他自90年代起便资助的波兰裔的博后研究员 Jack Douglas 接送来学校工作,雨雪天则再也来不了了。
中风恢复后,Karl 也没有任何要离开研究一线的意思,依然每年到了点就去申请经费,时常铩羽,偶尔成功,依然每年还要发只有一个作者的研究性论文—— 自己编程、计算、画图、写稿,依然还参加系里的报告会和学生的组会,依然还把我叫到他家里去给他讲数据。直到新冠来袭。
John 和我分别是 Karl 自1968年至2019年这长达半个世纪的学术生涯中所培养的最后两位博士。
Tobin 是芝加哥大学生物物理博士项目的主任(Director)、生物化学和分子生物学系的主席(Chair)。
Tobin 于1989年从哈佛大学获得应用物理学的博士学位,师从 Paul E. Sokol,研究方向是冷原子实验物理,是Sokol 最早的学生之一;Tobin 在博后阶段转向生物物理实验,在宾夕法尼亚大学跟从氢交换质谱(hydrogen exchange mass spectroscopy)的先锋 S. Walter Englander(1930-),研究方向大幅转向到了蛋白质的折叠和动态。
Tobin 出生于1961年的加州圣迭戈,犹太人,戏称自己是 California Jew,意为超世俗化的无神论加州犹太人;鹰钩鼻,浅棕头发,中等身材,胸围极阔,胳膊孔武有力;热爱运动,读博时卧推120公斤,同时全马跑进3小时30分,近60岁了还每周踢足球,曾一度让楼里与他不熟的中国学生以为他是40岁的老博后。他思维跳跃,对数据和图标物理直觉极好,对学术问题一丝不苟,穷根问底,对发表的数据一定要查验再三,结论一定要求建立在坚实的数据和严密的逻辑上 —— 这也让课题组里的文章发得极慢。
图:本人摄于2015.4,托宾持球。
因为学术兴趣的趋同,研究理论高分子物理和化学的 Karl,与研究蛋白质和 RNA —— 两种特殊的生物高分子的生物物理性质的 Tobin,在2000年代初开始了长达20年的学术合作,共同培养了十数位蛋白质折叠和动态方向的博士和博后。
Karl 和 Tobin 对学生都极好,几乎在我们需要问问题时无时不在,也几乎在学术上完全放羊,给予学生在选题和研究方面极大的自由。
师兄弟姐妹们都受益于两位导师的教学法,包括John。
我和师兄 John 共事四年(2014 - 2017)。我的博士论文的前半部分是 John 亲自指导的,而后半部分则是对 John 的博士工作做一些延伸 —— 没有 John,我不可能博士毕业。
以我对 John 的了解,我认为,John 带领 AlphaFold 团队的成功得益于他在以下四个方面的知识和能力。
John 出生于阿肯色州的一个小农场主家庭,青年时帮家里养马,做农务;本科就读于离家不远的私立名校,范德比尔特大学(Vanderbilt University),学习理论物理。学士毕业后,他即前往英国剑桥大学读理论凝聚态,但是在剑桥只待了一年便返回了美国。—— “Don’t like the weather there.” 他不喜欢那的天气。
严格的数学与物理学的科班训练,使得 John 在日后研究蛋白质折叠的分子动力学问题时,能够始终关注到模型背后的物理含义,特别是从统计力学方面的角度;而扎实的数学物理基础又使得他能准确、迅速地理解并掌握深度学习模型。
2、足够的蛋白质领域知识
从研究方向而言,蛋白质计算是我们的专业知识(domain knowledge),John 本人对此的积累起始于他回到美国后。返美后,他去了位于纽约的“D. E. Shaw 研究所”(D. E. Shaw Research),研究蛋白质折叠和伊辛模型 (Ising model)。
D. E. Shaw 很传奇。他从斯坦福大学计算机系博士毕业后敏锐地用优化的代码,在彼时还使用着低效代码的股票市场,以高频交易赚取了巨额利润,身家钜万。而后,他出于研究科学问题的理想,创立了 Shaw 研究所,延揽软硬件方面的人才,从最基础的硬件架构开始设计专门用于模拟蛋白质的超级计算机以及程序。Shaw 成功了。他的研究所一度模拟出世界上最接近真实时间尺度的蛋白质运动轨迹。
John 是 Shaw 研究所的早期员工,参与了 2010 年其发表的著名《科学》论文 —— 《蛋白质结构动力学的原子级别刻画》。这篇论文 Shaw 本人是单独的第一作者,而其他所有人则是“共同第二作者” —— 高水平论文的署名是不拘一格的,不能依照某些人的观点,超过了几位共一就不行。再举一例,AlphaFold2 的Nature论文有19位共同第一作者,其中John排在第一位,而位列第19共一的 Hassabis 事实上是论文的最后一位(通讯)作者,与第18位共一作者的中间还夹着十几位作者。
图:Shaw et al., Science 2010.
John 在 Shaw 研究所不仅积累了丰富的蛋白质折叠相关知识,而且实践了各种计算化学工具。例如,他自己为 Shaw 研究所开发了方便的轨迹可视化工具 —— 可同时检查轨迹内分子结构、体系能量、结构偏差值(RMSD)等多种分析函数曲线。
另一方面,公司内不同于学校的的工作研究环境令 John 的工作风格非常职业化(professional)。关于这点,我们后面展开说。
值得一提地,2010年前后,Shaw 给 John 的年薪超过20万美元。2011年,因为 John 的爱人来芝大读博,他也辞去工作同来芝加哥读书。入校后,学校提供的助教、助研工资在税后不足3万。
3、高超的编程技能
John 的编程能力可能是我见识过的同学、同事里最高的;当然,我不了解 CS 专业,比较的对象都是身边化学、物理等方向的师友。
John 很自负 —— 他不称自己是化学家,尽管我们都在化学系中,而称自己是物理学家;与此同时,他自称,“I’m a self-taught computer scientist.”(我是一个自学成才的计算机学家)。
熟悉并熟练地运用多种编程语言,如 python, C++, R, bash 等,现在已经被视为计算化学家的基本素养之一。我仍然想强调,会写和写得好,二者区别极大。
John 的博士工作,完全由他自己一人写了一套完整的原子精度的粗粒化的蛋白质分子动力学软件,名为 Upside,在GitHub上完全开源。—— 完全开源是我们组的一贯风格,任何我们发表的学术成果,都应当能够不仅能被我们自己完全重复,也必须能被他人重复。
极强的编程能力使得 John 一方面能快速实现自己的想法(idea)并测试,另一方面在得到测试反馈后能迅速进行新一轮的实验。
一件逸事:John 出于自己的性格原因,不喜欢远行开会。例如他从来不去领域内的生物物理年会,就连“近在咫尺”的圣母大学举行的一年一度的蛋白质折叠会议他也不去。老板 Tobin 每每代他讲解、展示、宣传实验方法和结果。我第一次看到 Tobin 帮 John 做展示 PPT 和海报时依然震惊地问,你是教授,居然代学生做PPT海报,言下之意是你咋不帮我们其他人做?Tobin 的回答很直接,“我想让 John 有更多时间写程序,他走了,我招不到代码写得这么好的人了。至于你们,当然得自己做。”
John 对电脑硬件也很熟。我刚入组时,John 得知芝加哥市政府的公共交通管理部门要处理一批一百多块旧CPU,他主动联系了他们,带着我去了他们的机房,一块块地将CPU拆下来,带回学校,再装到了我们自己的超算上。
图:John 的博士工作简介。
4、深刻的深度学习理解
John 很懂深度学习(deep learning),比课题组内的任何人都懂得多得多得多,包括我们的两位导师。这也意味着,无论是 Karl 还是 Tobin,都无法在深度学习模型方面给予他指导。实际上,Karl 和 Tobin 都说过,John knows much more than I do.(John 懂得比我多得多。)
研究上,John 与芝加哥丰田技术中心(TTIC)的王晟博士交流很多。芝加哥丰田技术中心位于芝加哥大学的校园边缘,是一个独立的研究机构,专注于将深度学习应用于各个领域;因为其与芝加哥大学存在紧密的联系,所以二者的师生互相交流频繁,芝加哥大学的学生可以去 TTIC 做博士课题,TTIC 的教授也能在芝大开授课程。王晟博士当时是许锦波教授的博士后,研究蛋白质的结构预测问题,参与我们课题组的组会,在大约两年内和我们的组员无异。
当然,读博士期间的大部分知识本来就是要自己学,导师能给一个方向性指导已经足够。
下面谈谈 John 的工作风格。
1、非常职业化(professional)
即使在学校,John 的工作风格也非常职业化。
具体表现为:对上级(导师)和同事,关于学术问题有问必答;尽快回复对方的邮件。Tobin 常调侃,无论何时给 John 发邮件,总能得到他迅捷的回复,而有时候,John 回复邮件的时间却显示为凌晨4、5点。
John 在入学后第二年就与爱人生了大女儿,由于夫妻俩都要读博,那么 John 索性在家工作,由妻子去学校实验室做实验。这样,仅在每周组会时,John 会来学校,有时抱着女儿一起来开组会。其余时间,John 会偶尔下午来学校一小会,和老板汇报一下进度,讨论数据。
第四年时,John 的长子出生令他更忙了,工作都是利用带宝宝的间隙做的。
另一方面,John 对正在进行的项目有明确的阶段性的“估计完成时间”(ETF, estimated time to finish),会不断和 Tobin 以及 Karl 汇报更新。也就是说,John 不会埋头一个人做做做,让导师处于盲然状态;相反,他会自觉、主动、定期地与上级交流,保持沟通,更新目标。这是一种非常良好的职业化工作风格。
2、非常实际(practical)
对待学术问题,建立模型,处理数据,John 追求数学和物理意义上的严格(rigor),但不追求数据上的极致拟合。他理解做计算需要在精度和计算速度等方面作平衡。他时常挂在口边的一句话是:
All models are wrong, but some are useful. (George Box)
所有模型都是错的,只是一些有用而已。(乔治·鲍克斯)
他的毕业论文扉页上也用了这一句话。
另一方面,他不拘纹饰小节。比如,即使是他自己的博士毕业答辩,他也只用了白板PPT,和没有对齐的图片,没有调整的字体。—— 当你的科学内容足够重要,足够引人兴趣时,谁还关注你用了什么字体,用了什么PPT花边?相反,反反复复纠结于字体的大小、颜色等等细枝末节是舍本求末。
在生活方面,不只有一位同事问过他,为何在毕业后不继续学术生涯,以他的才能,做教职不是难事。他的回答也很直接,我存的钱快花完了,我还要养孩子啊。—— 不顾家式地追求个人理想绝不是好的选项。好男人必须要顾家。这也是“实际”的一个方面,学术工作是生活的一部分,且只是一部分。
现在,他在 Deepmind,既享受着高薪,也继续自己热爱的学术课题,两全其美!到英国后一年,他的二女儿出生了。家庭事业双美是因为不将家庭置于事业之下。
3、非常善于教学(heuristic)
与 John 不熟悉的人,在观察他的言行后,很容易得出结论,“John 是个倨傲的人。”
我自己最初就认为 John 的说话方式总是居高临下,而与我同届的隔壁组做计算的印度同学拉米特(Ramit)也曾向我抱怨,说 John 讲起话来总是给人以一副屈尊俯就的感觉。—— 这并不奇怪,似乎恃才的人总须傲物。
但是,John 其实并不是这样的人。渐渐与John熟悉后,我发现,John 十分愿意分享他的知识,特别是对愿意虚心请教的人,他通常表现地非常有礼貌。如果向他提问的人愿意倾听,他能够恰到好处地、精准地,从提问人水平之下一点点开始讲解,很耐心地,逐步深入,直至讲到提问人无法短时间理解的难度。
说实话,我很少到如此善于教学的人:因为这体现出 John 不仅非常全面且熟练地掌握那些知识,而且他能够准确估计出对方的水平,并因材施教;在此过程中,John 还非常耐心。
芝大的办校宗旨之一是成为众师之师。从这个意义上说,John 是母校培养的合格人才。
4、很幽默(humorous)
爱幽默是性格,置于工作中则是调节工作氛围、增进人际关系的良好润滑剂。爱笑的人更显帅气。
我在学习 John 代码时,注意到 Upside 中,他设定的随机数种子(random seed)是 42,闲聊时便对他提起。
“Of course, IT’s 42.” 当然是42,他回复我。
懂的都懂吧?
42 是英国科幻作家道格拉斯·亚当斯的被誉为世界最幽默科幻小说的《银河系漫游指南》中宇宙的终极答案。—— 马斯克也曾在“星舰”的发动机上刻上“42”。
深厚的数学、物理学功底, 足够的蛋白质领域知识, 高超的编程技能, 深刻的深度学习理解。
非常职业化(professional), 实际(practical), 善于教学(heuristic), 很幽默(humorous)。
拥有深厚专业知识和工作经验,善于教学,言谈幽默,工作高效,注重实际效果,这样的人很自然地能在一个团队中成为核心和领导。高智商、高情商的正常的不古怪不乖张的人就是我们需要的复合型人才。
最后,John 喜欢喝可乐(不要健怡!)。
本文转载自微信公众号“小王随笔”@xiaowang_essay,原标题为《AlphaFold首席科学家John Jumper荣获2024年诺贝尔化学奖》。
相关阅读
1 2024化学诺奖接力青睐AI,蛋白质结构预测新工具获一半奖项
4 颜宁等点评:AI精准预测蛋白质结构,结构生物学何去何从?
5 解决生物学50年来的重大挑战!生物界“AlphaGo”精准预测蛋白质结构
近期推荐
2 中国小伙反直觉发现登Science:从基础光学公式找到神奇应用
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
长按下方图片关注「返朴」,查看更多历史文章