专栏 | 书中自有黄金屋——哥伦比亚大学教授大卫·肖尔(David E. Shaw)“任性”做科研
正文共: 4220字 9图
预计阅读时间: 11分钟
大卫⋅肖尔博士
在当今的学术界从事科学研究,科研经费是必不可少的经济保障。许多科学家的最大愿望,就是有充足的经费来进行科学实验,为此,他们需要撰写各种基金申请,向政府部门或私人基金会游说求告,争取到有限的一点课题经费。每当这个时候,囊中羞涩的老九们常常会仰天长叹,心里涌起一个念头:“什么时候等老子有钱了,自己掏腰包搞科研,想做什么做什么,再也不用受气去申请科研经费!” 这样一种类似于痴人说梦的境界,真要实现起来可真不容易。但是,哥伦比亚大学教授大卫⋅肖尔(David E. Shaw)就做到了这一点。
大卫⋅肖尔21岁那年从加州大学圣迭戈分校以优异成绩毕业后,来到斯坦福大学攻读计算机科学博士学位。在读博期间,他就成立并运作了一家软件公司,因此花了八年时间才拿到博士学位。博士毕业后,30岁不到就来到位于纽约的哥伦比亚大学担任计算机科学助理教授。他是一位远远走在时代前面的学霸,在计算机还处于单板机的时代,他已开始研究如何在非冯⋅诺依曼超级计算机构架上进行大规模并行计算问题。然而,身处世界金融中心的纽约,华尔街的诱惑还是巨大的。1986年,资本大鳄摩根⋅斯坦利银行开出六倍于他的教授工资的薪水,将他挖到大摩的分析交易技术部门,从事将计算机技术用于金融市场的研究工作,从此,他的注意力便集中到定量分析股票市场中的各种技术,如统计套利和自动化交易。一年半之后,他觉得在大摩这样的银行里干事有太多的限制,于是,他离开大摩,成立了以自己名字命名的对冲基金——德劭集团(D. E. Shaw & Co.)。
公司以两千八百万美元起家,开始雇用了六名员工,在格林威治村附近的一个顶楼办公室起步。德劭集团雇用的全部是优秀的数学家和计算机科学家,他们建立复杂的数学模型,用计算机跟踪分析市场的变化,找出隐藏的市场趋势或定价异常,挖掘常人不能看到的微小的获利机会并进行高频交易。与华尔街证券交易大厅里的喧嚣嘈杂和随机性不同,德劭集团里的交易都在计算机上完成计算和进行交易。公司成立之后的六个月,第一次交易就让他们狠赚了一笔,从此一发不可收拾,每年以高于华尔街平均收益的水平高速发展,并在其它公司纷纷赔本的金融危机时代仍能赚钱。至2015年7月,公司管理的资本已达三百七十亿美金,员工超过一千五百人,成为全球前25名的对冲基金。在公司最初的八年里,肖尔就投入了一亿美元用于计算机硬件的购买和独门绝技算法的开发,使得公司成为华尔街远近闻名的定量技术最好的公司,肖尔也获得了华尔街“精算之王”的美称。在其高峰期,德劭集团的交易量甚至占到了整个纽约证券交易所交易量的5%。随着公司的成长,肖尔的个人资产也在不断增长,据福布斯杂志统计,2015年,他的个人资产达到47亿美元,在全球富豪榜上名列第405位,在美国名列第 133 位。
在德劭集团成立的早期,肖尔自己必须亲自参加到科研之中,应用他的计算机科学技术,解决金融市场的问题。随着公司的成长,他把更多的精力放在了公司的管理、运营和决策上。这个时候,他觉得自己离开科学研究越来越远,人也似乎变得越来越笨,这让他觉得甚为不安。于是,在工作之余的夜晚,为了消遣和好玩,他自己找一些小的理论问题,写写画画,尝试着给予解决。也就在这个时候,他的一位犹太朋友、哥伦比亚大学化学教授理查⋅弗里斯内(Rich Friesner),常常和他聊起计算化学和计算生物学中的一些困难问题。虽然当时肖尔还不能理解其中的化学和生物含义,但是这些问题,经过他的一些分析和思考,往往可以化解为计算科学的一些特例,得以圆满解决。与弗里斯内教授的交流,再次唤起了他对科学领域研究工作的兴趣,他十分怀念早年在哥伦比亚大学的研究团队和环境,于是,在财务上取得完全自由之后,在50岁生日来临的时候,他做出了一个决定,退出德劭集团的日常管理运营工作,选定一个可以充分发挥自己计算机科学专长的领域,比如计算生物化学,再来一次华丽大转身,全职回归到科研事业中来。肖尔说干就干,他自掏腰包,于2001年成立了德劭研究所(D. E. Shaw Research)。
德劭研究所招来五十几位顶尖大学毕业的计算机、化学和生物博士,开始进军生物大分子的分子动力学模拟研究。德劭研究所成立伊始,他们在著名科学期刊《自然》和《科学》上登出广告,高薪招聘化学和生物及计算机人才,到纽约市中心时代广场旁边的摩天大楼里与金融达人们同楼工作,并肩战斗,这种天上掉馅饼的大好机会,吸引了无数有志青年前去应征。
大卫⋅肖尔从事的生物大分子的分子动力学模拟研究,就是用计算机的方法,来研究生物大分子例如蛋白质和DNA的行为。举个例子来说,蛋白质分子是组成人体一切细胞和组织的重要成分,是生命活动功能的主要承载单位。科学家通过长期的研究揭示:蛋白质的一级结构即氨基酸序列,可以通过自我折叠和组装形成具有功能的三级结构,即一级序列决定三级结构。因为这项研究,美国化学家克里斯蒂安⋅伯默尔⋅安芬森(Christian Boehmer Anfinsen)还获得了1972年的诺贝尔化学奖。机体内蛋白质的错误折叠会造成相应的疾病,如老年痴呆阿尔海兹默症和疯牛病。所以,研究蛋白质折叠,也可以说是破译“第二遗传密码”——折叠密码,这一课题,被称为21世纪分子生物学尚未解决的一大难题,采用实验的方法研究目前进展甚微,采用分子动力学计算这种理论模拟方法,则可以大有可为。然而,由于计算机计算速度的限制,加州大学旧金山分校的科尔曼教授,曾在匹兹堡超算中心采用当时最大型的超级计算机,日夜兼程地运算分子动力学程序一个月,仍然只能模拟到蛋白质折叠进程前500纳秒(1 纳秒等于十亿分之一秒)的行径,而蛋白质的完整折叠过程,发生在毫秒(1 毫秒等于千分之一秒),因此,要想完整地模拟蛋白质折叠过程,科学家们还有很长一段路要走,必须要改进分子动力学方法。而这个领域,正是肖尔的拿手好戏。
工欲善其事,必先利其器。肖尔采用了一手硬一手软的办法来改进分子动力学模拟方法。在硬件方面,由于分子动力学要进行大量简单重复的作用力计算,肖尔考虑把这部分工作固化到计算机芯片上来完成,这样可以大大提高计算速度和效率。他自掏腰包,到英特尔公司设计定制了一批特殊目的专用芯片,用这些芯片搭建了一台包含512个节点的特殊超级计算机,取名安东(Anton),以此纪念17世纪发明了世界上第一台显微镜的荷兰人安东⋅范⋅列文虎克,他也将这台超级计算机称为“计算显微镜”。这台特殊的超级计算机别的事情都干不了,只能专门用来进行分子动力学计算。安东超级机的计算速度,一下子将当时世界上最快的分子动力学模拟计算提高了数百倍。在软件方面,尽管学术界已有了几个常用的分子动力学软件包,但其中的很多算法都没有经过优化,德劭研究所另起炉灶,用最先进的算法和技术,重新编程了分子动力学程序,取名德斯蒙得(Desmond),这个崭新的软件包,比坊间流传的分子动力学程序又快了上百倍。有了安东和德斯蒙得这两件利器并将它们结合起来,肖尔和他的团队,在生物大分子动力学模拟方面,从此如虎添翼,所向披靡,无人可比。很快地,他们就将蛋白质折叠的模拟推进到前人从未达到的毫秒级,使人类从理论模拟的结果上第一次看到蛋白质折叠的每一个细节。另外,他们也开始模拟研究药物分子是如何与药物靶标蛋白质相结合的,为研究抗肿瘤和抗老年痴呆药物开辟道路。以肖尔领衔的德劭研究所科研团队,频频在国际高水平科学杂志比如《自然》和《科学》上发表高影响的重要论文,一次次让学术界亮瞎了眼。
大卫⋅肖尔对计算生物化学的杰出贡献,得到了学术界的广泛认同和赞许。凭借着近年这些科研成果,他于2007年当选美国艺术与科学院院士,于2012年当选美国工程院院士,更于2014年当选美国科学院院士。他还先后被克林顿总统和奥巴马总统聘请为科学技术顾问,担任全国教育技术委员会的主席。除了领导德劭研究所之外,肖尔目前还是哥伦比亚大学计算生物学中心不拿工资的兼职教授。
十几年前,在美国化学会年会上,笔者曾经有幸聆听了肖尔的一次报告,介绍当时还在摇篮之中的安东和德斯蒙得两件神器,他身为亿万富翁,但却低调谦逊,不断强调自己是生物研究领域的新兵,愿意用他的计算技术帮助这个领域更好地向前发展。从科学到金融再回到科学,很少有人能够实现这样的跨界大转移。有钱可以任性,任性地去做自己钟情的学术研究,任性地去做对人类有意义的重大课题,不受经费约束,不受人员约束,自由自在,海阔天空。大卫⋅肖尔的经历,圆了许许多多科研人员的梦想,也必将激励更多的科研屌丝,投身商海,成功后回头是岸!
2015年9月5日写于上海
备注:
原文于2015年10月27日首发于《海归学人》
参考文献:略
图片来源:正版图片、Wikipedia,public domains. All copyrights belong to the owners. Many thanks!
黎健博士专栏
身有彩凤双飞翼——斯坦福大学化学教授杰拉西(Carl Djerassi)的七彩人生
卡尔·杰拉西教授
浪子回头金不换!——化学生物学创始人斯图亚特·施莱伯(Stuart Schreiber)教授的传奇故事
斯图亚特·施莱伯教授
珍珠城里的珍珠——索尔克(Jonas Salk)博士与索尔克生物研究所
乔纳斯⋅索尔克博士
黎健博士
药明康德国内新药研发服务部副总裁
黎健,北京大学化学学士(1982)及博士(1987),美国斯克里普斯研究所(The Scripps Research Institute)博士后。加入制药工业界先后任职于美国德州生物技术公司(Encysive Pharmaceuticals)和美国强生医药公司(Johnson & Johnson Pharmaceutical R&D),在计算机辅助药物设计和新药研发方面具有20余年丰富经验,参加与领导多个项目的临床前发现与开发工作,在国际学术杂志上发表论文90余篇,申报新药专利170余项。2008年底回国加入药明康德,建设一体化新药研发平台,现任药明康德国内新药研发服务部副总裁、先导化合物研究国家重点实验室副主任、药明康德生命化学研究奖管理委员会秘书长。
黎健博士将应邀出席2019年7月12日、13日药时代主办的“新靶点 新技术 新机遇 助力新跨越!——2019中国抗癌药高峰论坛”,并做嘉宾演讲,题目是“AI技术在新药研发中的应用”。热烈欢迎朋友们参加,与黎博当面切磋交流!