【NGS接龙】原国家基因库负责人张勇:成长历练后的梦想追逐
由测序中国发起的“NGS十周年接龙”活动正在进行中。受百迈客CEO郑洪坤邀请,今日为大家讲述十周年故事的是原国家基因库负责人张勇,早在2000年他便与华大结缘,在华大的15年时间里让他对行业有太多的感悟。
说起我与生物信息相遇时的情形,依旧记忆深刻。我本科就读于北京大学计算机软件专业。准备读研的时候,生命科学院的李松岗老师打电话问我想不想去做生物信息。生物加信息,我的第一反应是,听上去是个有意思的事情,我立刻答应了下来。
2000年底,大四的第二学期,李老师把我带到了位于顺义的华大基因。也是从那时起,在北京华大的日子里,我几乎没有回过老家。相对艰苦的条件,在整个团队的激情面前显得微不足道。进入华大初期,我负责的项目是水稻基因组的框架图组装中新组装软件策略的尝试。当时,基因组领域还处在一代测序技术时期。对于组装软件来说,我们面临的首要问题是怎样让测序数据的基因组组装更高效?那个时候的大型计算机资源对于水稻基因组这样的项目已经显得捉襟见肘。为了节省内存消耗,甚至需要考虑到操作系统层面的内存分配算法,才能提高效率。这可以算第一次我用过去学到的知识来解决一个具体的问题。
Gane Ka-Shu Wong教授是华大基因最早做水稻基因组等项目的生物信息学专家,当时他还在华盛顿大学,我们几乎保持着每晚的在线沟通。他告诉我想要什么,我根据要求编写程序。我不分昼夜的写,写得快,bug也很多(王俊甚至为此还贴了一个活的虫子在我卡位上,以示警醒)。我的第一篇署名文章是关于水稻框架图的,发表于2002年Science。后来我主导负责了水稻精细图项目的全基因组突变和全基因组复制的工作。当时我们的野心很大,把三个水稻方向的研究,都投了Nature/Science,想一次发三篇。杂志社与我们沟通,希望整合为一篇文章发表,我们不太甘心,最后也丧失了机会。最终水稻精细图项目在水稻框架图的基础上提高了基因组质量,并整合了我负责的全基因组突变和复制后,于2005年在PLoS Biology发表。那期杂志的封面是一个小孩捧着一个很大的碗,里面是煮熟的米饭。“饭煮熟了”!
图片来源:PLoS Biology
后来,我组织负责了鸡多态图谱项目的生物信息工作,无数个不眠之夜后,最终文章于2004年发表在Nature上。
直到今天,每每谈论起北京的那段日子,大家都兴奋不已,感慨颇多。那是一段充满激情的日子。
2005年我在南丹麦大学做了3个月访问学者之后去慕尼黑做访问学者。2006年博士毕业后,继续在德国慕尼黑马普生化所蛋白质组与信号传导实验室Matthias Mann教授(他是诺奖获得者John Fenn的学生,致力于蛋白质组质谱技术和应用的研究和开拓)的实验室做蛋白质组方向的博后直到2008年,我重返华大。
华大早期科研项目大都偏生物信息分析为主,相比之下,实验方面相对弱势一些。这与我在国外的时候不同,因为在那里做实验的人是强势的,他们认为生物信息是个工具。他们想好要做的,让做信息的去分析。现在看来,其实无所谓谁强谁弱,与研究内容方向相关。值得高兴的是,今天华大在实验方面也是领域内的佼佼者,甚至在刚刚结束的国际基因组大会(ICG-10)上发布了自主设计生产的测序仪,说明华大在测序仪硬件方面也已经展露头脚。这种全面能力的展现,对于未来生物科研、产业的发展,无比重要。
2007年开始,华大也启动了二代测序相关的科研项目,那时的我主要比较关注蛋白质组方面的研究和发展,觉得我们可以做出很有意思的东西。现在看来,蛋白质组和基因组仍然存在着各自技术特点的关键性差异,这使得整个全球蛋白质组学科多年仍然未能复制基因组领域的飞速发展道路。
回国后,在华大我开始做科技服务和牵头部分科研项目,我想这是一个把科研成果转化为实实在在的生产价值的最佳实践过程。通过与合作机构、研究人员的深入交流与沟通,一个一个项目的筹建、谈判、实施、结题让我迅速成长。2008年,我签的第一个科研项目,签约金额即1200万。那个时期的我,对每一个项目都像自己的孩子一样对待,对每一个项目设计都是反复论证考量,项目开展过程中对待项目经费就像自己口袋里的钱一样珍惜,珍惜声誉,对客户负责。华大很早提出的许多科研项目(比如:测序在癌症基因组方向的应用),后来才陆陆续续在全世界慢慢开展起来。可以说那时候许多科研设计都是非常超前的,华大在二代测序的科研和应用领域是走在世界前沿的。当然也要承认,随着后续的不断发展,中国在科研基础能力方面的差距,慢慢影响到最终成果的产出、转化速度。
2011年我有幸成为国家基因库的负责人。深圳市许勤市长建议把市级项目升级成国家级。我主导完成了项目书的撰写,为了能够做一个有可持续发展的项目,我想了很多如何产生产业价值的想法,并且对项目的预算进行了仔细的计算和计划。我当时坚信,只要这个项目做起来,未来一定可以成为中国生物资源、数据的科研、产业应用的一个重要支撑,同时通过市场机制,也可以保证维持项目的可持续性发展。2011年9月,我去北京进行项目答辩,发改委、财政部、工信部、卫生部、多位院士和专家参加评审。最终,10月即获得特批,得到了国家发展和改革委、财政部、工信部、卫计委(前卫生部)四个部委的3亿资金支持,深圳市给予了1亿资金支持。
国家基因库最初设计了两个部分:一个是生物资源样本库,里面存放动物、植物、微生物、人等的各类样本、种质资源等。另一个是基因信息数据库,存放的是各类生物数据,测序类型数据最多,同时也会存储临床表型数据、农作物的表型数据等其他数据。后来为了更好的发展,我又增加了第三个部分“联盟网络”,实际上这样一个资源平台只有更好的和所有人合作共赢,才能取得真正长期有效的发展。
当时我们写项目书的时候,首先明确虽然基因库是华大运营,但它是国家的。第二,要让它可以去盈利、去反哺运营,用盈利的资金去推进基因库的进一步发展。当时,我对后续的运营模型做了很多设想,基因库中的样本不仅要包括物种的各个组学数据、表型信息等,同时这些样本要覆盖到科学研究、产业应用(临床应用、农业方面各类应用等)。如果这个巨无霸真的实现了,并且能够如期运营的话,对于整个国家甚至世界的生物产业都将起到一个发动机引擎的作用。
除了样本的收集和测序,在数据信息方面的策略我也做了很多尝试,NGS测序价格越来越便宜了,这些数据应该怎么去分析,怎么去建个云平台,怎么把各个组学揉在一起,怎么提供开放平台用于商业模式。今天,有很多类似的公司涌现出来,我坚信这一方向未来将有很大的发展,也许某个“独角兽”就在其中。总之,关于国家基因库,我那时思考了很多,不是思考怎么建起来而是在想怎么去用起来。
我认为当前的生命科学与15年前互联网是一样的。那个时候,大家对互联网都没有概念,而现在变成生活中不可缺少的东西。对于生命科学的信息化数据化,我甚至乐观的觉得15年太长,或许明天的晨光来临时,就会有无数新的应用对我们的生活产生影响。想象一下未来的巨无霸公司或许是现在某个只有一个或两人的公司,就像Google,FACEBOOK当年一样。因为我们根本不知道会发生什么,所以人人都有机会,人人都有可能!这恐怕是让我萌生离开华大的最重要原因,我想遇到更多更大的挑战,让生命延伸出更多的广度与深度。现在的我,离开华大后,看见的不是华大光环下的自己,是一个更真实的自己。
我对华大的感情特别深,他在我的心里有家一般的牵挂,有时候也有着恨铁不成钢般的惋惜。最近这一年很多人从华大出来,我觉得这是正面和积极的事情。大家出来以后都在尝试做不同的商业模式、不同的方向。但是我们身上依然有着华大的影子,我们的所有的尝试都在试图引领大众,培育市场或是寻找合适的商业模式。尽管华大有着雄厚的实力,但出于风险管控的考虑,项目方向的选择毕竟还是有限的。
这个领域创业的人的基数越大,最后成功的机会就越大,即使有90%的人失败,剩下的10%依然可以成就很多业绩。有朝一日,我很愿意把我的收获带回华大。汪老师的战略眼光和部署,我始终认为无人能及。如果有一天,汪老师的那些极具颠覆性的理念、方向被一一实现,那时的华大将更加大放异彩。我相信我们出去的这些人在完成了人生新的积累后,也会主动成为华大的伙伴、华大发展的参与者,支持华大去做前瞻和更具颠覆性的东西,让行业进入良性发展,实现生物产业的真正大发展。
NGS这十年,我想再次感谢华大给予我的成长空间与每一次的历练!希望我也能真正成长起来,有所收获!
都说天下无不散之宴席,虽然离开了,但梦想却会始终相牵。张勇博士点名华中科技大学生命科学与技术学院薛宇教授,继续讲述新故事。
回复关键词 “十年” 查看其他业内专业人士与NGS的十年故事
注:如需转载请注明来源(测序中国),谢谢!