探索生命的奥秘
以下是墨子沙龙“神奇的生命物理之美”活动(2020年12月19日)汤超院士的报告视频和文字整理。
很高兴今天来到墨子沙龙,给大家讲讲我们物理学家对生命现象的一些想法。
我先问一个问题,你们觉得谁是这个世界上最伟大的发明家和创新者?爱迪生、特斯拉?大家心里面都有自己的答案。但是我觉得这个世界上最伟大的发明家和创新者是大自然。大自然创造了生命,生命在各个层次上,从分子到细胞、到组织、到个体、到群体、到生态,都有非常精妙的结构和功能。这些都是大自然创造出来的,它超越了我们人类任何一个发明家和创新者。
我们对大自然创造的生命系统的理解,叫做“生命科学”。生命科学主要目标是研究进而理解大自然中的生命现象。但其实研究生命系统不仅仅是生命科学家的课题,也是所有自然科学家的课题,里面有很多有意思的数学问题、物理问题、化学问题、计算机科学问题、工程问题……生命系统本质上只是一个系统,所有的学科都可以从里面找到它的灵感,从而来推动本学科的发展,同时也反过来帮助我们对生命现象有更深刻的认识。所以可以把“生命”去掉,仅留下“科学”二字,把生命系统作为对象,用科学的眼光来研究它。
在中学甚至大学的教科书里面,生物学似乎和其他的科学没太大的联系。生物学都是许多事实的堆砌,比如各种各样的物种、细胞、分子,学习时要记很多事实。相反,其他学科,比如物理学,就非常简单,本质就是一些公式,不用记住任何事实。然后用这些公式,就可以解释,甚至是定量解释很多大自然的基本现象。这跟我们的教科书中看到的生物学,好像风马牛不相及。
其实生命系统里蕴含了很多的数学、物理学、工程、计算机科学的原理,它们都是相通的,只不过我们把学科人为的划分开来,用自己的眼光来看生命系统。但大自然是不分学科的。
举一个简单的例子。这个世界上所有带翅膀、能飞的东西很多,但将其质量和飞行速度画在对数坐标系上,横轴是飞行器的质量,纵轴是它的飞行速度,可以发现它们都分布在一条直线的附近(见下图)。小到蜻蜓,大到波音747,不管是大自然发明的飞行器,还是我们人工设计的飞行器,万变不离其宗,都要满足这个定量的定律。
你就会问这是什么定律?为什么它们都要在这条直线上?这就是流体力学的规律。飞行器想要上天,它的升力必须能与重力平衡。而流体力学告诉我们,升力和机翼的面积成正比,和飞行速度的平方成正比;重力自然和体积成正比,体积和面积又有一个简单的关系。如果我们仅关心数量级的话,把这三个公式联立,就发现它的飞行速度必须是正比于它重量的1/6次方。这条对数轴上的直线就是1/6次方,斜率就是1/6。
所以,生命系统比我们早数亿甚至数十亿年,就独立地发现了流体力学。我们是到后来才发现了流体力学,当然制造的系统也就必须遵守流体力学的定律。在这里你就看不出什么是生命系统,什么是人造的系统,它们遵循的规律都是相通的。
再举一个例子,在大自然的生命系统里,有很多非常漂亮的图形,当中蕴含了很多有意思的数学。其中一个与螺旋形的植物有关。如果你把这些看上去带圈圈的植物找出来,比如菠萝、向日葵、松果等,统计出不同方向旋转的圈数或者线条数,可以发现一个规律。比如图里的向日葵,顺时针转的线条数是34,逆时针的是21;菠萝朝两个方向生长的线条数是8、13。它们都是斐波那契数列中相邻的两个数。这个数列定义非常简单,就是它后面的数是前面两个之和,你看1+1=2,1+2=3,2+3=5,3+5=8,5+8=13等等,直到无穷。带螺旋形的植物基本都满足这个简单的数列,。
可能有好奇的同学会问,为什么说基本上满足,而不是100%都满足?为了解释这个问题,有一个瑞典的中学老师,组织了他们整个学校的中学生和部分外校的学生,大概几百人,到超市去找菠萝,到大自然去找向日葵和松果,统计它们的线条数是不是这个数列相邻的两个数,他们发现80%都是。之所以另外的20%不是,是因为植物长在自然界,总是会遇到一些各种各样的极端环境,可能被鸟啄了一口,被人踩了一脚,或者被野兽踢了一脚。但如果它能够正常生长,都会满足这个规律。老师带这些学生做的这样的工作,最后发表在Science(《科学》)杂志。为什么它们满足这个规律?现在只有一些模糊的解释,其中尚有未解之谜。
我们再把目光转向细胞。细胞中有细胞核、线粒体等,还有一种片状的细胞器,叫内质网。内质网可以折叠某些要运到细胞外面的蛋白质。比如胰岛素,因为折叠时,需要一种特殊的氧化环境,因此只能在内质网里面折叠,而不能像其他的蛋白质在细胞质里折叠。几年前科学家对内质网的具体结构并不清楚,只大概知道是片状结构,并且似乎是连起来的,所以直到如今的教科书可能还是左下图这种模糊的画法。但是在2013年,MIT的物理学家和生物学家合作,利用高分辨的电子显微镜把内质网三维结构解析出来,如下中间图所示,上面有很多小白点,是折叠蛋白的核糖体。内质网的每一圈上面停满了这些核糖体。
这个结构像什么?是不是非常像停车场?为什么这个结构会跟停车场的结构一样?首先是效率,停车场需要在有限的空间里停尽量多的车,内质网要在有限的空间里放尽量多的核糖体(图上这些白点叫折叠蛋白)。此外停车场必须是连通的,因为车要开上开下;而细胞器内质网也要连通,因为内质网内部的环境必须相同。此外,还要求有平整的表面:如果停车场表面坑坑洼洼的,汽车会很费油;如果内质网坑坑洼洼的,维持形状会很浪费能量,所以内质网就需要尽可能平,表面能量尽量少。更神奇的是在几百年前数学家还不知道可以造成这样停车场,也不知道有这样一个细胞器结构的时候,他们就凭空想象出了这样的结构,叫螺旋面,是螺旋线推广成平面的结果。而这样的研究,就是微分几何的前身。所以这个工作出来以后,有人评论说这是细胞中的微分几何。在这里生物、工程、数学又连起来了。
下图所示的真菌是克莱因水玉霉,头上是它的种子。如果它想把它的种子传到尽可能远的地方去,应该怎么做?它们进化出了“枪”。有人可能觉得枪是我们人类首创的发明,但它们早就发明了枪:它可以发射速度高达二到五米每秒的“子弹”。看上去不是很快,但其实它的加速度已经比人类手枪打出来子弹的加速度还大,更比火箭发射卫星的加速度大很多倍。它可以将种子打到2.5米开外,对比自己一毫米的尺寸,凸显这是一个非常强大的枪。下面的视频(见文前演讲视频中)展示了真菌“枪”发射的过程,这是高速摄影机拍摄的慢镜头。我们人类沾沾自喜的一个工程上的杰作,在生物世界里早就被发明了,你说大自然是不是最伟大的发明家?
再来看一个视频(见文前演讲视频中),这是一群正在飞翔的鸟,变幻莫测的阵型背后有很深刻的统计物理问题。这群鸟处在一个统计物理上的“临界状态”。临界状态是指有非常长程的相互作用,就是我不光跟旁边的人有联系,同时即使我看不到远处,也跟很远的人有联系。这种联系是怎么产生的?统计物理里的临界现象可以解释。这群鸟虽然没学过统计物理,但它们却知道如何应用统计物理。利用这种运动,既可以很有组织地飞行,又能很快的躲避危险。比如一个老鹰从某处飞来,整个集体就可以非常快地做出反应。
还有智能,人脑是很有意思的东西,但人类智能的出现却是大自然犯的一个小错误。为什么这么说?一般大自然地发明,都与其功能有关,目的是适应环境。鸟群需要高效飞行,才会利用临界状态;真菌需要把种子打得很远去,才发明了枪炮;细胞里面的内质网的结构也与其功能适应。但我们为什么要这么聪明?对大自然来说,人没有必要那么聪明,只要能够活下来就可以了。猿猴能活得挺好,并没有被自然选择淘汰掉,它们的智慧就足够了。所以我们是在进化的过程中,大自然开的一个小玩笑,是一个偶然。大脑的进化过程中,大自然将其中的很多神经元连起来,就产生了物理学中简单系统的“相变”、复杂系统的“涌现”现象。就是说每一个神经元单独产生不了意识;但把这些神经元连在一起,就忽然产生了意识,产生了语言、感情等等,这些都远远超出了生物学的范畴,所以我觉得它是大自然最大的创新。
有人脑作为参考,现在我们可以尝试模仿人脑,比如最近成为了热点课题的人工智能。我们有打败了世界围棋冠军的AlphaGo机器人;也有可以做图像识别的智能程序,输入一个图像,它可以识别出其中的内容。它们似乎可以做很多很强大的事情,但是我提醒大家一句,虽然人工智能现在能做到这些看上去很神奇的事情,但其实人工智能只是跟人脑学了一点点最基本的东西。如果我们对人脑的结构了解的更多,人工智能就会更强大。所以以后对人脑和人工智能的研究,以及二者的相互促进,是一个非常有意思的方向。
研究人脑不仅可以推进人工智能的发展,其中蕴含的深刻数学问题和统计物理问题,也能够推动其他学科的发展。
再举一个例子,大家可能都听说过信息革命里面的摩尔定律,摩尔定律说我们的计算机每过一年半,它的计算能力就涨一倍。下图显示的也是一个摩尔定律,图中是我们的计算机处理一个比特的信息(把一个0变成1或者1变成0),需要消耗的能量。计算需要能量,因此芯片能够越做越省电,也体现了技术的进步。从1940年一直到2010年,芯片能耗越来越小,处理一个比特信息的能耗呈指数型下降,这也是摩尔定律。这里的虚线kT是热运动的能量,是能耗的最小物理极限。热力学可以证明,至少在经典计算机领域(暂时不讨论量子计算机是不是也遵循这个基本定律),不能够用少于kT的能量处理一个比特的信息。更通俗的说,即使能把一个0变成1,热运动的热涨落也抹平这个信息,因此这是物理极限,不可能做到比kT更节能。按照能耗的摩尔定律,到2010年,我们就快接近kT的物理极限了,但实际情况是我们早早的偏离了摩尔定律,目前我们处在图上红点标注的位置,与极限还差的很远。
目光转向生命系统,它们处理一比特的信息要用多少能量?先来看看细菌,大肠杆菌在几亿年、几十亿年前就在蓝点标注的位置了,基本接近物理极限。它们精巧的结构使得它们早就掌握了用接近物理极限的能耗来处理信息的技术!
大概十年前,IBM做了一个超级计算机Watson,参与了一个叫Jeopardy的游戏。这个游戏有点像百科知识抢答,出一个题目让选手举手抢答,答对得分,答错扣分。那年这个游戏选出了两名冠军与超级计算机Watson比赛。虽然最终Watson赢了,但是这两个人大脑的能耗仅有20瓦,而小小的灯泡都能达到100瓦。我们的大脑可以用一个小灯泡的能耗,做出这么多事情。而这个计算机用的能量足足有100千瓦,才在这个游戏上把这两个人打败了。可以看出计算机和我们的大脑的有巨大区别。这启发了我们可以从生命系统里面学习如何做有效率的计算。
热力学第二定律,也叫熵增加原理,是物理里最基本的定律。众所周知,把积木搭起来不容易,而要把它推倒却很容易。在自然界,像这种混乱的状态总是很自然的发生。因此从左到右是自然的,从右到左是不自然的,需要耗费能量。在热力学里面叫熵增加定律,熵是指混乱度,即混乱度总是增加的。
生物系统却不是这样,它可以在一个混乱的状态中,比如在一群泥巴里面,蓬勃地生长,保持高度有序性,并繁衍后代。它是一个逆熵过程,总是能把无序变成有序。这是如何做到的?很多年前有个很有名的物理学家叫薛定谔,他是量子力学诞生的主要推动者之一,他的名字大家可能有所耳闻。他也想过这个问题,为什么生命系统和一般物理世界的现象不一样,他提出了负熵的概念。即生命系统吸收环境的能量,比如营养、太阳(光)等等,把它转化为负熵,因而熵在生命系统中不是增加而减少的。虽然这只是一个概念,但其中似乎蕴含一些定量的规律,能够写一些公式出来,让我们可以做一些计算、预测。所以,生命现象中是否蕴藏着新的物理,这不只是生命科学家的问题,也是物理学家的问题。
最后讲点数学。数学是我们在研究自然现象中积累出来的的一门非常抽象的学科。数学和大自然以及我们的日常生活有着千丝万缕的联系。比如几何跟丈量土地有关,代数和我们要做生意要加减乘除相关,发展到后来就抽象出一门独立的学科。牛顿在研究行星运动的时候,当时没有能够精确描述行星运动的数学模型,因此他不得不发明了微积分;而用微积分来描述行星运动,就非常顺手。香农研究信息论的时候,为了描述信息的传递,把信息论上升到数学的层面,也在寻找数学语言。比较幸运的是,他找到了概率论,概率论在某种组合下就可以定义信息。无独有偶,爱因斯坦研究广义相对论时,也希望找到一个数学工具来描述时间和空间的关系,他也找了很久。最后他找到了黎曼几何,这是数学家之前在广义相对论提出前发明的,对一般几何的引申和推广,可以用来描述质量对时空的弯曲。
那什么是生命的数学语言?我们还没找到。没找到的原因是我们对生命研究尚处在一个相对初级的阶段,但我个人觉得随着科学的发展,以后肯定能够找到。在生命的各个层次,我们的大脑、我们的细胞、我们的信号处理,都会有它独特的数学语言,所以这给数学家也带来很有意思的问题。
现在正好在进行生命科学第三次革命,大家生逢其时。生命科学发展得较晚,但现在正处于一个蓬勃发展的时期。什么时生命科学第三次革命主要标志?就是生命科学,和物理、化学、数学、工程等学科交叉融合。生命现象不只是生命科学家的问题,而是大家共同的问题。各领域科学家一起来研究,不光能加深对生命系统的理解,也能给原本的领域带来很多的思想源泉和挑战。
这是MIT发布的某一白皮书中的图,显示了生物学的三次革命。我们前面的两次革命分别是分子生物学革命、基因组学革命,现在正在进行第三次革命。大家会好奇前面两次革命是怎么回事?
第一次革命是分子生物学革命,大概从20世纪50年代开始。它把物理学中的工具和一部分思想,应用到生命科学领域。比较标志性事件是,女科学家罗莎琳·富兰克林利用X射线来照射DNA,得到DNA衍射图谱。X射线衍射最早由物理学家劳伦斯·布莱格、威廉·布莱克格父子首先提出,用X射线照射某种材料,X射线反射回来会遵循某些规律,这就是劳伦斯公式。通过X射线衍射,可以推出物质的结构,比如原子排布的紧密程度。直到20世纪50年代,虽然当时富兰克林才将其应用在照射DNA上,并成功得到了衍射的数据,但没能想象出DNA的立体结构。直到詹姆斯·杜威·沃森和弗朗西斯·克里克的研究,才把DNA的结构猜测出来。
克里克是一个物理学家,沃森是一个生物学家,这又是一个生物和物理相结合、相交叉的例子。众所周知的DNA双螺旋结构,标志着分子生物学的诞生。大家认识到利用物理学提供的工具,我们可以研究DNA、蛋白质的三维结构,可以在分子层面上进行生物学的研究。
第二次革命是基因组学革命,时间从上世纪80年代开始,也就是我们现在为人们熟知的基因组测序。我们所有的遗传密码都藏在我们的染色体里,染色体实际上就是DNA,将DNA堆紧,就成了一个个染色体。如果把DNA打开,它上面有四种碱基对的排列,四种碱基对可以用四个字母表示。四个字母的排列顺序构成了生命的所有遗传密码。如果把人类的DNA发射到太空中,被一个聪明的外星人拿到,就可以通过其中的遗传信息重造出一个人。因为技术的进步,各种各样的测序仪把测序进行得越来越快,因而基因组学革命进行得非常快。
我刚才提到,信息革命中有一个摩尔定律,即技术的进步总是指数型的。而在基因组学革命中,它比摩尔定律还快。横轴是时间,从2001年人类测出第一个基因组开始,到2019年为止,测一个基因组,例如人类的基因组有30亿个碱基对,所要花的钱,从一亿美元指数型下降到现在不到一千美元,所以技术的进步推动了生物技术往前飞速发展。
有人会说生物学已经进行两次革命了,我们能从分子层面研究生物学,也能把我们的基因组序列测出来了,那是不是生命科学很多问题我们都解决了?其实不是。如果把生命系统比作一辆会跑的汽车,分子生物学革命能把汽车的零部件观测得很清楚,我们都能看到汽车里面有方向盘、刹车、轮子、油门。我们身上大概有3万种不同的蛋白,就有3万种零部件。第二次基因组革命把汽车的说明书找到了。但现在基因组对我们来说是一部天书,基本无法搞懂,中间还有巨大的知识鸿沟。
现在第三次革命就是要让我们通过与各个学科的交叉融合,从不同的角度看待生命系统,来理解这个汽车是如何工作的:怎么组装,能跑多快,坏了怎么修,寿命如何。人类的寿命是什么决定的?我们并不知道。有人能达到80岁、100岁,为什么?能延长吗?这些应该隐藏在基因组中,但需要我们通过不同的角度,各个学科的交叉融合,还有技术进步来共同推动,把这些谜题给解出来。
美国科学院生命科学委员会在2009年出炉了战略性纲领报告:《21世纪的新生物学》。这个报告提出在本世纪会诞生一个新生物学。新生物学的标志是什么?各个学科交叉融合产生一个新生物学,传统生物学只是其中一部分。新生物学会对生物系统做出更深刻的理解,找出一些基础原理,写出一些公式,让生物学可以像牛顿方程一样进行可以预测,可以像工程学一样的进行制造。生命科学就实现了从一个观察性、定性的科学到一个定量的、可预测性的科学的转变。这会对我们社会产生非常深远的影响。这个报告举了几个例子,从健康、环境、能源、食品等角度说明会产生一些什么样的影响。
无独有偶,美国科学院凝聚态和物质物理委员会在2010年也出炉了一个报告。这个报告的名字叫《下一个十年的六大挑战》。阐述了物理学下一个十年的主要问题是什么。它列了六个问题,其中有三个直接和生命科学相关。有一个就更加直白:是什么是生命的物理,What is the physics of life?即生命现象里面会有什么新的物理。其他两个中,一个问复杂现象,像我们的大脑、智能,怎么从简单的零部件,如神经元等的相互连接中涌现出来。另外一个是问在远离平衡态的时候会发生什么?我们前面说的热力学第二定律,是平衡态的理论,即平衡态下有序总是向无序演化的。这个世界上,积木会变得越来越乱;但如果不是平衡态,如果家长有能量帮忙收拾积木的话,如果我们生命系统可以从大自然吸收能量来帮助自己,会发生什么?这里面也存在许多有意思的物理问题。
所以我希望大家听过这个简单的介绍,会有一个新的认识:理解生命,不只是生命科学的问题,也是所有自然科学的源泉与挑战。所有的自然科学,甚至包括一些人文科学、社会科学,都可以在对生命系统研究中找到思想源泉。
最后,回到最开始的问题,我认为大自然时最伟大的发明家和创新家,但大自然是怎么创新的?
大自然的创新通过进化而实现。最开始的时候,地球上没有生命。后来经过长年累月的慢慢积累,简单生命向复杂进化,最终形成了现在欣欣向荣的生物圈。但是进化是怎么发生的?进化的关键因素是什么?根据达尔文进化论,有两个因素:一个是变异,一个是自然选择。由于变异,遗传信息变得不同,大自然会选择更适合环境的个体生存下来。因此变异实际上就是提供了多样性。所以创新是想象不到,无法预测的,只有提供多样性,才能够有创新,奇迹才会发生。
有一个很有名的统计学家也是进化生物学家费舍尔(Fisher),在很多年前提出并在数学上证明了费舍尔定理,即任何物种在任何时候的进化速度,等于种群中的多样性,即进化的速度正比于方差,方差就是多样性。于是数学上就可以证明进化的速度是跟多样性是有关的,没有多样性就没有进化,我们就会越变越笨,也就没有了创新。
谢谢大家。
汤超:物理学家,中国科学院院士,北京大学讲席教授、前沿交叉学科研究院执行院长。在凝聚态物理、统计物理、非线性物理、复杂系统和物理生物学等领域做了许多开创性工作,多年来致力于用物理学思想方法研究生物问题,探索生命系统中的定量规律和设计原理。
由于微信公众号试行乱序推送,您可能不再能准时收到墨子沙龙的推送。为了不与小墨失散, 请将“墨子沙龙”设为星标账号,以及常点文末右下角的“在看”。
墨子沙龙是以中国先贤“墨子”命名的大型公益性科普论坛,由中国科学技术大学上海研究院主办,中国科大新创校友基金会、中国科学技术大学教育基金会、浦东新区科学技术协会、中国科学技术协会及浦东新区科技和经济委员会等协办。
墨子是我国古代著名的思想家、科学家,其思想和成就是我国早期科学萌芽的体现,“墨子沙龙”的建立,旨在传承、发扬科学传统,建设崇尚科学的社会氛围,提升公民科学素养,倡导、弘扬科学精神。科普对象为热爱科学、有探索精神和好奇心的普通公众,我们希望能让具有中学同等学力及以上的公众了解、欣赏到当下全球最尖端的科学进展、科学思想。
关于“墨子沙龙”