大科学时代,指数级增长的科学仍然拥有前所未有的朝气与活力
湛庐文化出品 2021年12月
导语
科学家什么时候能够迎来事业巅峰?科学创新的生命周期是多久?职业生涯中出现突破性进展的迹象是否存在?什么样的合作会带来成功?年轻的科研人员如何将成功概率最大化?这些都是科学学(the science of science)正在探索的问题。当我们把科学视为一个复杂系统来研究,会有令人兴奋的洞察。
由王大顺(美国西北大学凯洛格商学院教授、科学与创新科学中心创始主任)和Albert-László Barabási(美国东北大学复杂网络科学中心主任、无标度网络模型提出者)合作完成的新书《给科学家的科学思维》(The Science of Science)中文版于近日上市。本书中译版由贾韬(西南大学计算机与信息科学学院教授)和汪小帆(长江学者特聘教授、上海大学副校长)完成翻译。
《给科学家的科学思维》结合了复杂系统、网络科学、大数据、机器学习等方法,对科学学领域的前沿问题做了系统的介绍,展示了对科研创新发展规律与科学家职业生涯路径的最新认识,推荐给所有科研工作者。本文节选自原书第15章。
王大顺、AL. Barabási | 作者
贾韬、汪小帆 | 译者
邓一雪 | 编辑
1949年,德里克·德索拉·普赖斯(Derek de Solla Price)在新加坡莱佛士学院教授应用数学,当时学院的新图书馆收到了全套的《自然科学会报》(Philosophical Transactions of the Royal Society of London,简称《会报》)。《会报》于1662年创刊,是首个专门致力于科学研究的杂志。由于图书馆还在等待进一步的修建,德索拉·普赖斯将全卷《会报》置于自己的床头。他接下来花了一年时间一本接一本地阅读,并将《会报》每10年的杂志单独放成一摞。一天,当他从阅读中抬起头来,注意到了不同寻常的一幕:第一个10年堆积起来的杂志很薄,第二个10年也只厚了不多。但随着时间的推移,每10年一摞的杂志厚度增长越来越快,到最近的几个10年,其高度更是疯长。总之,这摞《会报》看起来就像一条经典的指数曲线。
正是这一关注使德索拉·普赖斯在随后的数十年,满怀激情地去系统性探索科学是怎样随时间发展的。1961年,他统计了他能获得的所有内容:科学期刊的数量、为这些期刊投稿的科学家的数量,以及多个学科中论文摘要的总量。无论从哪个维度来看,总是会得到相同的指数曲线。这证实了他最初的观点,科学正在加速发展。他最后总结到:“以令人震惊的速度发生的指数级增长,显然是普遍存在而且具有明显的长期性。”
但是,德索拉·普赖斯很快就意识到,这样的指数级增长很难维持下去。我们从菌群的研究中知道:细菌的数量在最初呈指数级增长,但最后,当维持它们的营养物耗尽时,增长也会达到饱和。因此,德索拉·普赖斯预测,科学的指数级增长肯定仅代表初始的迸发。推动科学增长的动力终将耗尽,最终达到饱和。他最后甚至大胆预测,科学的迅速发展在20世纪50年代不久之后,便会逐渐减弱。
科学体量的指数级增长
科学体量的指数级增长
图1显示了科学网每年编入索引的论文数量,证实了一个世纪以来,论文发表的数量一直呈指数级增长。平均来看,总数差不多每12年便要翻一番。图1还显示,科学并没有像德索拉·普赖斯所预测的那样,在20世纪50年代之后达到饱和。相反,指数性的增长在过去110年中一直持续,仅在两次世界大战之间有所停顿。另外,如果测量某一单独学科的增长情况,比如物理学,我们会发现相似的指数级增长。各个学科以相同的方式加速增长,表明科学的扩张并不是简单地由新领域的出现所驱动,而是一种适用于所有科学领域的特征。
图1. 科学的增长
科学网记录的过去一个世纪发表的论文数量,显示了科学文献的指数级增长。这一增长仅在1915年和1940年前后由于两次世界大战而中断。图1显示了物理学文献也呈指数级增长,与整个科学所遵循的增长方式相似。
科学的指数级增长对科学乃至科学家意味着什么?在本章,我们将尝试回答这些复杂的问题。
指数级增长的意义
指数级增长的意义
遵循指数级增长的任何系统,必须以与当前规模成比例的速度扩张。由于科学文献大约每12年增加一倍,这意味着当前全部科研论文中,有一半是在过去12年产出的。因此,科学的特点就是即时性:知识的主体总是保持在最前沿。此外,数量不断增加的科研人员往往与为学科带来变革的那些人处于同一时代。德索拉·普赖斯在他的专著《小科学、大科学及其他》(Little Science,Big Science,and Beyond)中对这一点有很好的表述。
在一次会上,一些著名的物理学家准备报告他们划时代发现的第一手资料,会议主席用了这句话作为开场白:“今天,我们非常荣幸地与那些为同行提供肩膀的科学巨人们并排就座。”这句话简明扼要地例证了科学特有的即时性,它也是对一个事实的认可,即已经发生的所有和科学有关的事宜,有很大一部分现在仍在继续,我们对此都记忆犹新。换言之,无论使用哪一种对科学家的合理定义,我们都可以这样说,80%~90%曾经在这个世界上存在过的科学家,现在仍然存在着。
为了认识这种指数级增长对个人意味着什么,想象一个处于职业生涯开始阶段的年轻科学家。他花了数年阅读文献之后,在学识渊博的导师指导下,最终抵达学科的前沿,准备闯出自己的一番事业。如果科学停止发展,他将在未知的海域里独自航行。虽然能够愉快地做出一个又一个发现,但同时他也将极其孤独,几乎没有什么同伴能与之合作或请教。因此,就这一方面而言,科学的持续发展是一个好消息,可以为科学家提供足够的志同道合的同事和有趣的构想,使他们能够借鉴彼此的研究,一道探索世界的未知领域。
但是,科学的迅速扩张也产生了另外一个问题。当我们年轻的科学家解开缆绳,将航船驶出港湾时,他将发现还有许多其他船只,大小不一,都朝同一个方向行驶,船长都经过同等水平的训练,具有同样的抱负、决心和资源。这种极具竞争性的环境,将对年轻科学家的整个职业发展产生严重的影响。
无论多么努力,他也不可能密切监视每艘船驶向何处。新知识的体量呈指数级增长,但一位科学家能够用来吸收新知识的时间是有限的。因此,今天的每位科学家是不可能遍读自己领域的每一篇论文的。
也许最重要的是,每一艘船都希望获得新的发现。确实,在科学界,率先发现一直都至关重要。年轻科学家希望在新的海域有所建树,而不是跟随在别人的船尾航行。但如此激烈的竞争,会削弱科学家个人做出重大发现的机会。
许多人对科学都有一个英雄般的构想,相信这一领域是靠少数天才推动前进的。但现实是,突破性的发现,往往是靠许多科学家多年辛勤工作的积累。认可之前的成果,然后试图迈出合乎逻辑的下一步,新的发现才有可能应运而生。弗朗西斯·培根曾经说过,所有的创新,无论是社会的还是科学的,“都是时间而不是智慧的产物”。换句话说,苹果熟了就会掉在地上,而与谁在旁边收获它无关。因此,如果某位科学家错过了某一特定的发现,其他科学家将会取而代之。毕竟,如果我们已经拥有一台蒸汽机和一艘船,要发明一艘汽船还需要等多久呢?
这可能是科学在很多重要方面与其他创造性活动不同的原因之一。如果米开朗琪罗或毕加索从未在这个世界存在过,艺术博物馆里我们为之赞叹的雕塑和绘画可能会有很大不同。同样,没有贝多芬,我们将不会有第五交响乐以及那与众不同的命运的敲门声。但是,如果哥白尼未曾在这个世界上存在,我们也绝不会得出有关太阳系的另一种不同描述,我们迟早会发现地球环绕太阳运行,而绝非是太阳绕着地球运行。
这对科学家来说有重要意义:苹果不会在意谁来收获它们,但对采摘苹果的人来说,能最先接近一个成熟的苹果是尤为关键的。如果科学是一场速度竞赛,由跑在最前面的人报告发现,那么科学的指数级增长就产生了一个重大的问题:不断增加的竞争会使科学实践更加困难吗?
答案并不是显而易见的。历史记录表明,消化并创建新知识的压力并不是新鲜事。比如在1900年,当皮埃尔·居里和玛丽·居里抢先发表有关放射性的论文之后,欧内斯特·拉瑟福德(Ernest Rutherford)写道:“为了保持竞争力,我必须尽可能快地发表我目前的研究成果。”或者想一想以下这则自白。
这个时代的痼疾之一便是书籍的泛滥,它们充斥着这个世界的每个角落,以至于我们没有办法消化这么多无聊的东西,而它们还在每天产生并涌入这个世界。
巴纳比·里奇(Barnaby Rich)说这段话时是1613年,半个世纪之后第一本科学期刊才得以发行。显然,被现存的知识量击垮的那种情感经历,对知识不断增加而感到的恐惧,远早于我们这一代就已经出现了。那么,科学的实践真的变得越来越困难了吗?为了找到答案,让我们把成功的科学家所需经历的步骤拆解开来,分析其中每一步在这个大科学时代是怎样形成的。
当一名科学家越来越难了吗
当一名科学家越来越难了吗
如今,要成为一位科学家,需要几个关键的步骤,不仅要获得适当的学位,而且还要获得能够使个人致力于科学研究的工作。快速增长的培训机会以及科学从业者数量都对这两个步骤有所影响。
获得博士学位
图2展示了在美国完成科学领域博士学位所需要的时间,表明这一过程在2007年所需的时间仅比30多年前稍长了一点。尽管在2007年之前的20年,这一时间略有下降的趋势,但在生命科学和工程学,获得学位所需的平均时间仍然是6~8年。事实上,大多数博士项目所声称的5年时间,对多数研究生来说只是一个梦想,仅有不到25%的研究生能设法在这一期限内完成学位要求,而55%的研究生需要7年甚至更长的时间。这些统计数据只计算了那些真正获得学位的个人,但掩盖了一个事实,即在美国开始博士学习的研究生有40%~50%未能毕业。
考虑到博士项目数量的迅速增加,考上博士似乎应该要容易很多。但为何获取博士学位却要花这样长的时间呢?各方面的数据表明,进入博士项目后,写出达到毕业要求的博士学位论文变得越来越困难。
比如就论文本身的长度而言,生物学、化学和物理学博士论文的平均长度在1950-1990年几乎翻了一倍,在40年里从100页飙升到差不多200页。论文所包含的参考文献数量同样也在上升,表明今天的研究论文建立在比以往更大的知识体量上。最后,作为胸怀远大的科学家职业生涯的重要里程碑,博士论文的要求也越来越高:将1984年上半年发表在3种主要杂志上的生物学论文,与2014年相同时段发表的论文进行比较,研究人员发现实验图表的插图数量(与论文一道发表的表和图)增加了2~4倍,这表明,成功发表论文所需的证据量也有显著的增加。
这些统计数据清楚表明获得博士学位变得多么困难。然而,获得博士学位只是迈向成功的第一步。
获取学术职位
普赖斯的那句“80%~90%曾经在这个世界上存在过的科学家,现在仍然存在着”,令人印象深刻地证实了科研从业者数量的指数级增长。但并不是学术就业渠道的所有部分都得到同等迅速的扩展。比如,每年获得的理学博士学位的人数在1998-2008年增长了将近40%,在构成“经济合作与发展组织”的34个国家中达到了34000人。但是,同样的30年,在这些国家的大学里,教师岗位数量却大多保持不变,甚至还略有下降(见图3)。
虽然并不是所有获得博士学位的人都打算谋求一个学术研究的职位,但如今,他们中的绝大多数人似乎都愿意选择学术研究,而不是在企业、政府,或非营利性单位工作。《自然》于2017年在世界范围内进行了一项调研,参与调研的5700位博士生中,有将近75%的人更倾向于选择学术岗位,而不是刚才提到的非学术性工作。对他们来说,图3所展示的趋势可能令人沮丧,一个稳步增长的博士群体不得不为数量有限的机会展开激烈竞争。
图3. 学术就业渠道
自1982年以来,理学和工程学(S&E)学科共授予了近80万个博士学位。这些毕业生要竞争约10万个学术教师岗位。每年授予的S&E博士学位数量,在这个时间范围内逐年上升,从1982年的19 000到2010年的40 000。然而,每年所空缺的教师职位数量却保持不变,甚至还略有下降。2010年,40 000名博士在竞争约3 000个学术岗位。
增加博士人数的一个后果就是,短期、非终身教职的博士后研究人员数量开始激增。美国博士后岗位的研究人员从1979年以来增加了3倍,在生命科学领域的增长尤为显著(见图4)。尽管博士后推动了许多学科的科研工作,但他们的回报却不尽如人意。在获得博士学位5年之后,终身教职岗位或企业科研人员的工资中位数高于博士后的工资中位数。
图4. 博士后的积压
美国博士后岗位科研人员的数量,从1979年以来增加了2倍多。绝大多数博士后来自生命科学领域。在所有研究领域,从获得博士学位后的前5年来看,博士后的工资中位数显然低于非博士后。
找到一个全职的大学工作前景暗淡,这意味着许多科研人员不得不在学术研究之外寻求其他工作。但他们离开学术界后的发展又如何呢?为了回答这个问题,研究人员在8所美国大学采集数据,并将匿名人口普查中的就业和收入数据,与这些大学的研究生管理记录关联起来。他们重点关注2009-2011年毕业的博士生,发现其中有约40%的人进入了企业,许多人在技术和专业服务行业中的大型高薪企业找到了工作。其中电子、工程和制药企业最受青睐。这些结果显示,离开学术领域的博士往往转投大型企业,他们工资的中位数超过90 000美元。相关研究还表明,科研人员在私营企业的总体失业率很低。根据美国国家科学基金对博士学位获得者的调研数据,2013年在美国拥有理学、工程学和卫生领域博士学位的人,总体失业率仅为2.1%,而全国25岁及以上人口的总体失业率是6.3%。
总之,这些数据表明,对于远航者来说,知识和机遇的海洋正在变得日益拥挤。在博士数量增加的同时,大学的空余岗位保持不变,竞争加剧导致博士后数量快速上升,更多的人离开学术领域,到其他领域寻求职业发展。但有一点很重要,即这种趋势未必对社会有害,对从事各类职业的科研人员来说同样不是坏事。迄今为止的所有迹象都显示,离开学术领域的博士们往往能找到充满成就感的工作。虽然他们可能不会创造学术意义上的知识,但是他们的工作往往会产生重要的专利、产品,以及创新的解决方案。因此,科学界的“失”往往会成为社会的“得”。
“苹果”越来越难以摘到了吗
“苹果”越来越难以摘到了吗
我们在前面说过,苹果熟了就会掉下来,也就是说,一旦知识体量达到一个临界点,科学的突破便成为可能。但随着越来越多的人试图前来收获成熟的苹果,树上剩余的果实是否会变得更难采摘呢?更具体地说,做出新发现是否需要比以往付出更多的努力呢?
跟踪产出率的变化,能够帮助我们回答这一问题。经济学家将产出率定义为产出一件产品,如造一辆车或印一本书所需要的工作时间。在科学界,产出一件产品等同于做出一项新的发现,可以用写出一篇论文所需付出的工作量计算产出率。正如我们已经展示的那样,科学发现和科学从业者在数十年里都呈指数级增长。但每位科学家平均产出率的变化则取决于哪一种指数增长更快一些。如果科研产出率确实下降了,这将意味着需要更多的劳动力来取得突破,也就是说,科学研究可能变得更加困难。
想一想计算机行业的一个相关例子。1965年,英特尔的合作创建者戈登·摩尔注意到,集成电路板(现在被称作芯片)上每平方英寸的晶体管数量,从它们被发明之后,每年都会翻一番。他预测这种趋势将一直持续到可预见的将来。摩尔的预测被证明是正确的:在将近半个世纪的时间里,芯片密度大约每18个月确实翻了一倍,代表了历史上最强劲的增长现象之一。但是,这种增长需要大量研究人员的共同努力。为使今天的芯片密度翻倍,所需的研究人员数量比20世纪70年代初期增加了18倍多。因此,即使处理能力继续呈指数级增长,在开始产出新一代芯片时,研究人员的个人产出率也会暴跌。每一次新的发布都需要前所未有的大量人力资源。在各行各业都可以观察到同样的规律,从农作物产量到批准上市的新药数量。这意味着,在这些行业里,指数级增长的进步掩盖了一个事实,“成熟的苹果”确实是越来越难找到了。
在科学界,虽然论文发表数量呈指数级增长,但是对物理学、天文学以及生物医学的论文进行的大规模文本分析显示,文章标题所用的独一无二的短语数量只呈现线性增长。这表明,科学的认知空间,也就是近似于现存的独特的科学构想数量,可能要比科研产出的增长慢很多。
那么,科学正在失去动力吗?如本章所展示的那样,科研论文的指数级增长实际上伴随着科研人员数量的指数级增长。但是,如果在各个不同学科比较这两种增长的速度,包括从计算机科学到物理学,从化学到生物医学,我们发现前者与后者往往是接近的。正如第1章所讨论的,科学界的个人产出在过去的一个世纪保持相对稳定,甚至在近年还略有上升。
当回头审视20世纪时,从内燃机到计算机再到抗生素,我们对前辈们所做出的发现和发明由衷地惊叹。这些领域的巨大进步可能暗示着收益的递减,因为那些甜蜜多汁的苹果已经被摘光了。然而,情况也许并不是这样。数据表明,我们已准备好在下一个20年,做出比整个科学史上已经做出的成果还要多的发明和发现。也就是说,即使经过一个世纪突飞猛进的发展,今天的科学仍比任何时候都更充满朝气和活力。
在一个世纪的指数级增长之后,科学怎么能够不知疲倦地继续快速前行呢?因为不同于一辆汽车或一个菌群,科学发展依靠的是创意。虽然汽车最终将耗尽汽油,细菌最终也将耗尽养分,但创意则是越用越多的资源。现存的创意将产生新的创意,很快它们就会成倍增长。因此,虽然我们进一步改进内燃机、计算机或者抗生素的能力确实可能会减弱,但我们在基因工程、再生医学、纳米技术,以及人工智能方面能有新的进展,这些领域将再次为科学和社会带来革命,以我们难以想象的方式开启全新的篇章。
复杂系统视角下的科学学读书会
推荐阅读
维基百科星星之火,照亮科研征途之路 科研的自然选择:理论研究与复制经验促进良性科研进化 Nature:新冠疫情一年,七成科研人员感到“身心俱疲”,该如何缓解? 2600万篇论文引用调查:科研界马太效应加剧,强强联合愈发普遍 科学会终结吗?为何科研投入越来越多,重大成果的产出却越来越少? 《张江·复杂科学前沿27讲》完整上线! 成为集智VIP,解锁全站课程/读书会 加入集智,一起复杂!
点击“阅读原文”,报名读书会