中国为何始终缺乏原始创新?
撰文 | 张峥(亚马逊云计算上海人工智能研究院院长)
● ● ●
“尽管中国古代对人类科技发展做出了很多重要贡献,但为什么科学和工业革命没有在近代的中国发生?” 这就是著名的李约瑟之问。从李约瑟在上世纪三十年代提出这个问题,时间已经过去了近一百年,虽然李约瑟问题还经常被提起,但困扰我们的是一个新版本:为什么当代中国不能从0到1,只能从1做到无穷大?换句话说,为什么步入资讯通达的二十一世纪,中国始终缺乏原始创新?
前一阵朋友圈里读到吴国盛老师的一篇文章,指出”一个国家的综合科技实力,由基础研究、应用研究、面向市场的开发研究三方面组成,如果其中一个是短板,那么科技实力是偏颇的。”
针对中国缺乏原创这个现象,吴老师认为我们对基础研究和基础学科缺乏正确的认识,我们的文化缺少对科学、真理和创造的支持,更多从功利角度、实用角度来看待科学。
吴老师的这个观点,可以在知识分子上刊登的另一篇熊卫民老师的文章里得到一部份佐证。熊文分析了中国科学家为什么选择了中国特色的“人工合成生命”系列研究,从而错失分子生物学革命的各种原因。(见文章“中国为何会错失分子生物学革命?”)他指出,从1958年到1977年近二十年间,除了冷战阶段和国际同行脱轨的国际原因之外,中国反对“为科学而科学”,强调理论联系实际,经常性的批判基础研究,由非科学家主导研究。
从无线电、计算机、互联网的发明,
我们能学到什么?
吴老师文章里举了三个例子,无线电、计算机和互联网。我们不妨对这它们的起源和发展轨迹做些分析。
无线电发明极简史 麦克斯韦方程组被称为人类历史上最伟大的公式。这位英国物理学家在十九世纪六十年代把人类对电磁现象的认识归结为漂亮的四个微分方程,并预见到电磁波的存在。二十年后,德国物理学家赫兹设计了一套简单的电磁波发生器和一个检测器,于1887年,成功地用实验验证了电磁波的存在,电磁波从理论上的可能性变成可见、可测量、可量化的实验现象。有意思的是,对这一个巨大的突破,赫兹本人固执地认为一点实用价值都没有。
1894年,也就是赫兹去世的那年,爱科学爱折腾的意大利年轻富二代马可尼,偶然读到了电气杂志上赫兹的实验介绍和论文,马上想到无线电可以用来编码传递信息。和他同时竞争的英国同行一开始认为无线电和可见光一样,传播路径上必须没有遮挡。偏偏非科班出身、基础并不扎实的马可尼无知无畏,在家里动手装了一个简陋的装置,用无线电波打响了楼下的电铃。他不停改进设备,在发射和接收端装上天线。1895年秋天,他将实验转移到室外,通信距离增大到2.8千米,不但打响电铃,而且还在纸带上记录莫尔斯电码。
无线电商用化的障碍在于,有线通信已经非常成熟,最早的海底话缆已于1891年英法海峡敷设。当时一个最有希望的应用是海上救援,尤其在夜晚和迷雾中。马可尼没能说服忙于铺设电缆的意大利政府,不得已前往英国集资成立公司。在一连串近乎赌博的疯狂实验之后,于1901年成功验证了跨大西洋的传输,距离3500公里。1912年4月15号,泰坦尼克号撞上冰山,相距近六十海里的Carpathia号花了近17分钟接受和解析出求救信号,最终七百多人获救。马可尼的设备,立了大功。
计算机发明极简史 要说计算机如何成为一门科学,离不开英国科学家图灵和图灵机。那么,图灵机又怎么来的?事实上,图灵机的发明是一个意外。1900年,被誉为欧洲数学界的教皇的大数学家希尔伯特,在巴黎国际数学大会上的演讲中提出了23个有待解决的数学难题,为20世界的数学发展制订了计划。图灵对其中的第十个问题的更一般化的形式感兴趣:能不能按照一串机械化的步骤——我们现在通称为“算法”——来判断一个数学陈述是正确的?这就是希尔伯特的“可判定性”问题的泛化版。
图灵意识到,为了解决这个问题,他首先得构造出一个抽象的机器来执行这些步骤,这个抽象的机器就是图灵机,简单到只有一条无限长的纸带和一个读头,读头能读写纸带上的字符并且移动。这个图灵机所做的就是执行证明数学陈述的步骤。然后图灵进行了一个巧妙的转换,把可判定问题转换成图灵机能不能停,随后构造了一个巧妙的悖论,证明有可能停不下来,也就是说不可判定的情况是存在的。
在这个过程中,图灵随手给出了一个通用机的版本,这个机器可以把做证明用的那台图灵机的算法作为输入,因此可以变身成任何算法的执行者。这个抽象的计算机,完全是图灵为了证明可判定性问题的副产品,却不意间奠定了计算机的基础。
然而,要不是需要破译德军密码,图灵机的思想不可能那么快落地,计算机在曼哈顿计划后期也被投入使用。战后不久,计算和存储分离的冯诺伊曼结构成型,至今仍是主流框架,但是软硬件一直在不断迭代发展,在云里从超级计算机到服务器集群,在云下从工作站到个人计算机到今天的智能手机、智能手表。同时,计算机作为一门新兴学科分出诸多大类(人工智能、算法和理论、体系结构、操作系统、数据库、软件工程、计算机语言、人机界面、计算机安全……),每大类又有诸多子类,层层叠叠。比如单看人工智能之下自然语言处理这一“小”支,要是细分到底层子任务,就有几十个,每年三四个顶会,每个会议都有上千篇文章。
互联网发明极简史 战后,计算机被投入商用和科学计算,但都是独立使用,互不相连。事实上,要是单考虑效率,最好的方案是把计算资源堆积在一起,倾力打造一个超极计算机。把超级计算机用网络连起来,有两个动因。第一是“怕”,在冷战的大背景下,一个指挥中心万一被一颗核弹击中,整个系统就瘫痪了;第二是方便分散在各处的研究者合作。这些原因催生了一开始只有四个大计算节点的ARPANet,也催生了两个新领域:计算机网络和分布式系统。90年代左右由美国美国国家科学基金会(NSF)资助的NSFNet取代ARPANet成为主干网,伯克利大学开发的TCP/IP作为标准协议,形成网络效应,接入众多局域网,互联网的“基建”——因特网(Internet)随之逐步成熟、稳定。
但真正让互联网火爆起来的却源自一个古老的应用:文档管理。把文件存放在一层层的文件夹里很简单也最基本,但论文可能互相引用,对研究者不方便。在一篇文章里埋下链接,让用户一键跳转到另一篇相文档,就是超文本。超文本有很长的发展时间,但相对小众,蒂姆·伯纳斯-李1980年在日内瓦的欧洲核子研究组织(CERN)担任独立承包人,也建了一个超文本原型,已方便研究人员分享及更新讯息。
蒂姆·伯纳斯-李之所以被称为“互联网之父”,在于他在1991年提出、实现并规范化了一个回头看几乎理所当然的想法:把超文本网络化:点击链接可以跳转到存放在另一台机器上的文档。这种被网络化的文件,就是我们现在熟知的网页,格式称作HTML。到1995年,微软发布了一个Windows95,这是一个里程碑,因为它支持了TCP/IP,广大的PC用户可以上网了。就这样,因特网+HTML+广大PC用户,万维网终于爆发式增长,大量的网络应用又推动了服务器产业,也发展出搜索引擎、云服务、社交网络等等现象级的新产业。
从“纸上谈兵”的万能图灵机,赫兹的相距最多不过几米的震荡器和天线,发展到上致星链、下致脑机接口、万物互联无往不在,真正是走过了千山万水,包括了有无数个原创,中国在其中的缺席,十分刺眼和醒目。
原始创新是怎样发生的?
面对和欧美原创的巨大差距,这些年有不少人提出要重提上世纪八十年代恢复高考之后的一句流行的口号,“学好数理化,走遍天下都不怕”。这是一个简化也是比喻,但背后藏着一个重要的假设,指数理化这些传统科学才是基础科学。其实,这是对前沿科学不了解的一种体现。
原创之源一定出自基础科学吗? 这似乎理所当然——就像熊老师的文章里分析的,错失分子生物学这个新基础研究,让中国科学家丢了二十多年。但有意思的是,例外也不少。马可尼于1909年获得诺奖,而无线电讯号能超远距离传播是因为电离层反射的这个原理,却一直要等到1924年,他之所以敢于走向市场并领先英国的竞争对手,是因为他用简陋的设备打响了楼下的电铃;大语言模型的很多基本工作原理,到现在都还在研究之中,但是大思路并没有问题,也足以引爆市场。在这些粮草未到而车马先行的案例中,基础科学更像是事后诸葛,其作用在于提供更深入的认识,发现可能的优化点,推动下一轮的进步,而每一个进步,都有原创的可能。
科学技术发展到现在,已经从一棵树,成为根脉缠绕、野蛮生长的一片林,而且很多树还在不停的生长;越往上越年轻,越前沿,越不稳定,也是产生新知识最活跃的地方。这个盘根错节、互相勾连的复杂网络,在它的每一个结点的内部也分支庞杂,互相勾连和依赖。
面对这个复杂网络,“基础”二字如果没有指明上下文,不但模糊,甚至无意义。因此,把“0到1”这一截看成基础科学的独有之地,望文生义,过于简单。我经常碰到中国同学数学基本功很扎实,可是计算机科学里的基础却掌握得却不全面,导致做起研究来磕磕绊绊。
从0到1的原创,需要基础科学研究的素质,但不见得必须发端于基础科学。
总体而言,原创需要想象力和行动力的结合,从理论上的“虚用”一步步走向“实用”。一个常见的争议点是,发生原创必须摒弃功利心吗?原创的必要条件是要有用。“有用”很多时候是实用,带动市场来换取更多的资源,却也可以是“虚用”,比如图灵机就是一个概念机,赫兹的实验也只验证了电磁波存在的验证。如果我们讨论原创的动力,言必回避功利心没有必要,因为有无功利心并不重要:把对世界的认识推进一大步,或者大力释放了生产力,都是值得我们认可和尊重的好工作。马可尼就是一个功利心特别重的一个冒险家,爱迪生也是,马斯克更是。即便爱因斯坦,可能很多人不知道他名下有不少专利,其中包括一个无疾而终的冰箱设计。
此外,我们还应该看到运气和时机的重要性,比如海上救援之于无线电,二战之于计算机,网络和超文本之于互联网,数据和算力之于基于深度学习的人工智能……我相信这也适用于其他领域,比如新冠病毒之于mRNA技术。
总的来说,我认为原创从来不会在一个没有用的上下文中发生;新知识的获取、新学科的诞生并不见得因为天天在追问宇宙奥秘是什么,也不见得因为数学大厦里又添了一条新公式。看到有用,看到必须要用,都是原创的源泉;图灵并没有想要去发明图灵机,图灵机只是他去解一个数学问题时不得不需要“顺手”发明的一个工具。
培养下一代的原创能力,
需要什么样的教育?
回到我们一开始的问题,中国为什么没有原创,为什么没法做到从0到1呢?如果自顶向下的推动,我们首先就会遭遇一个“灯下黑”的问题:如果我们承认中国鲜有原创成果,那就找不到有原创经验和经历的专家来咨询。
或许我们可以思考一下从教育的角度来说,需要培养一些什么素质:
批评性思维。这是中国教育的老问题了。一个只奖励标准答案、不鼓励学生去挑战现成答案的教育环境,只可能抹杀而不是催生批评性思维。和这相关的是对权威的盲目崇拜。即便对诺奖得主,正常的评价应该就是“as good as their last work”,学术上绝对平等,没什么不能被挑战。
爱提问题不见得就是具有批判性思维,因为问题的形式无非就那几种:为什么?凭什么?是又如何?等等。最要紧的是提出好问题,有好奇心也可以问出很无厘头的问题,瞎问甚至不如不问。
这需要我们掌握:
第一性原理。也就是说要有穿透力,关心最基本的条件和假设,不要被表面的酷炫、不必要的细节迷惑。每一行都有自己的第一性原理,只有在参透了相关的基础科学才能把握住,把握好了才能问出好问题。马斯克传里提到他在SapceX的研制中要求液态燃料的温度压到最低,使得燃料仓体积最小,给火箭减重,这就是坚持第一性原理的体现,在他看来,只要物理规则没被打破,没有不能打破的现有规矩。
想象力和行动力的结合。坚持在第一性原理指导下的批评性思维,能让我们看清、挖深,但不见得一定会往前走一步,因为那需要,想象力和行动力的结合。有想象力没有行动力,只能做键盘侠,有行动力没有想象力,只能等别人立了标杆之后“赶超”。在开源已经是常态的现在,甚至可以说是习惯性地“敢抄”。中国在人工智能领域的文章都占了40%,但无论阿尔法围棋还是大模型,没有贡献出步子大一点的突破,等别人文章或者代码放出来了才发急追赶。
要培养这些素养并不容易。原创能力的培养,分布在不同学科之中。
比如说,行动力在工科和商科,想象力、创造力在设计和艺术,批判性思维在哲学和历史,而第一性原理又和具体的专业方向紧相关,等等。很难想象专门成立一个科目,叫原创学科,但不管如何,单一的某个专科很难涵盖应该是不争的事实。
如果我们去看那些领导原创的领袖人物,会发觉他们基本是靠自己的努力,自觉去采集来自不同学科的营养,马斯克大学后两年转去宾州大学念物理,就是因为他认识到不懂物理的工程师不是好工程师。
我们在这里讨论如何培养原创力,和如何设计面向未来的通识教育课程本质上是同一个问题。今年上半年,我受邀回母校复旦参加了一次相关会议上,且把我的观点作为本文的结语,并期待更多的讨论:
通识教育不是简单的让学生懂科学、懂人文和懂艺术。不同的专业训练会培养不同的“专业通识”。比如,科学家们相信纷繁复杂的现象背后存在着简洁明快、具有强预测力的模型;工程师认为魔鬼在于细节,他们对复杂性有着深刻的理解,在工作中致力于打造完美平衡细节和性能的产品;艺术和人文类从业者最关注叙事结构,叙事能力和叙事自由;金融类人才关心投入和产出,对人的非理性的理解甚至超过心理学家…… 每一种专业通识是各自领域的神器,从而深刻影响一个人的世界观和方法论。
目前的教育系统存在两个问题,第一,因为教育资源的严重不均衡,很多孩子被挡在高等教育之外,没有机会接触到专业通识,第二,幸运的孩子们层层选拔进入大学后,又必然进入各个专业,多年历练下却只拥有单一的视角。
因此,专业通识既不相通,也不通用,更不能下沉作为普惠教育的一部分,这样的教育显然不再适应未来的发展。