*以下根据王小川2019年8月22日在高山大学“高山夜话”上的分享整理而成。文章内容仅为现场课程十分之一,点击文末阅读原文,了解更多。
*全文4692字 | 5分钟阅读
*整理 | 张明
*责任编辑 | 朱珍
高山大学2019年经典课程
授课老师:王小川,搜狗公司CEO,前搜狐高级副总裁兼CTO。曾获第8届国际信息学奥林匹克竞赛(“IOI”)金牌,之后毕业于清华大学计算机科学与技术专业,拥有工学学士、工学硕士, 以及EMBA学位。他先后发明搜狗输入法、搜狗搜索等互联网标志性产品,被公认为中文信息化的重大突破;人工智能时代,他带领搜狗公司发展语音、图像、翻译等AI技术并率先实用化,成长为国内用户规模第四大互联网公司,以及赴美上市中国人工智能第一股。
课前思考
1. 什么是复杂性?
2. 为什么数学、物理无法应对生命的复杂性?
3. 什么是生命的定义?
4. 如何向生命学习做公司?
大学本科毕业后我进入收分最高的清华大学计算机系高性能计算研究所(简称“高性能所”)读研。高性能所主要研究巨型计算机,最重要的一个产品是做天气预报的高性能计算,那时我就知道天气预报需要强计算力的。
2000年正好有人类基因组计划,清华大学和高性能所也会分到一点任务,我想做应用型的新东西,老板让我去做基因测序这个事情,所以误打误撞的和基因测序结缘,兴趣有了用武之地。
基因测序现在已经非常成熟,一个人测序只需要1000元量级就基本可以去做,高通量也高很多。但是测得越多,我们以为解决了基因的问题,但更多的事情是不明白的。
比如说,人的DNA与基因是两回事,DNA上只有5%的区域是基因,可以转录成RNA然后变成蛋白质,剩下95%大家觉得没用是垃圾。后来发现,那95%不仅有用,可能它能决定另外5%什么时候表达转成蛋白质,称为调控网络。这就更复杂,就像暗物质,平时看它不工作,但具体工作反而变得更加复杂。
再到后来发现人体内的基因还有不同的变异,甚至在人的大脑里面每个神经元都有变异的结构,然后发现线粒体里也有DNA的问题,然后又发现蛋白质还有修饰的问题。比如猪,每个猪的DNA是一样的,但为什么花色不一样,因为上面修饰的蛋白质不一样。
最后发现每解决一个问题又会出现十个问题,这里面我觉得更多不是测序本身,而是打开生命科学的门之后发现越来越复杂。
一旦做生命科学的时候,会发现数学的方法、物理的方法甚至加上化学的方法是无法解释生命现象的。生命本身是绕过了复杂性的科学。
天气预报对高性能计算的要求很高,大体的原理是把空间分成很多个格子,用有限元方式在里面去继续迭代。每个格子里是温度、湿度这些,然后去计算下一时刻的变化,格子分得越细,最后计算的精度会越高;格子分得越粗,最后的变化就越模糊。基本上,格子每分细1倍,计算的复杂度增加32倍。2000年美国亚特兰大奥运会能够做到知道一个体育场下不下雨,这是把精度放得特别高,在极其强大的计算机里计算。
当我们要去模拟一个物理规律运行的时候,需要极高的计算力。即便这样,气象学家洛伦兹在做天气预报时提出一个很著名的概念——蝴蝶效应,只要小数点后的精度差一点,随着时间的迭代,这种误差会呈指数级增长,最后的结果就完全变成一种混沌了。
这种混沌来自于计算天气预报,我在实验室耳濡目染之后形成一个基本的理解:对一个复杂事物,如果是非线性的,随着时间的推移,最后的结果就不确定了,会走上一个不确定的注定的结果。用数学能力是绕不过这件事情的。
我登山的时候发现,在山上,山体更复杂,天气变化更快,一天会变好几次,一会下雨一会出太阳。越复杂的事情,最后结果的确定性越差。这是在数学、物理得到的一个基本概念。一旦到生物学突然发现好像不符合这件事,生物学叫做比复杂性更复杂,按照钱学森的说法是叫复杂巨系统。一个DNA做成一段基因转录成RNA变成蛋白,蛋白变成身体的催化剂,或者身体的酶又产生后面的反应,人的体内每一秒中以蛋白质为核心的这种反应变化可能是数以百亿计的。如果用超级计算机计算下一时刻怎么去变,这件事比天气预报复杂特别多。
所以当时我们实验室里就想去计算一个细胞的半透膜的运动,计算好了就能博士毕业。半透膜是一种单向的膜,一边浓度低,一边浓度高。通常情况下是浓度高向浓度低的地方渗透物质,半透膜不是,在有能量(即三磷酸腺苷)的刺激下能实现浓度低向浓度高的地方去流动。比如人的皮肤里面,我们喝水都有这种情况,不然喝杯白水下去,体内的盐分就出来了。所以身体里面有大量的构件,用计算机去计算的时候,会发现它最后产生了一定的确定性,但背后底层的分子是极其复杂的一件事情。
人体里一个DNA怎么变成人,这个过程听完之后可以完全摧毁掉数学、物理关于复杂性科学的共识,为什么?要算一个DNA最后长成什么东西,是算不出来的。我问过华大基因的朋友,他们说有这个计算能力。首先对现有的一个物种测序,做成数据库,最后其实做的是比对工作。给一段DNA之后去比对,与原来那个东西是一样的,那大体就是这个生物。这不是通过演化的方法去做这个计算,现在还没有这个能力。
别说一个完整DNA长成什么生命,就是中间一段东西产生的变化变成什么蛋白质都搞不清楚。Google的DeepMind在AlphaGo之后很重要的一个工作是做了AlphaFold,去预测蛋白质三维折叠之后长什么样。基因变成蛋白质长成什么样子的研究就已经成为人工智能最前沿的课题。靠的不是推演的算法,不是演化算法,是靠大数据算了之后做中间的一种统计规律。
生命是能够超越复杂性,在复杂性之后呈现出有序的规律,数学、物理、化学是没法去应对生命这样一个问题的。今天一个人的DNA拿到之后,不仅能知道是男是女,甚至长得跟老爸老妈一样像,这是常识。但从生物学底层看,是一个不可思议的问题,它怎么就能够从DNA经过无穷复杂的演化之后,得到一个清晰的结果。
今天包括生物学问题和经济学问题跟数学物理不是一件事,后者是停留在一个无机世界当中,有机世界当中的规则体系是有限的,更多是靠归纳方法或实验方法去做的。科学有自己的边界。
我读了一本很重要的书《复杂》(《Complexity》),书里有一个最重要的初级的东西叫定义什么是生命。每个人都知道生命这个词,看一个物体是不是生命,是需要有判断力的。如果对生命的标签是有统一认识,是不是应该可以给生命下一个定义?但这件事情很可笑的是,我问了一百个人,一百个人都不知道什么是生命。连什么是生命都不知道,谈生命可贵、向生命学习就无从谈起了。
《复杂》里用了两句话给生命做定义,第一句叫性状相对稳定,第二句叫可以自我复制。性状相对稳定不是指一个花有五个瓣、颜色比较稳定,那叫性状,性状稳定是指环境对它产生一个作用的时候,它有复原能力,能对抗外界对它的破坏,是一种反脆弱的东西,这是一种生命力。比如人身上划了个口子,它会愈合;还发现高级生命,如果拿刀去砍它,它拔腿就跑了,防止自己进入到一个自我不能复原的状态里去。这个定义很精妙,生命是能够保持高度一致的。
看了这个定义之后我又陷入到另一个困境。
DNA是双螺旋结构,它能够自我复制,通过PCR(聚合酶链式反应)的过程,在一种酶和适当温度的刺激下,双螺旋会解开,然后旁边的核糖核苷酸上面会形成两个链条。DNA就是有序中的一个整体,我们体内的DNA是无时无刻不在发生断裂的,但双螺旋结构能够修复回去,修复不回去就变异,很有可能往癌症上走了。
我是生命,体内还有细胞核、DNA是生命,到底是什么关系?我很想把它们(细胞核、DNA)排除在生命的定义之外,以保证我自己是生命的绝对的权威性。
△高山夜话现场,文厨(左)对话王小川(右)
还有什么是生命?按照这个定义理解,最后会发现,一个国家其实蛮像一个生命的,它里面有很多结构,也想自己活下去;一个民族,也像一个生命;思想也是有生命的,它会传播,而且相对稳定,能净化的。
所以在研究生期间,我建立了对世界新的认知方法。我不是从物理规律去看这个世界,而是从生命的方法来看待世界。这件事情非常有意义,因为非生命带来的词是脆弱性、无序性、无机、没有意义,生命带来的词是反脆弱、有机、有意义、有确定性。
物理学热力学第二定律讲到熵增就是一个封闭系统,它的熵增最后会走向无序、越来越不确定。而生命的世界讲的是熵减,最后讲一致性、有序性。一个熵增的世界,我研究它干嘛?它本身主要是无序的,对无序的事情是没有什么好研究的。苹果落地好像是一个固定的事情,但它的可复制性非常差,苹果滚走了就没了。这只是在一个最粗浅的科学里面找到了一个不变的东西,但它离复杂世界中的规律差之甚远。
当我们理解数学、理解物理之后,没法对这个世界产生更精确的描述,但是生命才是更本质的一件事情。活着、存在性是一个有意义的事,甚至我认为生命才叫存在,不是生命就没有存在性。生命变成一件很重要的事情,而且这才是宇宙中我们最需要关注的事情。因为它就代表了存在,代表了有序,代表了有规律可循。这时候,我们在想,公司是什么?
大家觉得向生命学习,好像公司像生命,但其实每个人做一家公司,就是在做一个生命。公司要是垮台的时候怎么办?要活下去,对吧?就像一个细胞,一个人一样,它已经变成了一个有机的整体。它是反脆弱的,有员工流失会招新人,这个市场没有空间了,它会换赛道,以保证自己还能够摄取到外界的能量和物质来滋养它。但是我们很多时候学得不好,因为今天能活百年生命的公司很少,IBM百年历史,大部分公司都挂掉了。
以前我看过一本书《基业长青》,里面有标杆组和对照组,讲要做造钟的人不要做报时的人等一堆道理。十年后再翻这本书,里面一大半公司已经挂掉了,即便它认为标杆的公司也挂掉了。当我们做公司,如果把生存下去和发展下去作为目标,我们离生命差远了。生命搞了几百万年还活到现在,但一个公司能活过十年的就不多。
做公司不仅是叫做像生命,就是在做一个生命。它做的是两个事,第一它能够性状相对稳定,就是活着别死掉了,但我们没有做好的是自我复制,因为自我复制是面对环境复杂性很重要的一种适应方法。否则一个公司很容易最后走向组织结构更臃肿,衰亡死掉。
搜狗现在没叫做复制。其实很多时候拆分之后做子公司是一件很重要的事情,面对环境变化之后,像母体能够长存下去,这不是最有效的方法。主要面对环境变化很快的时候要这么做。搜狗,我用个词来讲叫做“狐狸生了条狗”,搜狐生了搜狗。搜狐是一个媒体经营公司,搜狗是一个技术基因的公司。
生态是生命的一种方式,而且是一种很强大的高级的方式。做生态和做生命体是类似的做法,而且它能保证多样性,保证之间是一种和谐的、不冲突的状态。阿里巴巴做得很好,它知道一个品牌就意味着一种社会承诺,为了这个社会承诺它就得形成一个组织,就以公司为边界来做好。
No.1
作为普通人,怎样才能走近科学,把科学观指引到生活这个层面?
答:首先科学不能解释所有的事情。懂科学不一定能做好公司。过程当中,我觉得更多理解什么是知道这个事的边界,就是什么事我会,什么事我不会,什么事我不知道。我知道我不知道就是一个很大的进步。另外,我们在学东西的时候,你得先信它,才能学。学科学要学经典的东西,不要学太多东西。因为第一你敢信它,而且它讲的东西是锤炼过的。
No.2
生物学思维跟别的思想体系、方法论有什么不同,先进性在哪里?
答:科学如果往俗里讲,不严格定义这件事情,科学对我最大的价值是能够帮助我去一种规律的解释,能帮我解释过去,预测未来。
你心中可能有把尺子去量,当你茫然的时候过去解释不了,为什么不知道,未来长什么样也不知道。所以我们的管理工作背后或者做很多事情背后都有一个解释和预测的过程。使得你不断调整你的模型,这个模型跟过去发生事情最大化去解释它,最大可能预测未来。所以当我有了生命视角之后,我会认为我能够解释的东西和预测东西会更多、更准。因为它本身像生命运作,它不是用一个物理、数学能解释的,它不是一个线性的东西。
No.3
企业真的能基业长青吗,是不是像生命体一样注定老去?
答:我的推论说生命体会老去,而且干嘛非避免呢。如果有人说我一定要活1000年,也挺吓人的。一个企业活千年,我觉得这是小概率的事件。它可以通过新陈代谢做一些替换,但是在适应环境中间不如里面孕育新生命,把它长出来,而不要追求一个企业要活1000年这样的事情,只要把使命完成就ok了。
它里面会有很多老化的东西,比如一个人升值是老化的表现,一个人加薪也是老化的表现。因为加薪就减不回去了,给他这个职位他可能就退不回去了,除非像华为那种全员下岗再来一次。打破原来的链条再回去,逆商可以做这些东西,但大多数企业是对抗不了这种变化的,或者局部趋势能够缓解,能年轻一些,但是要一直活下去,这件事情我觉得既不现实也没必要。
高山大学(GASA)是一所以“科学复兴”为使命,以“没有受教,求知探索”为校训,致力于为创业者、企业家、投资人培养科学精神的新型大学。由长城会创始人文厨创办,前金山软件CEO张宏江、创新工场创始人李开复、清华大学教授鲁白、清华大学教授吴国盛、斯坦福大学教授崔屹、加州大学伯克利分校教授杨培东、清华大学苏世民书院院长薛澜、百度总裁张亚勤、美国西北大学终身教授夏志宏、中国科学院院士周忠和、斯坦福大学教授张首晟(特别致敬)等联合发起并作为校董。
高山大学(GASA)2020级招生启动,点击阅读原文加入高山大学,与全球科学家一起探索科学的乐趣。