查看原文
其他

如何做好复杂系统理论研究?专访张江教授

X-Order 集智俱乐部 2022-05-09


导语

什么是复杂系统?复杂系统的研究方法有哪些?复杂性科学与人工智能、深度学习有什么关系?复杂性科学关注的前沿问题有哪些?这一系列问题是集智俱乐部长期关注的。X-Order日前采访了北京师范大学系统科学学院教授、集智俱乐部创始人张江,围绕着“复杂理论”这一主题,分享了他的研究进展,并畅谈了他的学术见解和科研经验。




 嘉宾简介



张江:北京师范大学系统科学学院教授,博士生导师,集智俱乐部、集智学园创始人,腾讯研究院特聘顾问。


2006年博士毕业于北京交通大学经济与管理学专业,2006-2008年在中科院数学与系统科学研究院的复杂系统研究中心从事博士后研究工作,2008年6月~2012年7月,北京师范大学管理学院系统科学系讲师,现为北京师范大学系统科学学院教授。


共发表论文SCI论文二十余篇,译著1本。主要关注领域:人工智能、机器学习、计算社会科学、复杂网络等。他长期积极参与国际学术交流活动,曾先后访问过美国密西根大学(Michigan University)、佛蒙特大学(University of Vermont)、圣塔菲研究所(Santa Fe Institute)、瑞士弗雷堡大学(University of Fribourg)、亚利桑那州立大学(Arizona State University)等地。2008年获得北京师范大学第11届青年教师教学基本功大赛理科组一等奖。2016年获国家自然科学基金资助项目:互联网上集体注意力流动研究,批准号:61673070。2011年获国家自然科学基金资助项目:加权食物网的异速生长律研究,批准号:61004107。



  学术&科研


Q:

简单介绍下您现在的研究?


张江:

第一项研究是我们正在做的,叫作“图上的机器学习”。


它是将复杂网络与机器学习结合在一起,来进行的网络上的深度机器学习。我们编写一些基础的算法,再结合具体的实践(比如跟腾讯研究院QQ数据中心进行合作),用机器学习的算法分析企业之间所形成的网络及其背后的机制,进而挖掘企业数据背后有价值的信息。


第二项是一个比较前瞻性的研究规划,叫作“参与的 2050”。


这项研究关心的是环境问题。现在世界的发展体现出两大特征:一方面,人工智能发展的奇点临近;另一方面,环境在持续恶化,在未来有大崩溃的迹象。两者结合到一起,就会形成科技发展与经济进步,跟整个地球系统耦合在一起的系统。


科学技术可以更多地了解未来,我们希望做一些相对实用的预测。这方面的研究工作规划即将公布。比如说,我们会用系统科学的方法,并结合各种不同的学科,去预测在 2050 年这样的一个时间节点上世界的环境会是怎样的。当然了,我们可能要花数十年时间去做这件事情。



Q:

当前您研究的这个领域的最大瓶颈是什么?最有价值的是哪些部分?


张江:

我觉得在复杂系统这个研究领域内,研究者们遇的最大瓶颈是我们缺乏一种透彻的认识。因为复杂系统讲的都是方法,而没有一种透彻的观点。


《规模》这本书就有一些透彻的观点。作者的视角独特,而且某些点的分析也比较透彻,比如说对于新陈代谢和生死的关系,在这本书里就凸显出来了,这些问题都是大问题,特别重要的。这样研究我觉得在复杂系统这个研究领域中实在太少了。


《规模》所提出的方法,可以回答复杂科学中的问题。《规模》给出的回答方式不会拘泥于细节,是宏观的,跨学科的。《规模》一书中讨论的生物、城市和公司,就是跨领域的,这是复杂科学的研究所欠缺的,这样的瓶颈需要我们来突破。



Q:

在数字化的未来,您这个领域的研究会有怎样的演化?


张江:

目前数据的收集难度在逐步降低,复杂科学在未来希望借助这样的趋势,结合机器学习、深度学习的一些方法和内容,进行自动建模。



  复杂理论  


Q:

目前对复杂理论还没有一个非常成熟的定义,您觉得应该如何定义复杂理论?


张江:

复杂理论现在还没有一个准确的定义,但这并不影响我们在复杂理论领域内进行研究。给“复杂理论”下定义没有太大的必要,这不是进行复杂理论研究的必要条件。就像我们对“生命”没有明确的定义,基本上都是一些描述性的定义,但是这并不妨碍我们去研究生命。



Q:

请问您觉得复杂网络、复杂系统、复杂理论之间有什么关系?ABM在复杂理论研究中是一个什么角色?


张江:

首先我想讲一个另外的词——“系统科学”,系统科学与复杂网络、复杂系统以及复杂理论之间的关系是什么呢?


首先,系统科学的概念更大、更全面,包含了复杂系统和复杂科学。


从另一个角度,复杂网络、复杂系统以及复杂理论是系统科学发展到一定阶段以后所形成的一个子领域。


最后,系统科学还包括工程理论、控制论、信息论以及自组织理论等等。航天工程、登月工程之类的大型工程都需要用到系统科学的理论,特别是系统论的一些方法。


所以,系统科学这个圈子是更大的,而复杂科学是在二十世纪九十年代以后发展起来的。


那么系统科学和复杂科学的区别在哪里呢?


最大的区别在于复杂理论研究活系统现象,而系统科学更多地是研究“死系统”,比如说一些没有活力、人造的,不像生命体那样有活性的对象。复杂科学更感兴趣的是活的系统,活的系统其实有很多,包括生命系统、计算机网络系统(某种程度上也是活的演化系统)、社会经济系统(它内部的每个单元都是活的,所以整体上也是一个活系统)。


复杂科学是一门研究对象具有活的性质的学科。


对于第二小问——


复杂科学是门比生物学还要不成熟的学科,处于发育不完全的状态,它给我们提供的并不是一套成熟的理论,而是另外的两个内容:


第一,复杂科学给我们提供了一个思维框架,它跟哲学一样,告诉你该从哪个角度,从哪些概念出发去思考。给我们的是一些概念,比如:“涌现”、“进化”以及“分形”。


第二,复杂科学给我们提供了一套工具箱,这个工具箱里面有很多研究方法和工具。比如说题目中所提到的“复杂网络”就是这个工具箱里的工具,我们用“复杂网络”这个工具就可以去研究一个网络中的结构特性以及相互之间的关系;还有就是像 ABM 仿真模拟方法,其实也是其中的一个工具,它的特点就是,我可以去给电脑之中的 Agent 设定最简单的规则,让他们相互作用,用仿真实验的手段,去观测演化的过程。


ABM 模型做出结果是不能证伪的,是这样的吗?


ABM 模型做出来的东西是可以验证的,主要是看用这个模型来建模什么问题,如果建模的问题本身就是比较“虚的”问题,比如说就是人造的生态系统,就很难证伪。但是如果说建模一个比较具体的,比如说要模拟一下比特币网络的演化,比特币有大量的数据,ABM 模型做出的建模就可以跟实际去比对,自然就会验证这个模型,所以说是可以证伪的。



Q:

您觉得复杂系统、复杂理论这样一个跨学科研究,与以前的研究方法相比有什么优势?可以解决哪些传统方法解决不了的问题?


张江:

相对于传统的研究方法而言,其优势主要体现以下两方面:


第一,复杂科学所进行的研究属于综合性的研究,我们去识别一项研究是不是复杂性研究可以参照两个评判标准:首先,它是不是跨学科的?举个例子,生物学只研究分子,研究分子之间很具体的一些机制以及相互作用,所以生物学的研究不能归属于复杂系统的研究,因为它太具体了;而“分形”就比较符合复杂性研究的定义了,“分形”这种现象,可以放到很多不同的系统里面去。比如社会系统、生物系统、计算机系统以及人工智能系统都有这种“分形”的现象。


第二,复杂系统比较强调整体观,比如涌现理论,其中很多特性不是归结于单一个体的行为,而是一种整体、结构性的东西,这种现象也是复杂理论侧重研究的现象。



Q:

在利用模拟仿真去研究一些复杂的现象是,我们通常会设置很多的参数,有文献中提到,几乎模型中想要刻画的个体的种类数与设置的参数增加是同等比例的增加的,但是过多的参数又会导致我们不知道哪个因素影响了最后行为或者现象的出现;所以面对参数数量过多与复杂现象刻画之间的矛盾业内是如何解决?


张江:

这也是我们做系统建模时经常会头疼的一个问题,需要设定太多的人为的规则和人为的参数,这个该怎么解决呢?


第一种方法我们一直以来都在采用,就是在建模之后要做校验和校准,这也是件很重要的事情。


这些校验校准的过程就是对这些参数来设定数值。其中一种途径是这样的:如果知道一个参数在实际系统中的意义的话,那就直接去套系统中的参数。比如说,在模拟一个市场的时候,需要加入收入分布的情况,这当然可以随机去设置参数,不过这样很不好;另一种途径就是通过调研去获取一些数据。比如说,要了解中国市场中的收入分布情况是什么,把这个(调研获取的)收入分布曲线直接放到模拟里就可以了。所以这样的做法可以大大削减工作量,并提高参数设置的客观性。


第二种方法是通过机器学习的方式,去调整这些参数。


这其实在早期就有,人们在对股票市场进行模型模拟时会做平行实验,平行地去做真实的股票市场和模拟的股票市场。


让模拟模型中的 Agent 去学习真实的股票市场是怎么运行的,然后用算法去做,所以通过这样的学习就可以得到相应的参数。


第三种方法也是一个新的方向,就通过机器学习,自动设置参数。



复杂理论+


Q:

利用复杂理论去研究一些实际现象与目前很火的利用机器学习、深度学习做研究有什么关系和区别?


张江:

我们复杂理论研究领域或者说系统科学研究领域的学者更多地会将人工智能看成系统科学的一个分支。因为很早以前系统科学就在做人工智能相关的一些研究,比如系统辨识、系统学习、系统决策以及系统控制等等。所以很多系统科学领域的学者将人工智能理解为系统辨识的一部分。当然了,这种说法仁者见仁智者见智。


机器学习和深度学习,跟复杂理论一样都是工具箱,那么这两个工具箱有什么区别和联系呢?


首先,传统的复杂理论,复杂网络也好,ABM 也好,它们都是正向推理的关系——面对一个真实的复杂系统,比如说来研究一个区块链系统,复杂网络或者 ABM 的方法,总是要去假设一些简单的规则,就是人们通过分析数据来构造一些规则,然后再进行推理。机器学习和深度学习则可以做到归纳,使得实验反馈变得更快速,收敛地更快。从这个角度来说这两套工具还是很不一样的,而且形成了一种互补。



Q:

您觉得复杂理论的研究是否可以人工智能相结合?如果可以,如何将复杂性思维应用到人工智能的领域?


张江:

复杂理论本身就是一个思维框架,如果说人工智能就是按照复杂理论这个思维框架而发展起来的也不为过,比如自学习、自演化这些人工智能的概念其实也包含与复杂理论。所以人工智能完全可以与复杂理论结合起来,比如说我们集智做的图形识别的机器学习就是体现,我认为将两者结合起来的应用空间还是非常大的。



Q:

阿瑟早期研究复杂经济学的时候提出过人工股票市场模拟,您在早年间也做过类似的研究,但是发展到现在几乎没有这方面的研究了,这是为什么?


张江:

人工股市在上个世纪九十年代至世纪末的时候很热很热,因为那时没有大数据,或者说没有意识到大数据的作用。所以大家就比较喜欢去做这种计算机模拟,去模拟人工股市或者说人工经济系统等等,这就是人工股市诞生的背景。


两千年以后,随着复杂网络以及大数据等科技领域的发展,人们就越来越意识到就是不能单凭机器去做模拟,总是要跟实际去结合,一种结合的方法就是用模型去跟实际结合;另一方法是直接去研究数据,借此来反推模型应该是怎样的。


先收集大量的数据,通过数据分析来提炼规律,最后再去建模,这被人称为经济物理或者说物理金融。目前仍有不少学者在做这方面的研究,区别就是在于现在不只是做模型,有相当一部分研究是结合具体的数据来做的。



Q:

基于复杂理论的视角,如何衡量商品或技术的价值?


张江:

我认为价值的形成跟生产过程有关。在产品的生产路径中需要人类付出一些劳动,比如说算力或者脑力等等。


所以如果能把商品生产路径全部记录下来的话,那么从原则上来讲,就可以把价值计算出来。


在此我想做个延伸,就是如何定量化人类的脑力?


目前来看,设计一个产品不能单用机器来做,一定会牵涉到人力资源,特别是脑力资源的投入。我们需要有一套定量化人类脑力劳动、脑力资源的一种技术手段,我认为得到了能测量劳动者在一件产品上花费多少脑力资源的方法,很多问题就会解决,包括价值的衡量。


当然了精度上不好说,但可以大致地衡量劳动者在一个东西上花费的时间,所以如果能把时间定量化的话,就可以度量价值。


虽然没有天然的工具来度量脑力资源,这个领域是空白,但目前也有了一些尝试性的解决方案,比如谷歌眼眼镜,它就可以从某些维度上测度人的注意力。


价值可以大致地测度,但是对商品或技术进行定价就太度杂了,因为这牵涉到了需求。价格跟需求有关,而且需求又分不同的层次,比如说真实需求和炒作需求的分层。所以给一件商品或一种技术定价很复杂。


如果让我研究的话,我就用模拟的方式,就是完全从模拟的角度来定价,当然了,这样的劣势就是只知其然而不知其所以然。



Q:

结合规模法则,从复杂网络的角度看,您觉得如何看待区块链这样一个由众多节点组成的分布式网络的价值和发展模式?


张江:

复杂理论的研究分成几个阶段:


上世纪九十年代,对于 ABM 仿真模拟方法的研究比较多;2000 年以后的主流方法是复杂网络;2010 年至今,基于大数据的复杂性理论研究是主流。


我们反观区块链,区块链比较有趣的一点就是链上的数据全是公开的,每个环节,每个买卖,其实都是有数据记录的。但现实世界的交易很多是不公开的,这就区块链的相对优势。


所以我们用复杂网络的方法,用《规模》的方法去分析这些数据,也许可以挖掘出来很多本质的科学问题。



Q:

如果将复杂理论应用到互联网上大众关注点演化的研究上,您觉得最应该关注的是哪些方面?


张江:

我们曾经做过一些研究,这被我们称之为“集体注意力”,这也类似于题目中所说的“互联网上大众关注点的演化”。我一个博士生的毕业论文就是在研究这个问题。


这项研究现在的一个缺点是我们获取的数据集比较小,也比较老。我们现在尝试着获取和分析互联网上数据,Domain(域名)相关的数据是我们的标的。


我们会统计网站的用户访问量,各个网站之间流量转移情况等等,通过使用一套网络的方法来分析这些数据,然后将其可视化,观察它的演化趋势,最后就是做预测。


这项研究的进展就是,我们知道了这个生态系统大致轮廓是什么样子的:从可视化的角度,现在可以看到有几个聚类,并且已经出现了中心性,处于中心的节点,恰恰是最重要的节点。除此之外,我们也在优化预测,原则上用这些方法可以预测到黑马网站,预测到将来哪个领域会崛起,哪个域名会涨起来。在研究的过程中我们也发表了一些论文。


这项研究与 KOL 的研究有什么不同呢?


我认为首先是视角不同,我们的研究是基于连接的视角,而 KOL 研究是从内容的视角出发的。


其次是研究对象,KOL 研究的是内容网络和社交关系,而我们不是。  



开放问答


Q:

您能推荐一本最近对您影响最大的书?


张江:

《规模》是最近对我影响最大的书。


其实我去年所做的研究就是跟 Geoffrey West 这本书中所使用的研究方法一样,我在以前也自认为对 Geoffrey West 的理论有所了解。但是在读完了这本书,当它完整的思想展现到我面前的时候,我再次被震撼到了。我开始重新认识 Geoffrey West 这个人,重新认识这本书,发现了书中的很多闪光点。


复杂理论讲的是方法,讲是理论的ABC,而《规模》这本书触及到一些本质的问题,对于生死这类本质的问题,它就敢于回答,并给出了一定的答案。比如说人为什么最多能活到一百二十岁,为什么呢?这本书给出的一个答案是跟人的“规模”有关系,就这一个简单的点,我认为就是一个很大的突破。


另外一点,也是容易被读者忽略的一点,就是《规模》这本书谈到了未来的一个可能性——人类社会面临着崩溃的可能性。这帮我们的“参与的2050”指出了方向,就研究经济增长和环境之间的关系,这也是 Geoffrey West 认为的搞人工智能很容易忽略的点,而这是非常重要的一点,确实需要把这两者联系起来。


这本书给我们看到了把经济发展和环境演变联系起来的可能性,所以我们决定,在未来会花几年甚至几十年的时间去研究这个问题,把它当成一个任务去做。还有我觉得也恰恰只有系统科学才能研究这个问题,因为其他任何一个学科,都太单一了。而这个问题是需要把很多不同的学科,联合在一起的,所以说《规模》这本书对我影响很大吧。



Q:

关于《规模》这本书,作者 Geoffrey West 提出的解构复杂世界的简单逻辑——“规模法则”您是怎么理解的?


张江:

统计学,热力学物理,就是《规模》这本书所采纳的方法,这套方法跟Agent 建模以及复杂理论不太一样,Agent 建模很大的一个特点,就是它的简单性:我们一想到复杂理论就会想到微观的、细节的一些方面,比如做股票市场的模拟,就需要对 Agent 赋予一些规则。但是《规模》的思路就完全不是这样,它是放弃了微观的东西,只去抓取最重要的、最宏观的东西。


对于一个复杂系统而言,它最重要的东西,恰恰就是规模,也即尺度的大小。《规模》这本书就牢牢抓住了“尺度”这个宏观的量。当然了,只看一个宏观量没有意思,要看多个宏观量之间的关系。


我认为所谓的“规模法则”,就是两两宏观变量之间的关系,比如说新陈代谢和体重的关系,GDP 和人口的关系。


那么这样简单的东西会给我们什么好玩的东西呢?


其实在这么一些简单的东西里面,我们恰恰能挖掘出一些很有价值的、很有意思的东西。这些东西是什么呢?比如说去了解不同系统的新陈代谢就非常重要,几乎所有活的复杂系统,都是有流入流出的——也就是能量或信息的交换。顺着新陈代谢继续往下探究,就必然会发现一定的结构,这些结构以网络的形式呈现,网络从小变大的过程不是任意进行的,它的演变必须是满足一定规律地去进行。比如生物的新陈代谢,我们通过挖掘,就会发现网络中的输运系统——毛细血管运行的一些规律。


这本给我们提供了一些原则,我们利用这些原则,推测出很多结论。


为什么生物体的心跳数是三十亿次左右,这就跟它的网络结构有关,与规模法则也是密切相关的,我们可以用规模法则推理出心跳的次数。再比如说,哺乳类动物的细胞大小,有一个最小的尺度,这个最小的尺度是能够用规模法则被推算出来的。


规模法则可以在生物系统中发挥预测功能。同样的,这样的方法也可以套用到城市和公司的研究中去。对于这两个领域我们都有参与,我们通过这套研究框架研究过城市和公司的结构,并得到了一些定量结果。


这些结论的特点在于:

一、具有很强的定量性,很精确;

二、具有宏观的特性,能从整体上观测。


而它的弱势在于,它没有解释微观的东西,比如股票什么时候涨什么时候跌,这类的问题它没办法回答。


总结而言,《规模》这本书给我们提供了不一样的视角。



Q:

您觉得人类该如何适应未来的人工智能社会?


张江:

即便人类真的成为了人工智能的奴隶,我觉得知道这个事实也无所谓,这么假设和不这么假设其实没多大区别。


我觉得人类的核心价值就在于人性:什么是意义,人最基础的欲望以及人们感兴趣点是什么等等。这是不变的东西,也恰恰是你可以拿来应万变的东西。


机器会产生意识吗?


从目前的角度来看,首先我们不知道什么是意识。


我的一篇文章曾经讨论过这个问题,一些实验的结果表明,人的意识分两套系统:一套系统用来描述,一套系统用来体验。如果从这两个角度去看的话,人工智能是可以产生意识的。而且我还指出了一个具体的机器模型,叫作“哥德尔机”。虽然“哥德尔机”只是一个设计方案,还没有变成一个可运转的机器,但 Schimchuber 坚信这个机器可以看作是具有自我意识的系统。


所以说,我对这个问题的回答是,我们似乎没有看到有任何的不可能。



Q:

普通人如何把握最前沿的科技进步所带来的红利?


张江:

像互联网这产业种思维方式,最近几年的创业套路其实就是在占一个一个的坑,虽然在一个一个领域产生了寡头,但却变得非常的富饶,就是只要你想得到东西其实都有人在做,都能找到对应的点是什么。


现在有很多线上线下的活动,还有一些科普的公众号,其实途径并不缺。但是普通人跟着热点跑是永远跟不上的,与其跟热点,不如以不变应万变,就是回归到自己内心的本质,挖掘自己的梦想,问自己最想要的东西是什么。



Q:

怎样才能发现自己的兴趣?


张江:

这是牵扯到了人生观的问题,我认为理想化的状态是,学会自己与自己交流。我相信每个人都有自己的兴趣点,只不过当下这个社会让那些有自己兴趣的人都慢慢地放弃了自己的兴趣。看到身边的很多朋友就被一些东西所左右,其实也包括我自己,也会有一些动摇。当然动摇的都在于小的方面,大方面是比较坚定的,小的方面就会被媒体或者朋友的一些说法所左右,所改变。


如果有很强的兴趣点,知道自己想要干什么的话,就不需要找了,也不需要去听别人的意见,直接挖掘自己的兴趣点就好了,挖掘下去。互联网时代跟以前不一样,它很富饶,而且多样性很强。你如果有自己的兴趣点,而且挖地比较深,那你就可以在这个社会上立足。


如果暂时还没有发现自己的兴趣点,那就多花些时间和自己对话,进一步地去挖掘自己。




本文经授权转载自 代观

编辑:孟婕




推荐阅读


盘点2018年21本必读的复杂性科学新书好书

复杂性科学入门书单——十本书带你进入复杂性领域

复杂性科学从入门到精通,这十本专业书必不可少!

《多样性红利》新书:复杂性背后的模型思维方式

加入集智,一起复杂!


推荐课程


PC端地址:

https://campus.swarma.org/gpac=135





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

合成生物学如何理解和构建生命复杂性?| 顶尖科学家访谈


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存