从复杂网络小世界、无标度、高聚类特性看新型冠状病毒肺炎
这篇文章的提纲于2020年1月22日(武汉封城的前一天)发在科学网。基于复杂网络最基本的三大特点——小世界、无标度、高聚类,来分析新型冠状病毒肺炎这一场突如其来的灾难。文章指出,现代化交通工具是一把双刃剑,让世界变得越来越小的同时也让疾病传播变得更加容易;无标度特性表明采用隔离和切断传播途径是遏制疾病传播最有效的方法,警惕超级传播者的出现;潜伏期(传播时滞)给发现和切断传播途径带来的困难;社会网络高聚类系数使得新型肺炎的传播具有很强的聚集性。目前来看,利用复杂网络理论来指导抗击新冠疾病具有极其重要的现实意义。
引言
复杂网络的发展经历了三个阶段:规则网络、随机网络和复杂网络阶段(图1)[1]。规则网络包括全连接网络、星型网络和k-近邻网络等。1959年,两个匈牙利著名的数学家Erdös和Rényi建立了著名的随机图理论,用相对简单的随机图来描述网络,简称ER随机图。随机网络是指在由N个节点构成的图中,以概率p随机连接任意两个节点而成的网络,即两个节点之间连边与否由概率p决定。随机图的重要普适规律性就是涌现性,即随机网络的许多重要的性质都是随着p的扩大而突然出现的。换句话说,随着p的变化超过某个阈值,要么几乎所有的随机图具有某种性质,要么几乎每一个图都不具有该性质。ER随机图理论对图论的影响长达近40年,以至于在随后的近半个世纪,随机图一直是科学家研究真实网络强有力的武器。但是规则网络和随机网络都无法刻画实际系统。
图1:四种类型的网络。
a)从规则网络到小世界网络、随机网络[1];
b)一个实际的高聚类无标度网络
以小世界模型[2]和无标度理论[3]提出为标志,复杂网络在理论和应用方面都得到了飞速的发展[1,4]。生物系统中的基因调控、蛋白质互作、代谢、信号转导等[5,6]、社会关系、交通、科学家之间的合作、万维网等实际中的复杂系统都可以利用复杂网络进行建模及研究[1]。复杂网络由节点和边构成,节点和边根据实际问题可能还具有特定的属性。节点可能对应于不同的实体,边及其权重对应于两两节点之间的距离或相似性。虽然不同网络中的节点类型和边的意义可能各不相同,但通过大量实际系统的实证研究,人们发现现实的复杂网络存在一些普适的规律性,如小世界特性、无标度、高聚类特性和弱连接优势[7]。这些性质极大的推动了复杂网络理论及应用研究。
小世界、无标度、高聚类特性和弱连接优势的发现对于人们对疾病传播的认识具有重大意义[8-14]。2019年末开始,源于武汉华南海鲜市场的新型肺炎(2019-nCoV)疫情给全国带来了一个毕生难忘的不平静的春节。截止2020年2月4日9时,全国已经累计确诊2万余例,造成425人死亡[15](图2a-c)。国家迅速启动各类防控措施,积极防控此次疫情的蔓延。复杂网络理论可以帮助我们解读各类措施的科学性,为控制疫情提供指导性的建议。借助复杂网络理论甚至可以对疫情的进一步发展情况进行预测[16-20]。下面结合笔者的认识谈谈复杂网络的这些特性与2019-nCoV疫情防控之间的关系。
地球村小世界特性
加速了疾病传播
如果一个网络具有短的平均路径长度和高的聚类系数,则称该网络具有小世界性[1,5]。小世界特性的有名科学假设是“六度分离”理论;该理论最早是在1967年由美国哈佛大学心理学家Milgram通过社会调查做出的推断,是指在大多数人中,任意两个素不相识的人通过朋友的朋友,平均最多通过5个人就能够彼此认识。
事实上,现在的世界真的很小。随着现代化交通通讯工具——民航、高铁、5G技术等的快速发展,人们的活动半径快速增长,人与人之间的时空距离变得更小, 我们实际上已经生活在了超小世界中。因此,有学者提出“六度分离”已经变成了“三度分离”。这些交通通信方式给人们带来便利的同时,也会带来一定的灾难。小世界网络使得疾病或谣言等的传播网络的半径也变得越来越小,从而使得疾病传播和谣言的扩散等更加容易。这里面主要是因为小世界网络存在一些起关键作用的长程链接,网络上的行为可以很快的通过这些长程链接扩散到整个网络。其实,这就是所谓的弱链接优势现象[7]。
此次2019-nCoV疫情始于武汉华南海鲜市场,短期内迅速扩散到全国各省市甚至世界多国,追根溯源,很多地方的感染者都直接或者间接的和武汉感染者有关联(有武汉旅行史或接触史)。此次疫情正值中国最重要的传统节日——春节,据2020年1月26日武汉市长周先旺在湖北省人民政府关于新型冠状病毒肺炎疫情防控新闻发布会上所言,截止26日晚,约有500万人离开武汉,还有900万人留在武汉。许小可等[16]对武汉封城前(姑且称之为封城)从武汉流出的500万人是逃离还是正常离开做了分析,认为大部分属于年前正常流动,但封城前10小时离开武汉的30万人异于往常。封城前10小时,有250余列车从武汉出发前往全国各地。大规模的人口的流动激活了网络中的长程链接,使得2019-nCoV迅速扩散到全国各省市(图2d)。根据互联网大数据分析提供的数据[1],不同省市确诊人数和被激活的长程连边数(疫区)基本成正比(Spearman相关系数0.8710,P<0.05。)不过,广东和浙江的武汉封城前流入人口比例较低,可是2月4日确诊人数很高,如何解释(图2d)? (注:不同省份采取的隔离措施早晚、强度、医疗条件、城市化水平等可能都会有影响)这是复杂网络小世界性带来的灾难的典型例证。
复杂网络无标度特性
意味着疾病传播非常容易
复杂网络另一个典型特征是无标度性。无标度网络的主要特点是大部分节点度很小,少部分节点度很大;网络的度分布呈幂律分布,节点的度具有异质性,不同节点在网络传播中的作用一般不同(图3)[9]。因此,识别网络中的关键传播节点是复杂网络理论中一个关键的科学问题,目前已经得到了大量的研究[5,6,9-11,34]。
图 3:两个结构有差别的初始感染源(节点)的感染规模对比[9]。
a和b中的初始感染节点度相同,但核数(在网络中的层数)不同。
为了衡量节点的传播能力,通常做法是赋予网络中每个节点以传染病动力学模型[11],如SIS,SIR,SEIR[22]等,以每个节点作为传染源,通过大量仿真获取传播行为稳定后每个节点出发感染节点数据。现有大量研究表明,节点在网络中的拓扑结构(度、介数、核数、接近度等各类拓扑结构指标)不同,其传播能力差别很大[9]。不同类型的复杂网络,传播行为也有很大的差别[8,12]。将感染率与恢复率的比值定义为传播强度(类似于生物数学中基本再生数),如果传播强度超过某个阈值(类似于基本再生数大于1),疾病会蔓延开来;如果低于某个阈值(基本再生数小于1),疾病将得以控制。通过在规则网络、随机网络、小世界网络上的理论研究,科学家惊奇地发现,在无标度网络里传播阈值趋于0(图4),意味着所有传染病在无标度网络中非常容易传播。究其原因在于无标度网络中存在少数度大的节点,称为hubs。hubs一旦被感染,将成为超级传播者(超级传播者—接触广泛的高危人群)。这是一个令人沮丧的发现,因为我们的社会网络具有无标度性,原则上说没有办法通过降低传染强度来遏制疾病的传播,除非采用隔离,切断传播途径。目前已经肯定新型冠状病毒肺炎存在人传人现象,因此隔离是最重要的方法。从23日武汉采取封城隔离措施之后,很多省市迅速启动各类隔离举措,有效阻断了2019-nCoV的更大范围传播。
回顾2003年造成全球700余人死亡的SARS传播[23,24]事件,有研究发现SARS病毒的源头可能是蝙蝠[25],而不是以前人们认为的果子狸[26,27],果子狸属于中间宿主,也是SARS病毒的受害者。目前广为人们接受的关于SARS的传播途径的观点是:蝙蝠——果子狸——人群。2019-nCoV至今仍没有确定中间宿主是什么野生动物,虽然已有关于2019-nCoV的很多研究[28,29,30]。更糟糕的是2019-nCoV传播具有潜伏期,大部分潜伏期1-14天不等,平均7天,潜伏期长增加了疫情控制的难度,使得一些潜在的超级传播者不能被第一时间发现并隔离。另外,一旦发现感染者,需要向前追溯大量的潜在感染者,增加了工作的难度和复杂度。
复杂网络聚类特性
意味着疾病容易聚集爆发
现实网络通常具有很高的聚类系数,简单来说就是你的朋友之间很可能也是朋友关系。人群有很强的聚类(很强的社团结构)特点,对应的社会网络也是高聚类的。小到一个家庭、小区、市场,大到一个城市、国家,不同尺度上都有很明显的聚类特点。同时在疾病蔓延阶段,家庭、社区之间的接触加速传播的速度,扩大传播范围[13]。
武汉华南海鲜市场是一个人群集聚之地,新型肺炎患者首先出现在这里,并且具有以家庭或小区集聚感染的现象,其他省市感染者以家庭或朋友关系圈集聚的现象也有很多报导[31,32],这些都说明新型肺炎传播有很强的聚类特点,这一点和2003年的SARS类似(图5)。针对社会网络的高聚类特点,一旦一个社团中发现感染者,应立即对其进行隔离并对社团中的人员进行隔离观察,以有效防止扩散传播的可能。
图 5:2003年SARS在新加坡的超级传播者传播链具有聚类特点[33]。
结论及探讨
社会网络作为典型的复杂网络,具有小世界、无标度、高聚类和弱链接优势等特性。小世界特性和弱链接优势加速扩散;无标度特性为传播提供便利;高聚类特性使得传播具有家庭或小区集聚性。针对近期武汉2019-nCoV疫情,病毒携带者带有一定的潜伏期,这种潜伏期相当于一种网络上传播行为的时滞,这种时滞性也为新型肺炎的防控带了的隐患和挑战。以复杂网络理论作为指导,防控疾病进一步传播的有效举措可以从社会网络的特性上去解读:首先发现感染源,控制感染源,切断长程传播链接(切断航空、铁路、高速)防控大范围蔓延;其次城市、社区、小区到家庭逐级隔离防控不同社团间的传播,最大限度减少传播带来的损失。
最后,特殊时期,为有效阻断病毒传播,个人防护方面要养成好的个人卫生习惯,戴口罩勤洗手,减少任何不必要的聚集活动,不把疾病带回家。禁食禁售野生动物,不给病毒入侵人类制造机会。祝愿大家平平安安度过这段日子!
[1] 汪小帆,李翔,陈关荣, 复杂网络理论及其应用。北京:清华大学出版社,2006。
[2] Watts DJ, Strogatz SH., Collective dynamics of 'small-world' networks. Nature, 1998, 393 (6684): 440-442.
[3] Barabasi AL, Albert R., Emergence of scaling in random networks. Science, 1999, 286: 509-512.
[4] 吕金虎, 谭少林, 复杂网络上的博弈及其演化动力学, 北京:高等教育出版社出版, 2019。
[5] Wang P, Chen Y, Lü J, et al., Graphical features of functional genes in human protein interaction network. IEEE Trans. Biomed. Circuits Syst., 2016, 10(3): 707-720.
[6] P. Wang, J Lü, X Yu, Identification of important nodes in directed biological networks: a network motif approach. PLoS One, 9(8): e106132, 2014.
[7]Granovetter M, The strength of weak ties. Amer. J. Sociol.,1973, 78, 1360-80.
[8]Pastor-Satorras R, Vespignani A, Epidemic spreading in scale free networks. Phys. Rev. Lett., 2001, 86, 14, 3200-3203.
[9]Kitsak M, Gallos LK, Havlin S, et al., Identification of influential spreaders in complex networks. Nat. Phys., 2010, 6: 888-893.
[10]Wang P, Tian C, Lu J, Identifying influential spreaders in artificial complex networks. J. Syst. Sci. & Complex., 2014, 27: 650-665.
[11]Lü LY, Chen D, Ren X, et al., Vital nodes identification in complex networks. Phys. Rep., 2016, 650: 1--63.
[12] Zhang ZK, Liu C, Zhan XX, et al., Dynamics of information diffusion and its applications on complex networks. Phys. Rep., 2016, 651: 1-34.
[13]Wei X, Wu X, Chen S, Lu J, Chen G, Cooperative epidemic spreading on a two-layered interconnected network. SIAM J. Applied Dyn. Syst., 2018. 17(2): 1503-1520.
[14]Xu S, Wang P, Zhang CX, Lü J, Spectral learning algorithm reveals propagation capability of complex network. IEEE Trans. Cyber., 2019, 49(12): 4253-4261.
作者:陆君安、王沛
审校:刘培源
编辑:张希妍
系统科学公开课
新冠病毒疫情对社会系统形成了巨大挑战,也更突显了复杂系统科学研究的价值。集智精心整理了全站的系统科学系列课程,免费向读者开放,希望这个 2 月有新知,不虚度。
推荐阅读
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!