查看原文
其他

“网络科学的黄金时代”:中国科学家大放异彩

吴雨桐 集智俱乐部 2021-02-09


导语

近20年来,信息技术的发展和进步为大网络研究提供了新的途径,网络科学已经渐渐发展为新的独立学科。这二十年被认为是“网络科学的黄金时代”


最近的一篇arXiv预印本论文中,研究者通过合作网络探究二十年来网络科学领域的发展。基于三篇网络科学奠基性的论文Watts & Strogatz,1998, Barabási & Albert,1999 和 Girvan & Newman,2002,研究人员分析了二十年来引用这三篇论文的所有论文,共29528篇,构建了一个包括52406位网络科学家的合著关系网络。文章中找到了最C位的作者,最大的研究社群,以及合作模式的变化。


论文题目: 

Two Decades of Network Science as seen through the co-authorship network of network scientists

论文地址:

https://arxiv.org/abs/1908.08478


网络科学 20 年

成为独立学科:成就与挑战


复杂网络已被广泛研究于各个学科,包括:生物(如:蛋白质交互作用网络)、信息科学(如:万维网、因特网)、社会科学(如:合作、传播、经济、政治)。更重要的是,不仅这些网络发源于不同领域,研究网络科学的方法也是发源于图论、统计物理学、计算机科学、和社会学等较为基础性的学科。

 

近20年来,网络科学已经渐渐发展为新的独立学科。2005年,美国国家科学研究委员会(U.S. National Research Council)把网络科学定义为基础研究领域。自此,相关刊物、学术会议规模日益壮大。大学里,致力于研究网络科学的研究生、博士项目也纷纷建立起来,如美国东北大学的网络科学研究所(Network Science Institute at Northeastern University)专门设置的网络科学博士项目,西北大学的复杂系统研究所(Northwestern Institute on Complex System),耶鲁大学的网络科学研究所(Yale Institute for Network Science),杜克大学的网络分析中心(Duke Network Analysis Center),国内的中科院数学与系统科学研究院与北京师范大学系统科学学院等等。


网络理论的重要性同时体现在复杂网络领域大量的文献,和三篇奠基性论文的高引文数。不仅在学术界,大众视野中,介绍网络科学的科普读物也陆续涌现。如:巴拉巴西的《链接》、《爆发》。


信息技术的发展和进步为大网络的研究提供了新的方式。这二十年被认为是“网络科学的黄金时代”。 科学家们探索的过程中不断攻克挑战,理解网络拓扑就是其中一大挑战。结构性质一个接着一个被放在“显微镜”下深入研究:小世界性质、无标度性质、模块化等等,很多网络模型用数学语言描述并尝试理解,现实世界中网络的构造和发展。而近年,网络科学领域的研究方向也渐渐从结构分析向复杂网络的控制原理方向转变。强大的计算能力、庞大的数据库、以及新兴的计算技术更为网络科学未来二十年的发展提供了巨大的动力支持。

 

同时,学界也出现了很多对网络科学的质疑。一些文章质疑无标度性质的普遍性,并提出生物学里的网络和因特网都不是无标度的。这些文章批评了少数网络科学文献中,数据不足、低质量的衡量方法,缺少仔细的统计检验等现象。批评者还指出,一些经常在网络科学领域使用的方法,如最小二乘法(least-squares fitting),会提供严重不准确的参数估计。值得一提的是,没有批评人士否认研究复杂网络的重要性,他们更多的是提出研究方法上的顾虑。



网络科学引文数据库:

29528篇论文构成的合著网络


这篇文章的重点是网络科学家的合著网络,两个科学家共同发表过至少一篇论文,他们之间就形成了合著关系。在此之前,只有Newman的团队分析过网络科学家的合著关系网络,但他们当时网络只包含1589位科学家,而这篇文章的研究涵盖了20年内的52406位科学家以及329181个合著关系。


2019年5月16日,研究人员从Web of Science的参考文献数据库提取所需数据,筛选条件是引用过三篇里程碑论文的文献。这三篇里程碑论文分别是:

 

  1. 1998年,Watts & Strogatz 在Nature上发表的Collective dynamics of ‘small-world’ networks 中引入“小世界”模型;

    https://www.nature.com/articles/30918.

  2. 1999年,Barabási & Albert在Science上发表的Emergence of scaling in random networks 中引入“偏好依附”模型;

    https://science.sciencemag.org/content/286/5439/509.full

  3. 2002年,Girvan & Newman在美国国家科学院院刊上发表的Community structure in social and biological networks 引入社群结构性质;

    https://www.pnas.org/content/99/12/7821.short


由于还有相当一大部分研究网络科学的文献没有引用上述三篇里程碑文章,并且也不是所有引用了这三篇文章的文献都与网络科学有关,所以,此数据库的选取,会产生相应的偏差。
         
图1:三篇论文的引文数分布图
 


论文合著网络:

文献、作者、内容


下面两幅图分别是网络科学文献主要的研究领域,体现了网络科学的跨学科特征。我们可以看出,在第一个十年主要是侧重于物理学领域,之后计算机科学展露头角、占领高地,神经科学也在近十年开始使用网络科学工具。 
           

图2:文献主要的12个研究领域。蓝色部分是截止2009年底的文献数;

橙色部分是2010年初之后的文献数
               图3:文献所发表的主要的12份期刊。其中,物理学期刊占比很大。
蓝色部分是截止2009年底的文献数;橙色部分是2010年初之后的文献数
 
在文章的数据库中,论文量前三甲皆为中国人。论文量最高的是香港城市大学电子工程系的陈关荣教授,他的研究方向是非线性系统的控制理论和动力学分析。论文量第二第三的分别是电子科技大学的周涛教授和中国科技大学的汪秉宏教授。 

 

图4:网络科学论文量最高的10位作者姓名、论文数、引文数

 
下图的两个词云分别描述了第一个十年和第二个十年的网络科学文献常用的关键词。我们可以看到,前半部分主要是结构相关(如:无标度、小世界、拓扑)和模型相关(如:偏好依附机制),而后半部分的研究主题,如社群发现 (community detection)、社交网络分析 (social network analysis)、大数据、数据挖掘 (data mining),转变为更火的关键词。第一个时期主要研究的是因特网、P2P、和蛋白质交互网络,而自2010年起,研究方向更多地转为社交网络和脑网络。

     
图5:1998-2009年和2010-2019年网络科学文献高频关键词的词云
 
 

合著网络中洞悉合作模式

国际合作频繁 中国占有一席之地


研究人员构建了无向的 (undirected)、非加权 (unweighted)的合著关系网络,网络中度的平均数是12.56,中位数是4,也就是说每个科学家平均有12个合作者,而中位数仅为4位。下图为合著关系网络的度分布图,共851位作者没有合著文章,最有代表性的是二至四位合作者。合作者最多的是美国南加州大学的神经科学家保罗·汤姆生 (Paul M. Thompson),共有444位合作者。 
        图6:网络的度分布遵循幂律
 
另外,此合著关系网络是高度集聚的,整体集聚系数 (gloabl clustering coefficient) 是0.98,平均局部集聚系数是0.77。最大联通分支中的平均最短路径是6.8,体现了该网络的小世界性质。通过计算作者在网络中的中心度,研究人员找到了最中心的10位作者: 
       表1:根据中介中心度排序的最中心的10位作者以及他们的调和中心度和引文数
 
网络科学家们之间的联系也逐渐变得越来越多。如下图所示,不仅最大联通分支(橙线)的体量变大了,而且其相对于整个网络的比例(蓝线)也有增加,2019年最大的联通分支包含32904位作者,占据整个合著网络的62.8%,体现了网络科学社群的多样性与合作性。 
      
图7:最大联通分支绝对和相对体量随时间的变化
 
此外,研究人员还用模块最大化社群发现算法 (Clauset-Newman-Moore greedy modularity maximization community detection algorithm) ,找到了几个主要的、内部联系紧密的社群。其中最大的社群是主要由中国的物理学家组成,共有14136位作者。就论文量而言,中国网络科学领域的论文量在2009年左右就已赶超美国。

        图8:为探究网络合作领域的国际合作模式,文章构建了此边加权的网络。节点的大小表示该国家的作者贡献的文献数量,边的宽度表示该两国作者之间的合著文献数。我们看出,中国贡献的文献体量最大,而美国很注重国际合作,欧洲国家之间也有很多合作

 
         图9:对数标尺上,网络科学文献的累计数随时间的变化。每条线代表第一作者的国家,
深蓝色线代表中国,橙色线代表美国
 


结语


合著关系勾勒出学界研究合作的模式,是一个很重要的让分散专业知识汇集、产生新发现的机制。合著关系网络已经在不同领域、以不同的方式和角度用于探索科学家的合作模式。这篇文章揭示了网络科学领域的合作模式及其发展。由于数据库的局限性,其结果不可避免地会有偏差,但也为我们窥探网络科学领域的发展提供了重要的参考。

网络科学从1998年前后异军突起,至今已经20年,中国网络科学获得飞跃发展,中国学者从发文数量到被引数量都逐步上升,正在向网络科学领域的C位靠近。

 
可以进一步了解论文公开数据库:https://github.com/marcessz/Two-Decades-of-Network-Science


作者:吴雨桐审校:刘培源编辑:张爽



推荐阅读


小世界网络、偏好依附机制、跨学科研究——网络科学20年
解读幂律和无标度 | 网络科学入门
经济复杂性指数:利用网络科学判断国家经济实力
21世纪社交图鉴:网络科学“支配”下的网游玩家行为模式
加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存