查看原文
其他

研究速递:创新更多发生在科研网络的边缘

郭瑞东 集智俱乐部 2022-06-15


导语


创新即可以看成通过集体运算解决一个问题,但对创新的关注点,往往聚焦于少数做出了有影响力贡献的个体。来自圣塔菲的研究者,在Theory in Biosciences的集体行为特刊中的论文,通过对2018年以前进化医学领域发表的6000多份论文引用网络以及论文文本的分析,发现大多数创新都发生在科研网络对的边缘地带ーー这表明,避开当前的研究范例,可能有利于创造新颖而持久的变化。


研究领域:引文网络,科学学,集体行为

郭瑞东 | 作者

邓一雪 | 编辑



论文题目:

Innovations are disproportionately likely in the periphery of a scientific network

论文地址:

https://link.springer.com/article/10.1007%2Fs12064-021-00359-1


该研究的基础,在于“共引连边”的概念。如下图所示,论文A和B都引用了论文C,这意味着两篇论文之间存在着共同的研究基础。由此在共引网络中,在论文A和B之间(两篇论文至少有一篇共同引用的论文)建立一条共引连边,这样就可构建一个共引网络。所构建出的共引网络,会包含一小部分核心节点,代表某一学科内的核心概念,而周围节点则代表外围概念。



图1. 共引网络的构建的示意图


 

图2. 2008年的进化医学领域论文共引网络,其中红点代表论文。可以看到其包含少数中心节点,以及四散的边缘节点


研究者通过将论文转移为文本,并按年份进行词频分析,得出按年度的高频关键词。据此可以找到那些前瞻的“创新性”论文——其关键词在当年的热点词汇中没有出现,却出现在下一年。

       图3. 对论文进行文本分析的方法概述图


而那些被标记为创新性的论文,其累积引用量,要优于该领域的平均水平。这说明了上述基于文本词频分析方法的有效性。


图4. 2007至2014年间,进化医学领域所有论文和标记为创新论文的累积引用量曲线,橙色的线代表的创新性论文,能够以更高的概率,获得相同的年均引用量


在网络科学中,富人俱乐部(rich club )指的是网络中的节点,其连边数比预期得更多。在共引文网络中,在一定的连边度范围内,呈现出度数越高,富人俱乐部效应越严重的现象。这说在引文网络的越是中心节点,越是该学科的核心概念,越是研究者们无法绕开的基础。

图5. 论文引用量(横轴)与描述富人俱乐部效应程度的系数在引用量小于400时,呈正相关


该研究最关键的发现,如下图所示,对比创新性论文和所有论文在共引网络中的累积度分布,可以发现创新性论文更多位于共引网络的边缘位置。 

图6. 创新性论文和所有论文的引用累积概率密度的对比


总结来看,该研究的贡献首先是提出了一个新颖的、基于文本词频的论文创新性评价指标。其次是在构建的共引网络中,发现了预期的“富人俱乐部”现象,并说明创新性的论文有更大比例分散在共引网络的边缘。对这一现象的解释是,位于共引网络核心的论文,表现出较高的与其他论文的相似性。而位于边缘的论文,有更大的灵活性,更有可能产生创新。


该研究指出,科研中保持一个稳健的中心与一个能促成创新的边缘同等重要。更广泛地看,着体现了在健壮性和适应性之间的权衡。而这发生在一系列生物社会系统中。例如,生命系统可能在个体稳定性与集体不稳定性的光谱上摆动,以便变得更加具有可预测(健壮的中心),或通过个体的波动来实现集体的敏感和适应性。神经元之间的连边,也呈现出中心-边缘的结构,以及富人俱乐部的统计特征。同时,该文描述的科研创新过程(现有观点的重组),与生物体的进化过程(保持核心基因组不变,同时对基因组中现有基因进行重组)极为相似。


未来还需要做更多的工作,以确定类似的创新模式是否在其他学科(例如社会科学、企业专利创新)中普遍存在。如果创新以类似的模式发生,通过网络视角观察产生创新的组织,找出那些位于核心和外围的组织如何互动,可能对理解、引导并促进持续的创新至关重要。



集智计算社群欢迎你的加入!


我们是集智算法组,为集智俱乐部公众号/集智斑图/集智学园/集智百科等产品提供算法支撑和服务。目前的算法开发范围包括而不限于文本分析、术语和概念挖掘、引文网络分析、科学影响力评价、推荐系统、图神经网络等。我们在集智社群的知识和科技氛围中成长,也将成果反哺于集智社群。如果你是算法爱好者并对上述某个算法分支感兴趣,欢迎加入我们组织的集智计算社群;如果你有其它用科技赋能集智的好点子,期待你的分享。


微信加入集智计算社群请扫码:


实习生简历请投至huqiao@swarma.org


推荐阅读



点击“阅读原文”,加入集智计算社群

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存