研究速递:创新更多发生在科研网络的边缘
导语
创新即可以看成通过集体运算解决一个问题,但对创新的关注点,往往聚焦于少数做出了有影响力贡献的个体。来自圣塔菲的研究者,在Theory in Biosciences的集体行为特刊中的论文,通过对2018年以前进化医学领域发表的6000多份论文引用网络以及论文文本的分析,发现大多数创新都发生在科研网络对的边缘地带ーー这表明,避开当前的研究范例,可能有利于创造新颖而持久的变化。
研究领域:引文网络,科学学,集体行为
郭瑞东 | 作者
邓一雪 | 编辑
论文题目:
Innovations are disproportionately likely in the periphery of a scientific network
论文地址:
https://link.springer.com/article/10.1007%2Fs12064-021-00359-1
该研究的基础,在于“共引连边”的概念。如下图所示,论文A和B都引用了论文C,这意味着两篇论文之间存在着共同的研究基础。由此在共引网络中,在论文A和B之间(两篇论文至少有一篇共同引用的论文)建立一条共引连边,这样就可构建一个共引网络。所构建出的共引网络,会包含一小部分核心节点,代表某一学科内的核心概念,而周围节点则代表外围概念。
图1. 共引网络的构建的示意图
研究者通过将论文转移为文本,并按年份进行词频分析,得出按年度的高频关键词。据此可以找到那些前瞻的“创新性”论文——其关键词在当年的热点词汇中没有出现,却出现在下一年。
而那些被标记为创新性的论文,其累积引用量,要优于该领域的平均水平。这说明了上述基于文本词频分析方法的有效性。
在网络科学中,富人俱乐部(rich club )指的是网络中的节点,其连边数比预期得更多。在共引文网络中,在一定的连边度范围内,呈现出度数越高,富人俱乐部效应越严重的现象。这说在引文网络的越是中心节点,越是该学科的核心概念,越是研究者们无法绕开的基础。
图5. 论文引用量(横轴)与描述富人俱乐部效应程度的系数在引用量小于400时,呈正相关
该研究最关键的发现,如下图所示,对比创新性论文和所有论文在共引网络中的累积度分布,可以发现创新性论文更多位于共引网络的边缘位置。
图6. 创新性论文和所有论文的引用累积概率密度的对比
总结来看,该研究的贡献首先是提出了一个新颖的、基于文本词频的论文创新性评价指标。其次是在构建的共引网络中,发现了预期的“富人俱乐部”现象,并说明创新性的论文有更大比例分散在共引网络的边缘。对这一现象的解释是,位于共引网络核心的论文,表现出较高的与其他论文的相似性。而位于边缘的论文,有更大的灵活性,更有可能产生创新。
该研究指出,科研中保持一个稳健的中心与一个能促成创新的边缘同等重要。更广泛地看,着体现了在健壮性和适应性之间的权衡。而这发生在一系列生物社会系统中。例如,生命系统可能在个体稳定性与集体不稳定性的光谱上摆动,以便变得更加具有可预测(健壮的中心),或通过个体的波动来实现集体的敏感和适应性。神经元之间的连边,也呈现出中心-边缘的结构,以及富人俱乐部的统计特征。同时,该文描述的科研创新过程(现有观点的重组),与生物体的进化过程(保持核心基因组不变,同时对基因组中现有基因进行重组)极为相似。
未来还需要做更多的工作,以确定类似的创新模式是否在其他学科(例如社会科学、企业专利创新)中普遍存在。如果创新以类似的模式发生,通过网络视角观察产生创新的组织,找出那些位于核心和外围的组织如何互动,可能对理解、引导并促进持续的创新至关重要。
集智计算社群欢迎你的加入!
我们是集智算法组,为集智俱乐部公众号/集智斑图/集智学园/集智百科等产品提供算法支撑和服务。目前的算法开发范围包括而不限于文本分析、术语和概念挖掘、引文网络分析、科学影响力评价、推荐系统、图神经网络等。我们在集智社群的知识和科技氛围中成长,也将成果反哺于集智社群。如果你是算法爱好者并对上述某个算法分支感兴趣,欢迎加入我们组织的集智计算社群;如果你有其它用科技赋能集智的好点子,期待你的分享。
推荐阅读
创新与报道,改变科学影响力的两个因素 PNAS:数以亿计的论文,正在成为科学创新的阻力 科学学前沿:新团队在创新和交叉研究中的关键作用 《张江·复杂科学前沿27讲》完整上线! 成为集智VIP,解锁全站课程/读书会 加入集智,一起复杂!
点击“阅读原文”,加入集智计算社群