2022年5月发表在 Nature Human Behaviour 的新研究,通过分析1980-2012年间150个学科的论文引用数据,使用基于语义相似性和多重网络的新分析方法,揭示了随着科研全球化,不同国家之间的研究正在变得越发不平等,这种国与国之间的不平等将会阻碍新想法的诞生。
关键词:引文网络,科学学,马太效应,语义相似性
郭瑞东 | 作者
梁金 | 审校
邓一雪| 编辑
论文题目:Leading countries in global science increasingly receive more citations than other countries doing similar research论文链接:https://www.nature.com/articles/s41562-022-01351-5
基于引文网络,已有很多值得关注的新发现,例如:《2600万篇论文引用调查:科研界马太效应加剧,强强联合愈发普遍》《创新更多发生在科研网络的边缘》《PNAS:数以亿计的论文,正在成为科学创新的阻力》《分析了2500万篇论文后,发现科学正在变得越来越保守》《想要原创成果?请建新鲜团队!——海量论文实证分析的建议》。除此之外,2022年的PNAS论文“全球引文不平等正在增加”[1],也是通过对来自400万作者2010-2015年间总计2600万篇论文引用数据的分析,指出与“普通科学家”相比,引用排名前1% 的科学家在出版和合作活动方面的模式有所不同:引用排名前1%的研究者引用份额不断增加,而且引用不平等在自然科学、医学科学和农业科学中呈上升趋势。Nature Human Behaviour 的这项研究研究采取了语义相似性,考虑到来自同一国家的研究者自然会关注相近的话题,有相似的表达风格,因此被过多的引用也是有一定合理性的。这个不可避免的噪音信号影响了与真实引用网络的比较得出的扭曲程度的客观性。对此未来的研究者需要考虑更多的相关因素,例如论文的质量而不仅仅是主题是否相关。尽管存在上述问题,但基于多重网络和自然语言处理的“引文透镜”的出现,说明了计算社会科学可以使用新工具对海量数据集进行持续地深度挖掘,得到之前无法量化研究的结论。除了按照国家维度拆分数据,还可以按照研究机构,找出哪些大学的研究者更像荷兰和瑞士的科研人员一样不偏不倚,据此评估科研政策带来的影响是让研究者变得更加开放还是封闭。接触不同的观点和能力,可不断改善科研合作等集体解决问题行动的可能结果,而科研领域持续的引文网络扭曲,将会阻碍知识和思想的传播。另一方面被忽视的研究,不论是由于本身质量差还是由于来自圈外人而被忽略,都意味着人力资源的浪费,尤其是对于处于发展中的新兴国家更是如此。从这个视角来看,伴随着中国经济总量和科研投入的增加,引文网络的扭曲程度也显著增加(虽然这两者之间的因果关系无法论证),这一方面印证了中国科研实力的增加及精英科学家的持续涌现,另一方面却更加值得研究者警惕。一个可能的干预方案是“引导性透镜”,即相关主题的论文推荐,这可以让研究者接触相关主题的研究。通过推荐后的点击数据,还可以进一步研究发现是哪些因素导致了引文网络的扭曲,例如是否是遣词造句的风格差异导致了不成比例的引用,或是对年轻研究者的忽视造成了引文网络的扭曲。