影响因子是有明显漏洞的机制,为何还有那么多聪明人崇拜它?
原文以Deciphering impact factors为标题
发布在2003年8月的《自然-神经科学》上
在五年前《自然-神经科学》期刊发行后不久,我们就发表了一篇社论文章来提醒大家期刊的影响因子(IF)会遭到误用。鉴于该期刊现已发展得相当成熟,我们决定进一步探究期刊影响因子高意味着什么。我们的研究结果表明需谨慎解读这项被滥用的衡量指标。
我们观察了《自然-神经科学》(2002年影响因子14.857)中论文被引次数的分布,然后将其和《自然》(总体影响因子30.432)、《神经科学杂志》(影响因子8.045)、《大脑研究》(影响因子2.409)中选取的神经科学类论文的被引次数分布进行同期比较。
最明显的特征是它们都呈偏态分布(见图1),中位数都比平均数低,进一步说明了将影响因子(算术平均数)作为期刊中任一篇论文被引次数的预测性指标是没什么意义的。
图1
四大期刊论文的累积被引次数。
数据来源于ISI Web of Science
尽管上述分布有所重叠,但是它们在进行非参数检验时差异非常大。不出所料的是,各分布中的峰值移动方向都系统性地和整体的影响因子保持一致,例如,在《自然》中被引次数处于中位数的论文相对《自然-神经科学》来说就处于第68个百分位,相对《大脑研究》处于第99个百分位。
高影响因子的期刊最显著的特点是长尾分布,也就是说有相对少的论文被显著地、大量地引用,它们对影响因子产生不成比例的贡献,由此推知,对这些期刊的整体声望也产生不成比例的贡献。而在分布的另一端,低影响因子的期刊则发表了更多被引次数少的论文。
当然,被引次数并不是衡量一篇论文重要性的最佳标准,尤其是因为引用率会随研究主题的不同而变化。比如,比起皮质生理学,阿尔茨海默症相关的论文更吸引他人引用。上述分布差异可能和研究主题有一定的关系,但这不太可能是唯一的影响因素,因为四大期刊基本涵盖了神经科学的方方面面。
综合考虑到它们重叠的部分和相去甚远的影响因子,这些期刊算是一个体现了文献中的“垂直分层”现象的合理案例。从这些数据似乎可以得出这么一个结论,尽管这些期刊之间有重叠的部分,但影响因子最高的期刊似乎充满了引用经典,发表的低引用率论文明显更少。
可能会有人认为,论文被引次数高和学术质量关系不大,只不过是由于它发表在顶尖期刊上更容易引人注意。这种观点过于极端,期刊的论文筛选机制不太可能是完全随机的,但论文的引用也不大可能完全不看其来源。
的确,知名度高的期刊存在的主要目的是吸引人们关注重要论文,如果期刊不影响论文的引用,那么人们可能就要质疑期刊体系的衡量作用和存在的意义了。
作为编辑,我们相信(尽管没办法证明)事实介于二者之间,并且期刊体系的作用就是扩大细微的差异性;也就是说,我们选择发表会被广泛引用的高质量论文,然后这些论文由于拥有了更多的读者而进一步被引用。
反馈循环的作用也不容小觑。近期基于引用错误滋长而做的一项估计表明,大约80%的参考文献是直接从他人论文的参考文献列表中转过来的,而非查阅了原始文献。鉴于这项发现,我们很难不去怀疑很多作者是否真的阅读了他们引用的所有论文,还是只引用了在他人参考文献中出现频次较高的那些论文。
而在整体文献中被引次数的分布的确符合上面提到的这种模式。在35年前的一篇经典文章中,社会学家Robert Merton指出,科学也逃脱不了所谓的马太效应,即强者愈强(“凡有的,还要加倍给他……”)。在目前一味追求量化和排名的风气下,Merton的言论一如既往地切合时宜。
解读恰当得话,引用数据对评估期刊、论文、作者、甚至是编辑来说都是一个有价值的工具。但是再有价值充其量也不过是一个粗糙的工具,如果把复杂的分布简化为平均数来看待的话,那么其大部分价值也就随之消失了。我们不能用期刊影响因子来量化论文的重要性或作者应得的荣誉,我们所处的时代有一点很奇怪,就是那么多精通科学的人竟会如此相信一个有明显漏洞的机制。ⓝ
Nature|doi:10.1038/nn0803-783
点击“阅读原文”阅读英文原文
相关文章
在使用影响因子等量化指标时,应注意其存在的局限性。
版权声明:
本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件Chinapress@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。
© 2017 Macmillan Publishers Limited, part of Springer Nature. All Rights Reserved