影响因子之外
IF 传说
江湖隐隐有流传
秋水文章一数联
从此凡尘掀浊浪
犹听万马啸城边
1. 引子
自然科学学者从事科研工作,所获得的成果,可能会基于如下动机而通过在学术期刊上发表论文的形式公之于众:(1) 与人类分享新的知识、为社会发展做贡献;(2) 得到社会承认而获得成就感;(3) 避免同行重复获取知识、避免财富浪费。因此,将研究成果在公开发行的期刊上发表,应该是传播知识的主要形式。这一点看君应不会质疑。也因此,期刊的高与低、优与劣、有用与无效等,就成为在现代科学技术传播中所起作用之重要指针。
有鉴于此,科学技术通过一大波期刊的集成,渐渐成为一大“产业”、一大具有极高知识集中度的“产业”。这种趋势是好事还是坏事,笔者不加评判,也以为自己没有能力去评判。但笔者作为科学技术“产业”中之一员,与千千万万同行一般,对科技期刊的作用和评估有自己的看法。也因为如此,这一硕大“产业”也渐渐形成了自己的评估体系和评价标准,最主要和最直接的就是基于 SCI 数据库发布的期刊影响因子 IF (impact factor)。
图1. 科技成果的实际影响因子计算方法 (more joking than true)。
https://medium.com/@stelios.serghiou/impact-factor-and-other-measures-of-science-a-basic-guide-for-every-scientist-935acee2bc36
谈论学术期刊的 IF,乃敏感话题,一万张嘴有一万套说辞。例如,图 1 所示即为一位学者自己定义的自身学术价值 (个人学术影响因子)。引用于此,并不表示笔者赞同这一定义,而是显示有很多人关注于此。一般人,如果不是心理素质深厚、不是承受能力强大,大概不敢试水于此。君不见,每每到了一年的六月底,神州大地上,不,现在已经是寰宇大地之上,多维情绪在蠢蠢欲动。待到 IF 数据发布,乃是几家欢乐几家愁、几幕抚琴几幕静。
笔者前几天不知道是喝了几杯闷酒、抑或是灵光乍现,突然想起来要对这个问题班门弄斧一番,便有了这篇简短文字,以供读者茶余饭后消遣一二。
2. IF 的影子
果不其然,2020 年的 IF 清单并未被新冠感染,仍然如期发布。笔者没有预料到的是全世界学术期刊竟然达到 13000 余种,当然这些还只是被 SCIE 索引的。其它各种尚未被索引的各国内部期刊,估计更是不计其数。学术界流行一句话:publish or perish,但未必有那么惨烈。这么多期刊,总可以找到发表的地方。那些 perished 的研究结果,要么是没时间写成稿子,就如汤姆逊爵士将电磁学研究成果锁在抽屉、等学生麦克斯韦去整理发表;要么是成稿了,或由于学者的各种心结,或攀“龙”附“凤”不成而被搁置。笔者也有多篇这样的书稿。
那什么样的期刊才算是一个好的期刊呢?可能每个人心中的答案是不太一样的,除了传统经典期刊长久以来积累的口碑,除了一本期刊在人们心目中的惯性地位,很多人可能主要依赖期刊的影响因子 IF。关于 IF 指标本身的闲言碎语如滔滔江河、前浪后浪,任凭风雨无度,都归之沧海。这里,笔者倒是看到了 IF 若干于无声处之可疑形迹。
首先,任何 SCIE 期刊,JCR 都公布了期刊的几个重要指标,包括:即时影响因子 IF (最近两年的引用)、引用半衰期、五年平均影响因子、自引率四个指标。这些指标都是 IF 云游于学术江湖中的足迹。
随手画几张图,就发现这些足迹很值得玩味。
3. 唯成分论
首先,来看这 13000 多种期刊影响因子的整体状况,即借助即时影响因子来分类评估这一“产业”的概貌,结果如图 2 所示。
整体数据基本符合对数正态分布,如图2 (上) 所示,说明低影响因子的期刊数量占据主导地位:
(1) 有一半多 (约 6500 种) 期刊影响因子 IF 不到 2;
(2) 影响因子 IF > 5 的期刊归类于 top 10 % 期刊;
(3) 影响因子 IF > 16 的期刊归类于 top 1 % 期刊;
(4) 影响因子 IF > 44 的期刊,属于 top 0.1 % 期刊。
当然,这是将所有学科领域期刊放在一起比较的概貌。如果要分门别科来划分阶级,某个特定领域的期刊排名会有一定区别。
图2. 期刊数目与影响因子的累积分布曲线。上:横坐标取对数形式,说明基本符合对数正态分布。下:纵坐标(期刊数目归一化) f 取对数形式。
当然,一般情况下,漂亮的对数分布可以在对数坐标下表现出出漂亮的直线标度转变。将图 2 (上) 的纵坐标归一化后换成对数,很容易得到漂亮的线性标度关系,如图 2 (下) 所示。累积分布曲线明显包括两个线性区间 (如两条蓝色线所示):左侧区间斜率 m 较大,说明这个区间的期刊如果影响因子稍微变化,其排名会剧烈震荡,就像高考分数一般。而右侧区间斜率 m 较小,说明这个区间的期刊影响因子变化对排名影响不大。两个区间的分界大约在影响因子为 9 左右 (8 – 16 之间)。
我们这些论文发表的奴隶们心中自有一杆秤,那些 IF 在 9 以上的期刊,品质普遍较高,应属合理,虽然笔者无意绝对化这一边界。
请注意:国内期刊大多处在左侧区间。
图3. 期刊被引用半衰期与影响因子的关系图,上轮廓呈明显的负相关性。经典期刊分界点由实心红点定义。
4. 不唯成分论
自然,尺有所长、寸有所短,影响因子 IF 的高低反映了期刊文章的热度,大家都想红红火火一直持续下去。然而万物生命皆有周期,所以《三国》开篇即讲“天下大势,分久必合、合久必分”,这是命数。中国还有句老话“好景不长”,亦如此。
学术界经常有一些“经典”文章,并不是发表在这些 IF 火热的期刊上,但是却广为传唱、经久不衰。所以,JCR 同时发布了期刊另一指标,即“被引用半衰期”,反映了该期刊上文章影响力的时间跨度。图 3 展示的是被引用半衰期与影响因子 IF 的关系,上限轮廓呈明显的负相关特性——说明高热点话题都是有寿命的,周期一般不长于 10 年。而不少发表在普通期刊上的论文其影响力更持久。这也正是传统经典期刊的影响力所在。
假设以 18 年为一代学者的旺盛学术生命周期,分析数据可见,那些火热期刊往往热不过一代人 (这句话怎么这么耳熟)。被引用半衰期超过 18 年的期刊/文章,则可理解为经典期刊 / 文章。
笔者另外一个得意但却为此忐忑不安的结论是:从图 3 看出,几乎所有经典期刊的影响因子 IF 都不超过 10 !
图4. 期刊影响力随时间的变化:即时影响因子 IF 与五年平均影响因子的对比。
5. 姜是老的辣?
学术界看期刊的品质数据,当然首推或者只看即时影响因子 IF。这一数据只计较期刊过去两年内刊发的文章影响,两年前的文章就对期刊的 IF 没有价值了,也就是说过了这个村就没有那个店啦。很显然,这种量度很好地体现了学术界急躁和追求短平快功利的思维。事实上,好的研究成果往往是“真金不怕火炼”或者是“姜还是老的辣”。看君不信,且来分析一番。
为了更定量评价期刊短期和长期影响力的区别,可以用即时影响因子 IF 减去五年平均影响因子,结果如图 4 (上部) 所示。令人吃惊的是,竟然绝大部分期刊的学术影响体现了“愈久弥香”的风骨,即五年后影响力增加 (横坐标为负值的区域) 的期刊占到了总数的 2 / 3。数据显示,整体累积分布曲线基本符合正态分布行为,中位数略小于 0,说明大部分期刊学术寿命大于五年。
图 4 (下部) 绘制了“即时影响因子IF减去五年平均影响因子之差”与期刊即时影响因子 IF 的关系:可以看到,这两者之间没有明显依赖关系。高影响因子 IF 期刊的五年平均影响因子增加和降低的占比大约二一分成,又从一个侧面反映出即时影响因子 IF 作为一个统计样本参数亦有其合理性。
图5. 期刊自引率与影响因子的关系。(a) 线性坐标,上轮廓呈明显负相关性。(b) x轴取对数坐标,可以发现绝大部分期刊自引率在 30 % 以下。(c) 期刊自引率累积分布曲线,基本符合对数正态分布规律。
6. 人为干预
很显然,人类最大的问题便是会提出一些“人定胜天”之道。学术刊物有了 IF,就马上有了针对 IF 定义式操刀作秀的创新思路,其中之一便是刊物自引。
为了衡量这一“道”,JCR 引入了“自引率”这一参数,经常用来评价一本期刊的质量。对于一些“水刊”,通常自引率偏高,迎来一方唏嘘。不过,话说回来,谁规定自己不能引用自己的文章呢。因此,自引率是一个有点“悖论”性质的问题。很多开山鼻祖从来就很少引用他人的文章,故而自引率很高,但这并不影响其地位和贡献。在那些科技革命的高潮时代,这种悖论显得更为明显。不过,当下这个时代,学术界更多是在积累量变到质变的阶段,自引太高多数乃人为干预所致。
为了分析这一课题,不妨将相关大数据作图以表明笔者的看法:
(1) 图 5 (a) 的大数据统计结果表明,整体来看影响因子 IF 越高的刊物自引率越低。这表明,正所谓“一个好汉三个帮”,单靠自引是不能搞大事的。
(2) 如果将横坐标取对数,如图 5 (b) 所示,将数据点标识变小,可以更容易看清楚数据点的分布密度。您会看到,绝大部分期刊的自引率都在 30 % 以下。自引率高于 50 % 的期刊,影响因子都低于 3,说明自引干预是不能制造高影响因子期刊的。
(3) 图 5 (c) 所示的累积分布曲线表明,自引率小于 10 % 的期刊有 7000 多种,占到了总量的 60 % 左右。这一数据展示整个学术出版界主流处在良性区域,认为操作自引方式提高影响因子 IF 只是小众。
7. 絮语
众所周知,学术文章发表在哪个期刊,不只是由文章的科学价值决定的,更有很多运气和其它因素,包括语言是否流畅、图片是否美观等。这些非科学因素在当今学术界的论文发表过程中起的作用越来越大。我们经常听说某团队花几千块钱画了一个漂亮的“示意图”,又花几万块钱争取到了某期刊的封面机会。这些都是花絮,展示学术出版的人性使然和丰富多彩之面貌,也说明科学与艺术并不是孤立存在的。
本文涉及的一些初步讨论,只是作为普通学术界一份子的非专业思考,并无任何专业结论。即时影响因子不是评价期刊的唯一标准,更不应是评价某篇文章价值的标准。真金不怕火炼,成果的真正价值需要时间检验。
最后,需要再声明:本文纯粹茶余饭后娱乐所为,不针对任何特定期刊做评价。如果数据背后隐含了科学研究过程中的某些规律,期待与各位同行共同探讨。
备注:
(1) 本文作者王军强,中科院宁波材料研究所研究员。2019 年获国家优秀青年基金,主要研究非晶合金的新材料、物理化学功能特性及相关应用。团队主页:http://non-crystal.nimte.ac.cn/。
(2) 题头小诗乃描绘学术影响因子 IF 是如何在学术江湖中兴风作浪的。“一数”即 IF 的数字表达。
(3) 封面图片来自 https://www.x-mol.com/paper/715166。
精选文章