查看原文
其他

为何中国学者和媒体对影响因子公式的表述普遍错误?

穆蕴秋 江晓原 中国出版网 2021-01-27


国内对“影响因子”计算公式的陈述普遍错误


国内很多人对所谓的期刊“影响因子”盲目崇拜,笔者在《期刊“影响因子”究竟是什么人发布的?——SCI和“影响因子”的商业性质》一文中,揭示了“影响因子”背后的私人商业性质。而随着最近汤森路透决定将SCI和“影响因子”业务转卖的新闻在国内传播开来,这一性质进一步得到了确认,并引起了学术界广泛的关注。


但是另一个严重的问题是:长期以来,国内学者和媒体对“影响因子”计算公式的理解普遍是错误的。


例如,目前从百度上搜索对这个公式的表述,包括“百度百科”中的表述,几乎全是错的。更多的例子表明,在这一轮对“影响因子”新的关注中,上述错误仍然保持不变,这里姑举两例:


2016年6月20日《解放日报》在题为“《细胞研究》跻身国际一流期刊”的报道中说:“影响因子是目前国际上通行的一项客观的期刊评价指标,即期刊前两年发表的论文在统计当年被引用的总次数除以该期刊在前两年内发表的论文总数。”


2016年7月12日《光明日报》发表严蔚刚题为“科研评价应遵循什么基本原则——A类期刊与莱顿宣言、旧金山宣言的对话”的文章,谈到“影响因子”时作者说:“期刊影响因子是20世纪50年代由汤森路透公司开发出来的……含义是某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。”


不难看出,上面两例中对“影响因子”定义的理解同出一源。而据《解放日报》记者告知,这个定义“是中科院的专家告诉我们的”。


严文中还有另一个小错误,这里先顺便指出:“期刊影响因子是20世纪50年代由汤森路透公司开发出来的”这个说法不确,事实上,开发了SCI和“影响因子”报告业务的“科学情报研究所”(ISI)直到1992年才被汤森路透收购到旗下。


“影响因子”计算公式的正确含义


其实“影响因子”计算公式每年都会在ISI发布的《期刊引证报告》(JCR报告)上被表述一遍,但国内许多学者和媒体在表述这个公式时,却不依据原始文本,而是满足于人云亦云的引述。


影响因子计算公式的准确表述,当然应该以ISI每年发布的JCR报告上的文本为准,是这样的:


一份期刊前两年中发表的“源刊文本”在当年度的总被引用数,除以该期刊在前两年所发表的“引用项”文章总篇数,即为该期刊当年度的影响因子数值。


用分数式来表达是这样:


期刊N年度的影响因子=




按照ISI给出的定义,期刊的所谓“源刊文本”(source items),指的是该SCI期刊发表的所有文本,而“源刊文本”又被区分为“引用项”(citable items)和“非引用项”(uncitable items)两类,在通常情况下,“引用项”对应着学术文本,“非引用项”对应着非学术文本。


注意在上面的分数式中,分子部分的统计对象,是期刊上所有文本——包括“引用项”和“非引用项”——所产生的引用次数;而分母部分的统计对象,却只包括“引用项”的文章篇数。


对于长期习惯于在学术期刊上只刊登学术文本的中国人来说,将“源刊文本”区分成“引用项”和“非引用项”有什么意义吗?在我们习惯的观念中,一本学术期刊的“源刊文本”数就是它的“引用项”数。所以对绝大多数未曾深究过“影响因子”的人来说(包括许多科学家),“百度”和上引权威报刊文章中对“影响因子”公式的错误理解,实在是非常自然的。


著名“国际顶级科学期刊”的两栖化特征


但是对于国外的许多期刊而言,“引用项”和“非引用项”的区分,却是意义重大的事情。我们不妨以长期被中国科学界顶礼膜拜的《自然》(Nature)杂志为例:


Nature杂志目前共有18个栏目,被认定为“引用项”的仅有3个栏目:属于原创研究的“论文”(article)和“通信”(letter),以及“综述评论”(review)。“通信”是对原始科研成果的初步通报,“论文”是对一项研究工作更全面的介绍。“综述评论”通常是对某一领域研究现状或历史的述评。而其余15个栏目的文章全都属于“非引用项”即非学术文本:消息和评论(News and Comment)、读者来信(Correspondence)、讣告(Obituaries)、观点(Opinion)、书籍和艺术(Books & Arts)、未来(Futures)、书评(Book Reviews)、消息和观点(News & Views)、洞见(Insights)、评论和视野(Reviews and Perspectives)、分析(Analysis)、假想(Hypothesis)、招聘(Careers)、技术特征(Technology Features)、瞭望(Outlooks)。


上面这种区分,是ISI公司1995年经过调整后确立的准则,此后沿用至今。


科学期刊的这种“两栖化”,并非Nature杂志所独有。翻开“影响因子”排名前20的杂志,这种情形比比皆是:以2015年的数据为例,比如《自然》(影响因子38.1)、《科学》(Science,影响因子34.7)、《柳叶刀》(Lancet,影响因子44.0)、《美国医学会杂志》(Journal of the American Medical Association,影响因子37.7)、《新英格兰医学杂志》(New England Journal of Medicine,影响因子59.6)……


查阅汤森路透近年的JCR报告数据,Nature杂志这些栏目中文章篇数的比例,大致是如下情况:它的学术文本目前占到约三分之一(这个比例在历史上曾有过大幅变动)。在这些“影响因子”游戏的顶级玩家中,Nature杂志相对已经要算是最“规矩”的了,《柳叶刀》和《新英格兰医学杂志》的学术论文篇数只占杂志文章总篇数的约四分之一到五分之一。


非学术文本贡献的SCI引用


在“影响因子”的正确计算公式中,分子部分包括了该期刊上前两年所刊登的全部文本在当年度所产生的全部引用。


这就是说,对于Nature、Science、《柳叶刀》这类两栖杂志而言,占据杂志大部分篇数的非学术文本所产生的所有引用,都会被计入影响因子计算公式的分子值中。


这首先会产生一个问题:Nature、Science、《柳叶刀》这类杂志上的非学术文本,会产生SCI引用吗?答案竟是肯定的。


学者海内伯格(P. Heneberg)选择了11家知名期刊:Nature、《自然医学》(Nature Medicine)、《自然免疫学》(Nature Immunology)、Science、《科学信号》(Science Signaling)、《细胞》(Cell)、《细胞代谢》(Cell Metabolism)、《细胞干细胞》(Cell Stem Cell)、《新英格兰医学杂志》、《美国医学会杂志》、《柳叶刀》,测算了这些期刊2009年发表的各栏目文章在当年度(2009)和接下去两年(2010和2011年)的被引用情况。结果表明:


这些期刊上的非学术文本发表后,会产生数量显著的有效引用,这些引用都会被计入“影响因子”公式的分子值,而且发表后第二和第三年度——正是“影响因子”公式中统计引用的时间——产生的有效引用要远高于发表当年的引用。


而学者莫伊德(H. F. Moed)等人考察了1988年的320份SCI期刊,将“非引用项”的引用次数从影响因子算式分子中完全排除,对“引用项”(文章、评论和技术通信)的影响因子进行单独计算,结果同样表明,期刊上“非引用项”栏目的文章,对影响因子有着很大贡献。文章着重列出10家著名期刊的数据,其“非引用项”对影响因子贡献比值在6%~50%之间(参见表1)——其中Nature为11%,《柳叶刀》竟高达50%。




简短的结论


如前所述,国内对影响因子计算公式的表述普遍错误。许多对“影响因子”顶礼膜拜的人士其实连膜拜对象是什么都没搞清楚,而造成这种普遍错误的根本原因,则是因为在中国几乎不存在两栖化的期刊,所以影响因子计算公式的表述者们,都想当然地将分母中的“引用项”数等同于分子中的“源刊文本”数。也就是说,对于中国杂志而言,如果是学术杂志,那在绝大部分情况下,它的全部文本都是“引用项”,所以“源刊文本”数就等于“引用项”数;而如果它不是学术杂志,那它的“引用项”数就是零,因而也就不可能加入“影响因子”游戏了。


中国改革开放已逾30年,许多国外杂志出版了中文版,中国学者在图书馆或网上阅读国外杂志也越来越容易了,按常理来说,中国的读者、中国的杂志编辑或出版人,应该不难注意到上述“国际顶级科学期刊”的两栖色彩,为什么未见中国杂志起而仿效呢?


笔者曾对2000年以来被SCI收录的中国科学期刊中“影响因子”前20位的刊物作了初步考察,发现这些期刊全部是以发表原创研究论文为主的论文类期刊。我们估计,即使对目前被SCI收录的中国科学期刊全部考察一遍,结果也是基本相同的——事实上,中国目前几乎不存在Nature、Science、《柳叶刀》这种类型的两栖杂志。


(作者单位:上海交通大学科学史与科学文化研究院,来源:《出版发行研究》2016年第9期)




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存