日本说中国高引用论文超过美国,怎么回事? | 科技袁人
导言:
高被引论文不是单纯的比数量,而是在保证高质量的前提下比数量。如果有人还要嘟嘟囔囔一些老生常谈,如“中国的论文都是灌水的”,那只能说他连高被引论文这个词是什么意思都没有理解,处于没有脑子的复读机的状态。
最近,有一则消息引起了关注和不解:中国在高引用论文的数量上超过美国,成为世界第一。这个消息来自日本文部科学省8月初发布的《科学技术指标2022》(https://news.ifeng.com/c/8INEiqQgT2Z),然后《Science》也为此发表了一篇报道(中国首次超越美国登顶科研影响力榜首)。
这个新闻引起关注是理所当然的,因为所有人都会关心世界各国尤其是中美两国的科技实力对比。它引起不解也是理所当然的,因为它似乎来得太快了。我以前多次介绍过科学文献计量学指标(从2020年最新定量指标看中国的科技实力 | 袁岚峰),如自然指数、研究前沿指数、高引用研究者等等,一般的结果都是美国第一,中国第二,中国在快速追赶美国。在一些指标上,如发表论文数,中国已经超过了美国。不过人们很容易说,这种指标重量不重质。如果要看质量,比如说高引用的论文数,中国就排在美国后面了。
这种格局我已经很熟悉了。没想到日本直接抛出一个中国成为第一的指标,而且这不是个无关紧要的指标或者重量不重质的指标,而是个核心的质量指标,这就很让人吃惊了。究竟发生了什么?其实首当其冲的问题是,日本这个报告对指标的定义是什么?数据来源是什么?
实际上,日本这个报告说的是,由于各年的数据波动巨大,取三年的平均,这次的统计时间窗口是2018年至2020年,把这三年的平均值称为2019年数据。首先来看顶尖论文,即各个领域被引用次数排名前1%的论文。在这三年的平均中,中国的顶尖论文有4744篇,占全世界的27.2%,超过了美国的4330篇和24.9%,更高于第三名英国的5.5%。再来看引用前10%的论文,中国也处于第一,占全世界的26.6%,超过美国的21.1%。相对于去年的数据24.8%和22.9%,中国的领先优势正在扩大。至于总的论文数,中国早就是世界第一,而且领先得越来越多。在这次的报告中是407181篇对美国的293434篇,多了10万篇,拉大了去年的报告中8万篇的差距。
日本的数据来源是什么?它自称是来自科技情报公司科睿唯安(Clarivate)的数据。科睿唯安我们很熟悉,就是提供Web of Science等著名科学文献数据库的那个公司。然而直接去查Web of Science就会发现,定性结果不对:2018年至2020年,美国的SCI论文总数是178.6万篇,高被引论文(即过去10年中发表的论文,被引频次在同年同学科发表的论文中进入全球前1%)是22000篇,热点论文(即过去2年中所发表的论文,在最近两个月中其被引频次排在同年同学科前0.1%的论文)是578篇,而中国的这三个数据是152.5万篇、20079篇和469篇。每一个都跟美国很接近,但每一个都比美国低一些。所以,日本是怎么得出中国高于美国的结论的?
通过朋友介绍,我联系到了科睿唯安的一位工作人员,她也是我的一位热情粉丝。她告诉我,日本这项调查是基于自然科学领域的论文进行统计的,在标准化产品Web of Science和InCites中不能复现。前者可以查自然科学领域的各国总论文数、被引前1%论文数,但不能查被引前10%。后者被引前1%和10%都可以查,但不能单独查自然科学,只能把自然科学和社会人文放在一起查(即SCI加上SSCI和AHCI)。因此,日本文部省应该是调用了Web of Science的底层数据,做了个性化统计。
听了她的介绍,我有些理解了。日本可能是定义了一套特别的标准,如只挑选了某些学科,或调整了时间点,按照这样的标准统计出来中国变得高于美国了。他们这样做的目的是什么,就可以自由理解了。可能是制造中美竞争的气氛,可能是制造焦虑感。因为无论以什么标准来排,日本都远远排在中美后面。在他们这个报告中,日本前1%引用的论文数只排在第12位,甚至低于韩国,比十年前的第六位大幅下降。如果站在日本人的角度上,不忧心忡忡是不可能的。
前面说的都是2018年至2020年的三年平均,如果看2021年的数据会怎么样呢?Web of Science显示,在2021年,中国的SCI论文有70万篇,高被引论文有9080篇,热点论文有931篇,美国的相应数据分别是63万篇、7332篇和938篇。在2021年,中国的高被引论文确实就比美国高了!由此可见,无论用什么样的统计,得到的都会是同样的趋势,不同的算法只是把中国超越美国的时间提前或者推迟几年。
最后,关于这些数据的意义,我想任何有思考的人都应该能认识到,高被引论文不是单纯的比数量,而是在保证高质量的前提下比数量。如果有人还要嘟嘟囔囔一些老生常谈,如“中国的论文都是灌水的”,那只能说他连高被引论文这个词是什么意思都没有理解,处于没有脑子的复读机的状态。
我以前在介绍科技指标的时候,就写过很多答客问,早已预见到并且回答了这种问题。任何人如果认真研究了这些数据,思考了这些问题,就能明白什么叫做世界大势。
从2020年最新定量指标看中国的科技实力 | 袁岚峰日本说中国高引用论文超越美国,这是怎么回事?| 袁岚峰
科普事业发展壮大,需要三个环境 | 科技袁人科普有多重要?国家有哪些支持?这篇文章都说清楚了 | 袁岚峰
科普需跟一线研究人员接触,传出正确内容 | 袁岚峰
当和尚都需要职业上升通道,何况科普?| 科技袁人
科普的价值,比乍看起来大得多 | 科技袁人
关注风云之声 提升思维层次