破“四唯”能解决中国科技评价的问题症结吗？

清华大学互联网产业研究院 2024-01-07

Editor's Note

本篇文章由清华大学互联网产业研究院兼职研究员刘云教授供稿。

The following article is from 创新学者刘云论坛 Author 刘云

刘云清华大学互联网产业研究院兼职研究员中国科学院大学公共政策与管理学院教授、博导、副院长

近年来，中共中央、国务院和有关部委连续发布了一系列关于改进科技评价、优化科研环境的指导意见，对科技评价问题给予了高度重视。2018 年，中共中央办公厅、国务院办公厅印发《关于优化科研管理提升科研绩效若干措施的通知》，要求针对“唯论文、唯职称、唯学历、唯奖项” （简称“四唯”）问题进行集中清理，同年，中共中央办公厅、国务院办公厅印发《关于深化项目评审、人才评价、机构评估改革的意见》，要求深入推进“三评”改革。2019 年，中共中央办公厅、国务院办公厅印发《关于进一步弘扬科学家精神加强作风和学风建设的意见》，要求在 3 年内取得作风学风的实质性改观。特别是 2020 年初，教育部、科技部联合发布《关于规范高等学校 SCI 论文相关指标使用树立正确评价导向的若干意见》，科技部发布《关于破除科技评价中“唯论文”不良导向的若干措施》，更是将科技评价问题聚焦到“唯论文”及 SCI 指标使用不当的问题上了，引起了社会各界的广泛关注和热议。

实际上，早在 2000 年代初，我国科技评价工作就面临一系列亟待改进的问题，主要表现为：

科技评价分类不明确，用同一评价标准评价不同类型的科技活动，不能客观、真实、准确地反映不同评价对象的实际情况；

评价中存在重形式走过场、重数量轻质量的倾向，评价结果使用不当等，在一定程度上助长了急功近利、浮躁浮夸等不良风气和短期行为；

专家评议制和信誉制度不够完善，重人情拉关系、本位主义等现象在评价活动中时有发生，影响了评价工作的客观性与公正性；

对于"非共识"项目缺乏科学合理的遴选机制，不利于一些创新性的科研立项等。

2003 年，科技部、教育部、中国科院、中国工程院、国家自然科学基金委员会等五部委联合发布《关于改进科学技术评价工作的决定》，强调要实施分类评价，倡导质量第一，克服浮躁、急功近利等短期行为，坚决反对浮夸作风和任何形式的学术不端行为。同年，科技部发布《科学技术评价办法（试行）》，对科技评价程序、专家遴选与回避以及基于分类评价导向的科技计划、项目、机构、人员、成果评价给出了具体指南。这两份文件出台标志与国际接轨的中国科技评价制度初步建立，为改进科技评价工作首次亮出了政策导向和行动指南。

时至今日，科技评价工作中存在的突出问题依然严峻，特别是评价不分类、“唯论文”等问题愈演愈烈，严重影响到我国科技事业的健康发展。那么，科技评价问题的症结到底在哪？“四唯”及 SCI 论文指标使用不当问题的根源是什么？值得我们深刻反思。

首先我们需要了解什么是科技评价？科技评价的功能主要涉及两个方面，一方面是科学共同体包括科研单位为识别科学发现和知识创造优先权、引导科学发展方向、激励科研人员所建立的学术评价机制；另一方面是政府为优化配置公共科技资源、实现国家科技发展战略目标、提高财政科技投入绩效所开展的科技管理的重要手段。与此相适应，实现这两方面功能的科技评价的目的、对象、方法、程序、结果使用等不尽相同。从本质上讲，科技评价是对科学技术活动及其产出和影响的价值进行判断的认识活动，价值判断是科技评价最基本的特征。科技评价方法总体上说有三类：定性、定量和综合评价，美国联邦政府科技管理工作中采取的科技评价方法达 14 种之多，但一直以来都是以同行评议或专家判断作为最基本的主导方法，其他定量评价方法只作为辅助参考。

发表学术论文是科研工作特别是基础研究产出的主要成果形式之一，当然，论文的质量可以反映基础研究人员的学术水平和贡献，但是，不能简单用SCI论文数量、被引次数、高被引论文、影响因子、ESI 排名等文献计量指标代替同行评议来判断论文的质量或个人的学术水平。在宏观层面，采用文献计量指标分析一国科学产出能力、科学前沿发展趋势、学科总体发展水平等具有统计学意义上的合理性，对国家宏观科技政策和管理具有一定的参考意义。但是，在微观层面，文献计量指标无法体现对论文创造性的“价值判断”，因此，不能运用于评价个人的学术水平和贡献，那种“数论文”的评价方式只会误导科研人员片面追求形式化的东西，采取“唯论文”的急功近利的短期行为。现实中，大家误以为期刊影响因子高、论文被引用次数多、论文水平就高，其实，这是对文献计量学的无知，是错误的理解。实际上，关于文献计量指标不能替代同行评议用于评价机构、个人和项目的问题，在《旧金山宣言》（2013）、《莱顿宣言》（2015）、《科学》（2016）以及汤森路透给中国高校的忠告（2017）中都有明确的表述。这次，教育部、科技部联合发布的《意见》对此也做了较清晰的说明，在科技评价中对文献计量指标使用不当或滥用的问题必须要得到清理。

针对科技评价中“四唯”和 SCI 论文指标使用不当的问题，究其原因是多方面的、复杂的，大家在讨论中的观点也是莫衷一是。从科技评价功能涉及的两大主体方面来反思可能会得到一些启发：

一是政府的“指挥棒”是否出了问题。政府各类科技计划和奖励普遍采用科技评价方式来进行财政竞争性经费的分配，对于科研单位和科研人员来说，只有适应政府“指挥棒”的评价要求，才能争取到更多的资源。因此，政府的“指挥棒”对科技工作和科研环境影响很大。尽管现在政府的“指挥棒”正在逐步落实强化分类评价、注重实效、破除“唯论文”不良倾向的评价导向，但是，竞争性的科技、人才计划名目繁多、双一流建设的学科评估也与经费挂钩，导致基层单位和科技人员疲于应付，专家评议某种程度上流于形式，评价的质量和效果很难保证。本人认为，除了改进政府“指挥棒”的评价导向外，如何改革“指挥棒”自身，比如学科综合评估不与经费挂钩或改为类似英国 REF 的科研质量和贡献评估、减少多数人才计划帽子、民口政府科技进步奖可否让位于市场评价机制、国家科技创新基地和中央级科研事业单位采取绩效评估制度予以稳定支持等，让科技回归原本，是优化科技评价环境的根本之道。

二是基层单位是否出了问题。高校、科研机构、医院等基层科研学术单位建立合理的学术治理体系和评价机制至关重要，涉及到每一位科研人员的切身利益，也关系到本单位的学风建设和学术环境。实际上，有不少基层单位的学术治理体系和学术评价机制并不健全或存在严重的缺陷，比如大学的学院很少成立教授会制度，在重要学术治理事项中教授难以发挥作用，缺乏学术民主；有些高校成立跨学院的相关学科群的学部，由跨学院的相关领域专家组成学部学术委员会，担负相关学科职称评审、学术评价等职责，学院一级的学术委员会或被取消或名存实亡，这种跨学科的大同行学术组织实际上无法对科研人员的学术水平和贡献做出实质性的价值评价，只能参考“论文指标”排序或陷入人际关系；由于基层单位科研工作长期以来以争取国家、部门和地方竞争性科研经费为主，上上下下都习惯围着政府的“指挥棒”转，忽视内部的学术治理和评价机制建设，往往采用一套貌似客观、简单易行的“唯论文”打分表来替代同行评议，进行学术评价和奖励， SCI 论文指标成了科研人员业绩考核和奖励的唯一杠杆，而忽视对其代表性成果质量、贡献和影响的价值评价，对从事临床医学、应用技术研发、实验技术、科研条件与平台建设、科技成果转化等工作的科技人员长期缺乏分类评价机制，SCI 论文“英雄”独占鳌头、各类人才计划“赢者通吃”，导致学术生态和人才成长环境出现许多异化和不正常的问题。

当然，国内也有一些科研和学术单位在科技评价导向和机制建设方面做出了有益的探索，比如中科院物理所早在 2000 年代初就开始探索开展国际评估，与国际一流机构对标，采取符合国际惯例的机构和人员评价方式；清华大学较早采取对教师发表高质量代表性论文的国内外同行评价；同济大学采取分类评价的方法，对从事应用研究和科技成果转化产业化的教师采取符合其科研活动特点的评价体系，不“唯论文”，北京航空航天大学学院一级建立教授会制度，扩大学术民主，重大事项发挥教授会的作用，如教师职称评审和推荐，每位教授人手一票，经答辩后投票选举和推荐职称晋升者；等等，上述单位的经验和做法值得借鉴。

破“四唯”、清理 SCI 论文指标不当使用或滥用，不能从一个极端走向另一个极端，现在倡导的“分类评价、同行评价、代表作制度”评价导向不是不需要发表论文，而是要引导科研人员从事原创性研究，不以追求 SCI 论文指标数据为目标，这是符合科研工作规律的。科技评价的本质是价值判断，如果我们的评价体系设计不让评价专家去做独立的价值判断，或评价专家不愿意去做这种价值判断，而让位于无法表达价值判断的 SCI 论文指标来左右科技评价工作，那是中国科技界和学术界的悲哀。此外，改革政府“指挥棒”本身，尽量减少因“指挥”不当带来的负面影响，基层单位充分发扬学术民主、健全合理的学术治理体系和评价机制，是营造良好的科研学术环境、净化学术风气的根本。

/ 往期推荐 /

新冠疫情下对经济发展和制造业复工的几点建议

清华大学互联网产业研究院产业转型顾问委员谈疫情的产业应对

企业生存危机超过以往想象产业复苏疗法亟需把握关键 —《企业生存需求考查报告》之一

产业链承受重压，疫情之中企业生存的困境与反思 —《疫情下企业生存需求考查报告》之二

专访朱岩院长：复工潮下的建筑业应对策略

重大疫情下的物流供应链体系构建

朱岩：抓住机遇破立结合，创造适应数字生产力的生产关系

继续滑动看下一个