刘海峰：我看第四轮学科评估

Original 刘海峰科举学与考试研究 2023-12-16

刘海峰：我看第四轮学科评估

刘海峰

从2016年4月启动申报，全国第四轮学科评估前后历时一年八个月，到2017年底千呼万唤始出来，12月28日结果公布，立即成为全国高等教育界关注的焦点。

由于之前风传第四轮学科评估结果将与“双一流”建设挂钩，涉及高校和学科的直接利益和资源分配，因此第四轮评估参与的学科远远多于前三届一级学科排名。第四轮评估参评单位和学科数量创历史新高，本轮评估在95个一级学科范围内开展（不含军事学门类等16个学科），共有513个单位的7449个学科参评，比第三轮增长76%，全国高校具有博士学位授予权的学科有94%申请参评。

虽说学科评估是教育部学位与研究生教育发展中心以第三方方式开展的非行政性、服务性评估项目，但这是目前中国最具官方色彩的学科评估，也是最具权威性的学科评估，因此绝大多数招收研究生高校不敢不重视。评估结果一发布，便引起相关高校和教师的高度关切。一些评估结果理想的院校欢天喜地，一些评估结果不理想的院校则进行认真分析，深刻反思。

与过去三次学科评估最大的不同点是，第四轮评估结果按“分档”方式呈现，具体方法是按“学科整体水平得分”的位次百分位，将前70%的学科分9档公布：前2%（或前2名）为A+，2%～5%为A（不含2%，下同），5%～10%为A-，10%～20%为B+，20%～30%为B，30%～40%为B-，40%～50%为C+，50%～60%为C，60%～70%为C-。

学位中心认为，学科评估的主要目的不是要排出名次，而是通过评估发现学科建设的优势和不足，促进学科内涵发展。通过公布学科分数，的确可以评出高校水平的高低，但其实很多院校的实力差别不是一两分能够表现和区别的。过度关注分数，会导致评估的“指挥棒”导向出现方向性失误。经过权衡和比较，第四轮学科评估摒弃以往结果发布方式，也进一步创新了评估理念，评估结果不再公布分数，也不公布名次；而是采用按百分位进行分档的方式公布结果，不强调单位间精细分数差异和名次前后。

不过，分档次和按分数公布应该说各有好处。按具体分数公布类似于考试成绩中的原始分，分档次公布类似于考试成绩的标准分，或者说是类似于上海浙江高考试点选考科目分等级的标准分。百分制的原始分与标准分各有优劣。原始分更为精准具体，标准分是一种由原始分推导出来的相对地位量数，它是用来说明原始分在所属的那批分数中的相对位置，在参与人数不同的组别间更具可比性。

分档呈现评估结果是有不少好处，只是有些同一学科不同学校之间巨大的差距被档次掩盖了。例如，据我所知，有的学科第1名和第2名之间的实际差距比第三次学科排名拉得更大了，但这次都获得A+，显现出来的水平却反而是相同了。

不同学科参评数量的多少，在原始分的情况下对同一所高校的实际得分没有影响。采用分档呈现，不同学科参评数量的多少，对有的学校所获等级影响很大。例如，某一学科参评高校是100所，获得A-以上的高校便是10所。如果参评高校是110所，那么得分排名第11的高校也就变成A-；如果参评高校只有90所，那么原来处于A-的高校中有1所就必然掉到B+,而其实际水平和实力其实没有任何不同，但A-和B+却是有巨大不同的两个档次。还有，实际得分第11名与第20名的高校中都处于10%～20%位次，都获得B+，其实是有不少差距的，但一般人都无法了解。

从理论上说，在考试成绩的呈现方式中，标准分更为科学。中国高考在20世纪90年代后期曾经有8个省市实行标准分，但后来除了海南省，其他省市都纷纷放弃了。也正是因为原始分有简明客观、个别分数调整不影响整体排位变动、高校对生源水平能够进行比较等不少好处，所以绝大多数省份还是择善而从，目前还是坚持用原始分。

第四轮学科评估分档呈现确实有不少好处，只是也有一定的局限性。国际上多数大学排行榜和学科排名都公布具体名次和分数，将来我国的学科评估呈现方式如何进一步完善，还可认真研究加以改进。

另外，本轮评估比过去相对更重视师资的规模，对本学科专任教师总数设置“上限”，超过“上限”均为满分。同一学科规模大的往往获得满分或高分，这轮评估的专任教师排名方法对规模不大、队伍比较精干的单位不利。有的学校规模大的学科，在第四轮评估期限内并没有多少标志性的成果或高显示度的奖项，也没有什么高层次人才，在软科的“中国最好学科排名”采用刚性的高层次指标排名中较为靠后，但在第四轮学科评估中却相当靠前，两者形成强烈的反差，反映出两种评估不同的旨趣。当然，第四轮学科评估更重视研究生培养，将“人才培养质量”放在首位，这是软科的学科排名中基本上没有的方面。

（原刊《中国科学报》2018年1月30日第5版“海峰随笔”专栏）

编辑、排版：韦骅峰

审核：李木洲

更多精彩阅读：

6.研究生必读 || 文字与健康：不要让导师折寿

继续滑动看下一个