【专题企划：研究生培养改革】王传毅：“申请考核”制入学的博士生培养质量更高吗？——基于“研究生满意度调查”

Original 王传毅，等高校教育管理 2022-04-24

作者简介

王传毅，副教授，管理学博士，从事研究生教育、教育政策、高等教育评价研究。

李福林，博士研究生，从事研究生教育、高等教育政策研究。

引用本文

王传毅，李福林，程哲.“申请考核”制入学的博士生培养质量更高吗？——基于“研究生满意度调查”[J].高校教育管理,2021,15(1):18-28.

摘要

深化博士生考试招生制度改革是保障博士生培养质量的重要前提。本研究采用“研究生满意度调查”数据，实证考察了“申请考核”制与博士生培养质量的关联性。研究结果表明：“申请考核”制入学的博士生在学期间学术能力与通用能力提升更高，在运用倾向得分匹配消除了样本自选择问题后，结论依然成立；个体努力程度在申请考核生的学术能力与通用能力提升方面起到了部分中介作用，即“申请考核”制不仅挑选出更加具有学术能力和通用能力潜质的申请人，也挑选出更加努力的申请人。为此，我国应充分发挥“申请考核”制在选拔高素质博士生过程中的重要作用，提高“申请考核”制的内部信度，探索建立申请材料结构化数据的核验与评分系统。

关键词

博士生；“申请考核”制；学术能力；通用能力；培养质量

一、引言

研究生教育是一国竞争力和创新力的基石。在2020年7月召开的全国研究生教育会议上，习近平总书记对研究生教育作出重要指示强调，“研究生教育在培养创新人才、提高创新能力、服务经济社会发展、推进国家治理体系和治理能力现代化方面具有重要作用”。博士生教育是教育体系“皇冠上的明珠”，直接关系到国家创新能力的提升和创新潜力的释放，对我国经济社会转型发展具有至关重要的作用。2020年9月，教育部、国家发展改革委、财政部发布的《关于加快新时代研究生教育改革发展的意见》指出，要“健全博士研究生‘申请考核’招生选拔机制”。“申请考核”制是近年来中国部分高校参考国际上通行的“申请入学制”所实施的扎根本土、选拔高层次人才的博士招生制度。该制度是由博士申请人提交真实的学习、科研等方面的材料，证明其学术能力、创新潜质以及综合素质，由培养单位组织专家委员会依据材料进行综合评价，以面试为主的招考方式。

2007年，北京大学和复旦大学试点博士生“申请考核”制，截止到2020年5月，至少有131所“双一流”建设高校已经开始全面或部分实行“申请考核”制，占比超过93%；其中，42所一流大学建设高校均已开始推行“申请考核”制。“申请考核”制已成为我国高校选拔博士生人才的重要手段。有研究者认为，“申请考核”制优于传统考试制，实施博士生入学“申请考核”制可以打破“一考定终身”的制度惯性，有利于科研能力强、综合素质高的考生脱颖而出。亦有研究者持保留态度，认为通过“申请考核”制入学的博士生（以下简称“申请考核生”）与普通招考博士生（“普博生”）在科研产出、学术激情方面并无显著差异；在学业表现和科研成果方面，差异极小或表现并不突出。针对不同招考方式科学性的讨论虽不绝于耳，却鲜有基于大规模调查的实证性研究对博士生培养质量的影响效果和作用机制进行全面考察。有鉴于此，本研究基于“研究生满意度调查”数据，构建包含学术能力和通用能力的博士生培养质量框架，在控制博士生个体特征和环境因素的情况下探讨“申请考核”制与博士生培养质量之间的关联性。

二、文献综述

优化招生考试制度、挑选出最具创新潜质的博士申请者，是各国研究生教育改革的重要议题。2016年，美国研究生院理事会专门发布报告《研究生入学中的全面审核》（Holistic Review in Graduate Admission），讨论如何走出标准化测试（如GRE/GMAT）路径，更加全面有效地选拔博士申请者。随后，对比不同招考方式选拔有效性的理论研究和实践探索逐步增多，它们均围绕一个核心问题：什么样的博士生最可能取得学业成功。

从当前北美高校的实践经验来看，全面评估申请者的认知能力、非认知能力及个体特征，对申请者在研究生阶段取得成功具有至关重要的作用。一方面，考虑到高等教育的多样性，北美高校正日益重视对申请者非认知能力，如情商、自我效能感、责任心、创造力、兴趣、态度等的考察，以扩大录取程序的证据基础，提高招考方式的有效性。一些学者针对心理学领域做了更加深入的研究，发现美国和加拿大高校的研究生院最为看重的入学考核项目是GRE成绩、专家推荐信、个人陈述、研究经验、学业成绩。如GRE成绩可预测博士生在心理学课程中的各种表现，包括一年级和二年级的成绩，教授对学生论文的评分及教授对学生分析、创新、实践、研究和教学能力的评分。另一方面，美国在研究生招考中正逐步实施综合的“申请考核”制以全面考察申请者的过去经历、认知水平、非认知能力及发展潜力。其原因在于以学为标的考察方式单一且效果有限，唯分而论的考核方式扼杀了生源多样性且抑制创新力，而综合审核可加强对导学之间、培养项目与学生需求之间匹配度的考察，以提高培养效率并降低教育成本。

基于中国博士招考制度的改革实践，有学者从促进博士生全面发展的角度出发，认为我国应当考虑在招生录取、导师培养和自主科研支持力度方面采取措施，在招生考核的过程中注重对博士生科研兴趣、读博动机、合作能力等非认知能力的考察。影响研究生学业成就的非认知能力主要包括沟通能力、规划能力、领导力以及责任心等。高校已经开始注重培养和发展博士生的通用能力，有意识地培养博士生群体的个人交际技能、职业生涯管理技能，在维护招考公平的前提下更加重视考察学生的学术能力与综合素养，力图招收学术能力与综合素养并优的博士生。这与美国研究生院招考改革方向呈现较强的一致性。“申请考核”制是实现更加系统全面考察博士生学术能力与综合素养的重要方式。一些学者发现，“申请考核”制与传统招考方式相比更加科学、全面。在“申请考核”中，因考生多已提前与导师进行过充分沟通，故而导师及专家团队能进一步考察考生的学术和研究潜质，更客观、全面地评价考生的专业知识和学术水准。但“申请考核”制并非尽善尽美，也存在一些不足。例如博士招生委员会以不同的方式发挥作用，并倾向于选择与自己相似的申请者，而不考虑项目或专业领域的客观需求，入学标准在很大程度上缺乏对学业成绩结果的预测效度，且内部信度不足。申请考核生相较于普博生表现出较低水平的管理认同与较高水平的发表压力和焦虑，在科研产出上与普博生相比亦无明显优势。

上述研究为招考有效性的探讨提供了有益视角：一是以博士生入学后的学业成就或培养质量高低来判断哪一种招考方式更为有效是一个具有高共识度的方法，有效的招考方式应当更有利于选拔出那些在学业上更能取得成功的群体；二是博士生学业成功与否取决于多种因素，既包括认知能力因素，也包括非认知能力因素，如何有效地测度出影响博士生学业成功的重要因素是理论研究和招考实践需要面对的问题。但已有研究也存在一定的局限性。首先，以培养质量高低来反推招考方式必须解决培养质量测度的有效性问题。少量以既定指标反映的博士生培养质量可能并不全面，例如博士生入学第一年的考试成绩、发表论文数与毕业论文质量等，都仅是博士生培养质量某一侧面的体现，不能完全反映博士生培养质量全貌。其次，基于既定培养质量指标对通过不同招考方式入学的博士生进行比较存在着“样本自选择”问题，参与不同招考方式的博士生生源本身就存在着质量差异。如实行“申请考核”制的大多为“双一流”高校，而其他高校则多沿用传统的考核方式。因此，生源质量的差异会影响其报考院校的选择，进而决定个体所选择的招考方式。故从某种意义上来看，与其说“申请考核”制选拔出了综合素质更高的学生，不如说综合素质更高的学生更多地通过“申请考核”制入学。最后，学生在学期间的能力增值是建构博士生培养质量的重要方面。能力增值既受制于生源质量，也与学生在学期间的努力程度紧密相关。基于此，我们有必要在充分考虑学生就读期间努力程度的基础上，以培养质量的高低来全面反映不同招考选拔制度的有效性。

综上所述，本研究将从以下三个方面进行改进。一是从学术能力和通用能力的视角建构博士生培养质量指标，解决单一变量不能全面反映博士生培养质量的问题，综合分析“申请考核”制对博士生培养质量的影响。二是为提高对我国博士生培养质量情况的总体把握程度，课题组通过分析全国32所院校培养单位6270名博士生的数据，采用倾向得分匹配（Propensity Score Matching，PSM）方法，使得分相近的博士生被分配到实验组和控制组，进而构造一个“准随机”实验，克服样本选择偏差所带来的估计偏误。三是考虑到博士生个体入学后的努力程度会对培养质量产生重要影响，故本研究加入“个体努力程度”变量，以更好地考察不同招考方式与博士生培养质量的关联机制。

三、计量模型、方法与数据

(一)

样本及数据来源

自2012年起，《学位与研究生教育》杂志社针对研究生群体连续组织开展年度调查。2020年的调查对象来自112个研究生培养单位，其中一流大学建设高校32所，一流学科建设高校32所，其他高校48所，调查数据具有较高的科学性和代表性。由于全面采用“申请考核”制的高校主要集中在一流大学建设高校A类，且该类型培养单位之间具有较好的同质性，因此本研究的样本数据主要包含32所一流大学建设高校。考虑到研究需要，本研究初步获取8775名博士生的调查数据，在删除了主要变量存在缺失的样本之后，共获得6270名博士生样本作为研究对象，其中男性3597名，女性2673名。

（二）

变量选择及描述性统计

为了全面反映博士生培养质量，本研究以学生自我陈述的能力提升5点李克特量表（非常不认同=1，不太认同=2，一般=3，比较认同=4，非常认同=5），从学术能力和通用能力两个方面综合表征博士生个体的培养质量。其中，本研究选取“科研能力”“专业知识基础”“解决专业问题的能力”3个变量表征博士生的学术能力，得出3～15之间的总分作为学术能力的代理变量；选取“团队领导能力”“沟通与合作能力”“自主学习能力”“批判性思维能力”“口头表达和报告能力”“追求真理的信念”6个变量表征博士生的通用能力，得出6～30之间的总分作为通用能力的代理变量。

解释变量方面，问卷中在“博士录取方式”选项中，选择“申请考核”赋值为1，否则为0。为控制其他影响博士生培养质量的因素，参考相关研究成果，本研究在模型估计中加入博士生的个体特征变量与环境因素变量，具体包括“个体努力程度”“科研兴趣”“跨学科”“学术会议参与”“课题参与”“学术发表”“导师指导”“奖学金制度”“图书馆”“心理健康咨询”“就业指导与服务”“父母学历”“性别”“年级”。考虑到城乡差异，模型估计中还加入了城乡虚拟变量以控制区域差异带来的影响。各个变量的名称、赋值规则及描述性统计如表1所示。

表1 变量的名称、赋值规则及描述性统计（N=6270）

（三）

模型设定与研究方法

1.模型设定。为了探究“申请考核”制与博士生学术能力、通用能力的关联机制，本研究构建如下计量模型：

PHD_academic_abilityi=α1+β1×

Application_examinationi+β2×Xi+εi；（1）

PHD_general_abilityi=α2+β3×

Application_examinationi+β4×Xi+εi.（2）

其中，PHD_academic_ability表示博士生个体的学术能力；PHD_general_ability表示博士生个体的通用能力；X为控制变量，主要包含博士生个体特征变量与环境因素变量；εi表示随机误差项；α和β分别表示常数项和各解释变量的系数。

2.研究方法。概率模型是分析离散选择问题的理想估计方法。当因变量的类别数增加（5及其以上）时，连续数据分析方法的估计结果与等级数据分析方法的结果非常接近。本研究表征博士生学术能力和通用能力的代理变量是等级形式的定序变量，因此，计量分析采用有序Probit回归模型。为了检验不同模型得到结果的稳健性，本研究同时汇报最小二乘法（OLS）的回归结果。同时，本研究基于模型（1）与模型（2）两个基准模型，采用逐步检验回归系数的方法验证个体努力程度在“申请考核”制与博士生培养质量之间的作用机制，以对“申请考核”制与博士生学术能力、通用能力之间的关系进行综合分析。

四、模型估计结果分析

（一）

“申请考核”制与博士生培养质量

表2给出了“申请考核”制对博士生培养质量中学术能力和通用能力提升程度的回归结果。从模型（1）的回归结果来看，“申请考核”制与博士生个体的学术能力在1%水平上显著正相关，这说明申请考核生的学术能力提升更高，能够较好地预测博士生个体入学后的学术表现。从模型（2）的回归结果来看，“申请考核”制与博士生个体的通用能力在1%水平上显著正相关，这表明申请考核生的通用能力提升更高。同时，这也说明以考察综合能力为特征的“申请考核”制所选拔的博士生在新环境中感知到的质量提升更高。相关研究也间接证明了这一观点：尽管高等教育学界普遍认为本科直接攻读博士和硕博连读的生源更优，更容易得到所在高校的青睐和导师的认可，但以本科生直接攻读博士或硕博连读方式录取的博士生更容易发生延期。对于学生个体来说，在选择直接读博或硕博连读以后，可能需要在同一个培养单位接受至少五年的学习和科研训练，而不像从公开招考途径以“申请考核”方式入校的博士生那样能够感受到不同大学、科研团队的学术观点和研究范式。回归结果显示，不同培养单位的研究方法、学术训练和研究范式对博士生培养质量的提升具有积极促进作用。因此，当“申请考核”制能够挑选出与直博生或硕博连读生质量水平相近甚至更高的生源时，其有效性就能显著体现出来。

此外，回归结果显示，博士生个体背景（“父母学历”“性别”“年级”“户籍类型”）、内在特征（“个体努力程度”“科研兴趣”“跨学科”）、外部学术环境（“学术会议参与”“课题参与”“学术发表”“导师指导”）、学校支持服务体系（“奖学金制度”“图书馆”“心理健康咨询”“就业指导与服务”）共同影响了其培养质量。在与环境互动过程中，博士生个体背景为其适应学习和科研环境提供了客观条件；内在特征为博士生培养质量的提升提供了内部驱动力；学术会议参与、课题参与、学术发表、导师指导等为博士生发展提供了良好外部学术环境，有利于提升博士生对其所从事学术科研事业的认可度，促进博士生个体的社会化；学校层面的支持服务体系能够有效解决博士生的后顾之忧。博士生个体特征的差异性客观上要求培养单位为其提供个性化、多样化的支持服务，以帮助博士生更好地投入到学术科研当中，提升博士生培养质量。

表2 “申请考核”制与博士生培养质量的回归结果

（二）

基于PSM的稳健性检验

探讨不同入学方式与培养质量的关联需要消除样本选择偏差，即消除非随机性样本对估计量产生的偏差。选择“申请考核”制的博士生可能并非随机分布，而是根据自身情况预测决定的，即综合素质更高的学生会有更大的可能性申请综合实力更强的院校，而这些院校往往是实施“申请考核”制的先行者。因此，本研究采用PSM方法进一步讨论“申请考核”制与博士生培养质量的关联机制。

首先，为了减少回归模型遗漏变量的可能性偏差，本研究将所有影响博士生培养质量的因素（“科研兴趣”“个体努力程度”“学术会议参与”“课题参与”“学术发表”“导师指导”“跨学科”“奖学金制度”“图书馆”“心理健康咨询”“就业指导与服务”“父母学历”“性别”“年级”“户籍类型”）作为协变量纳入Logit回归模型计算倾向值得分。数据的共同支撑域越大，样本的损失就越小。从图1可以看出，大多数观测值均在共同取值范围（On Support）内，数据匹配质量较高。匹配结果显示，6270个观测值中有6259个处于共同支撑域，不在共同取值范围的样本数仅11个，匹配效果较好。

图1 倾向得分的共同取值范围

其次，为了进一步论证匹配结果的一致性，本研究对PSM结果进行平衡性检验，具体见表3。如表3所示，匹配结果很好地平衡了数据，所有协变量均通过了平衡性检验。一方面，匹配后所有变量的标准化偏差的绝对值均低于10%，相较于匹配前有了明显减少，申请考核生与其他类型申请者之间的特征差异得到了较大程度的消除，匹配变量具有较高的可比性。另一方面，T检验结果与P值均不显著，表明处于实验组与控制组的申请者不存在系统差异。

表3 匹配平衡性假定检验结果

最后，由于采用多种匹配方法估计能够为结果增加可靠性，本研究运用不同的PSM方法对样本进行了4次匹配，包括一对一匹配、半径匹配、核匹配和马氏匹配，然后测算“申请考核”制的平均处理效应（详见表4）。从表4的结果来看，对博士生的学术能力而言，“申请考核”制的平均处理效应至少在5%水平上显著为正，说明在控制内生性问题后，申请考核生的学术能力提升更高；对博士生的通用能力而言，“申请考核”制的平均处理效应在10%水平上显著为正，说明在克服样本选择偏差所造成的偏误后申请考核生的通用能力提升更高。

表4 不同匹配方法下的处理效应

（三）

基于个体努力程度的中介效应分析

学界围绕学生能力与培养质量提升已积累了大量研究成果。为了解释学生在接受高等教育以后会有不同程度的能力提升，学界广泛采用学生参与理论评估学生在学期间的学习质量及其对学生能力提升的影响。入校后，博士生需要通过个人的学习投入快速适应新的学习和科研环境，掌握学科前沿知识和研究范式。换言之，博士生的培养质量也取决于培养过程中个体与环境的互动质量，个体的努力能够帮助博士生逐渐适应未来的学术之路，并且有效的互动行为能够准确预测个体的创新能力。对博士生而言，其在学习和其他有意义的科研学术活动中投入的时间和精力越多，努力程度越大，越有可能获得能力的提升。因此，个体努力程度在“申请考核”制与博士生培养质量中的作用尚需细致分析，即究竟是“申请考核”制挑选出了综合素质更高的博士生，还是挑选出了更努力的博士生，抑或两种作用均有。

对此，首先，课题组检验方程（1）和方程（4）中“申请考核”的系数是否显著，如果显著，则表明申请考核生综合素质更高。其次，课题组依次检验方程（2）与方程（3）、方程（5）与方程（6）的系数。方程（3）和方程（6）的“申请考核”系数如果不显著则称为完全中介，即“申请考核”制挑选出了更努力的博士生，博士生入校后通过更多的学习投入提升了其培养质量；如果均显著，则称为部分中介，表明“申请考核”制既选拔出了综合素质更高的博士生，也选拔出了依靠个人勤奋获得学业成功的博士生。

表5的分析结果表明，“个体努力程度”在“申请考核”制与博士生学术能力、通用能力之间具有部分中介效应。从学术能力方面来看，方程（2）中“申请考核”的系数和方程（3）中“个体努力程度”的系数均在1%的水平上显著正相关，表明存在部分中介效应，“申请考核”制选拔出了更努力的博士生，这些博士生入学后通过更多的学习投入获得了学术能力的显著提升。其中，总效应为0.137，直接效应为0.102，中介效应为0.035，直接效应占总效应的74.45%，间接效应占总效应的25.55%。从通用能力方面来看，方程（5）中“申请考核”的系数和方程（6）中“个体努力程度”的系数均在1%的水平上显著正相关，表明存在部分中介效应，博士生的努力程度同样对于通用能力的提升具有显著作用。其中，总效应为0.113，直接效应为0.077，中介效应为0.036，直接效应占总效应的68.14%，间接效应占总效应的31.86%。

表5 “个体努力程度”在“申请考核”制与博士生学术能力、通用能力间的中介效应

五、结论与政策建议

本研究利用2020年对全国32所一流大学建设高校6270名博士生个体的调查数据，实证研究了“申请考核”制与博士生培养质量的关联机制。研究发现，申请考核生在学期间的学术能力和通用能力提升更高，采用PSM方法克服样本选择偏差所带来的估计偏误以后，所得结论依然成立；“申请考核”制与博士生培养质量之间存在部分中介效应，“申请考核”制能够选拔出综合素质更高和更努力的博士生，进而提升其在学期间的学术能力与通用能力。结合上述实证研究结果，本研究提出如下三点政策建议。

一是充分发挥“申请考核”制在选拔高素质博士生过程中的重要作用。随着知识生产的社会弥散程度越来越高，博士教育的目标已不再是单一地培养学者,而是强调通过学习与研究培养博士生的问题意识、批判性思考能力、科学分析问题能力等,为进入各行各业成为职场精英和行业领袖做好准备。2020年7月，习近平对研究生教育工作作出重要指示，强调要“适应党和国家事业发展需要，培养造就大批德才兼备的高层次人才”。“申请考核”制旨在进一步加强导师和专家组在招生过程中的核心作用，建立科学有效的人才选拔机制，全面深入地考察申请人的素质和能力，选拔出综合素质更高、创新潜质突出、学术兴趣浓厚的博士研究生。结合本研究的结论，从国家和社会需求的角度综合来看，“申请考核”制更有利于全面考察申请者的学术能力和通用能力潜质，挑选出德才兼备的高素质博士生。

二是提高“申请考核”制的内部信度。一方面，“申请考核”制容易受到人性的弱点以及中国人情社会的文化环境影响，引致内部监督不畅，使得录取的公正性受到质疑。为此，我国要健全博士生“申请考核”制，结合笔试、面试、材料审核等多种考核方式明确录取指标，匿名化处理申请材料，兼顾招生考核过程中的公平与效率。另一方面，部分招生培养单位考核标准与评分方式规定模糊，增加了评价的主观性和随意性。我国高校导师在招收博士研究生时特别重视考生的硕士学位论文质量、已有研究成果、面试表现，比较重视外语水平、研究计划书和学生背景，不太重视专家推荐信、笔试成绩、工作履历和跨学科背景等因素。这可能会使得对博士生各项能力的评估产生偏差，进而影响博士生个体的培养质量。对此，各招生培养单位要建立科学的评分指南，科学指引博士生招生考核评价过程，保障专家组评委对质性材料认知的一致性，提高“申请考核”制的实效性。

三是探索建立申请材料结构化数据的核验与评分系统。申请者的综合素质与相应学科专业领域的培养目标共同建构了招生培养单位选择优秀博士生的标准，而选拔质量则取决于招生培养部门的人才质量观、培养质量观以及招生培养水平和业务认知能力。这就要求各招生培养单位在“申请考核”制的材料审核及笔试阶段制定可量化的指标体系，尽可能收集申请者的结构化材料，并围绕论文发表、课题参与、社会活动与导师推荐等关键事件，充分利用大数据技术进行核验，如申请者是否存在一稿多投等学术不端行为、提供的材料是否真实等。同时，各招生培养单位还可以基于申请材料挖掘更多有效信息，对结构化的数据进行赋值评分，以反映博士申请者的综合素质。此外，招生培养单位核验与评分系统的建立有利于完善“申请考核”制的监督保障机制，形成可溯源的录取证据，敦促专家组对申请人作出兼顾科学性与公平性的有效评价，提高招生培养单位精准选才的能力。

囿于研究数据，本研究还存在一定局限性，无法有效区分“申请考核”制对不同学科博士生培养质量可能存在的异质性影响。未来课题组还需要进一步将研究视角深入到不同学科领域，关注录取方式与不同学科博士生培养质量之间的关联，以期建构更加有效的招生考核体制机制，提高培养单位精准选才育才的能力。

排版：卞谢瑜

审核：刘伦

长

按

关

注

学术专精日新又新

高校教育管理

微信gxjygl2007

投稿http://zzs.ujs.edu.cn/gxjy/CN

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

呼吁四川大学澄清：1998年1月，川大有多少个“姜涛与爱人程月玲”？

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

多长高8厘米！国内知名专家首次公开“追高秘笈”！担心孩子长不高的家长速来！

【专题企划：研究生培养改革】王传毅：“申请考核”制入学的博士生培养质量更高吗？——基于“研究生满意度调查”

您可能也对以下帖子感兴趣

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

呼吁四川大学澄清：1998年1月，川大有多少个“姜涛与爱人程月玲”？

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

多长高8厘米！国内知名专家首次公开“追高秘笈”！担心孩子长不高的家长速来！

生成图片，分享到微信朋友圈

【专题企划：研究生培养改革】王传毅：“申请考核”制入学的博士生培养质量更高吗？——基于“研究生满意度调查”

您可能也对以下帖子感兴趣