一、问题的提出学习收获是近几十年中外学界共同关注的重点领域。随着学者对此研究的推进和积累,学习收获的结构性问题日益凸显[1],学习投入与不同学习收获的关系也亟须检验和澄清。平均学分绩点(Grade Point Average,GPA)是研究者衡量学生收获的常用指标,也是大学生角逐名校、名企的硬通货。在“绩点为王”的裹挟下,以GPA为导向的学业成就观逐渐弥漫于校园,通过军备竞赛式学习来提高学业成绩就成为学生学习的主要目标。但是,安坐于绩点排行榜顶端不应是新时代大学生学习目标的唯一样态。这也许在短期内会激发学生的学习热情,但是从长远来看是对学习投入的扭曲和学习目标的窄化,亦是对大学教育内在价值的异化。在这一认识下,高阶思维能力成为衡量学生学习收获的另一个核心指标。世界各国的人才培养实践和国内外众多研究成果也启示我们培养学生的高阶思维能力是构建高质量人才培养体系的核心抓手[2]。尤其是在建设“世界主要科学中心和世界重要人才中心”的战略背景下,提高学生的高阶思维能力比以往任何时代都显得更加重要和迫切。这就带来一个现实问题:当大学生投入诸多时间和精力来追求GPA时,被高校和政府赋予极高使命的高阶思维能力将会如何发展呢?GPA与高阶思维能力作为不可或缺的两类学习收获,它们的关系又是怎样?对这些问题的回答不仅有助于在学理上厘清学习投入与学业成绩和高阶思维能力间的复杂关系,也可为解释众多成绩优异的学生难以成长为国家所需的高层次人才提供理论解释和实证依据。基于此,本研究使用2016年“全国本科生能力测评”数据和2019年“全国本科生能力追踪测评”数据,通过构建似不相关回归模型,考察了本科生学习投入对其学业成绩和高阶思维能力的影响,并尝试探讨了学业成绩和高阶思维能力如同“鱼和熊掌”不可兼得的关系。二、理论基础与研究假设学习投入理论强调了学生投入在学生学习和发展中的积极作用[3]。经过多年发展,学习投入理论逐渐融合了教育学、心理学等多学科领域知识,已成为解释大学生学习与发展的常用理论。本研究在该理论的指导下,结合相关研究成果,提出以下研究假设。(一)学习投入“越多越好”:一个仍需被验证的命题学习投入是学习投入理论的核心概念,主要指学生投入到各项教育实践和学习实践中的时间和精力。该理论假定学生在有教育意义的活动中所投入的学习越多,他们在大学期间的各项收获就会越高[4]。这一假定得到了学术界的广泛关注,并引发了研究学习投入“越多越好”的潮流。相关分析显示,学生努力质量和学习收获[5]、学生学习投入与批判性思维能力[6]都存在显著正相关关系;相比于个人努力质量中的拓展学习子维度,课业学习子维度与成绩排名的相关系数更大[7]。同时,纳入控制变量后的计量模型也证实了学习投入的“越多越好”。例如,卡胡(Kahu)[8]和茜祖翔(Zusho)[9]的研究显示,学生各方面的投入越多,他们的学业成就和能力发展就越高。迪斯(Diseth)[10]将研究对象限定于心理学专业学生后,也有相似的发现:大学生的努力程度和课程学习体验能够有效预测他们的课业成绩。汪雅霜[11]使用我国大规模学情调查数据研究发现,学习投入对学生自评的通用技能收获、专业知识收获有显著正向影响。李雄鹰和秦晓晴[12]以入选“拔尖计划”的学生为研究对象,结果显示学生学习投入的多少可以直接影响学习收获,投入越多,学生自我报告的知识收获、创新性能力收获也越高。魏署光和陈敏[13]基于“985工程”建设高校的学情数据发现,主动学习投入、课程学习投入对学习效果的效用高于生生互动水平、生师互动水平对学习效果的效用。另外,对学习投入作用机制的相关研究发现,学习投入在学习体验和学生GPA间起部分中介作用,在学习体验和共通能力间起完全中介作用[14]。综上可知,包括课业学习在内的学习投入对学生的学业成绩和能力发展有正向预测作用。因此,我们提出学习投入“越多越好”的研究假设:假设1a:学生的学习投入越多,他们的学业表现越好。假设1b:学生的学习投入越多,他们的高阶思维能力越高。(二)学习投入“适度区间”:一个待检验的命题检验学习投入是否存在“适度区间”是被国内外学术界共同忽视的一个研究命题。其实早在1984年提出学生参与理论时,阿斯汀(Astin)[15]就指出学生的时间和精力是一种独特的、有限的特定资源,因此学生参与可能存在适度性问题,应适可而止;参与度高过某峰值后,学生参与效用就会边际递减;当学生过分专注于某一教育目标时,可能会影响甚至危害其他教育目标的实现。在其随后的研究成果中,阿斯汀(Astin)[16]再次提出考察学生参与的适度区间应该是未来研究的一个方向。事实上,该观点得到了实证研究的支持。一项十多年前的研究发现:学生课外参与度是有阈值的;随着学生课外参与越多,课外参与对学生全面发展的作用会边际递减[17]。但是,与学习投入“越多越好”那成千上万的研究成果相比,对学习投入“适度区间”的研究寥寥无几。这可能与阿斯汀(Astin)首将学生参与概念限制在行为方面有关,认为学生参与主要指行为而非动机。近年来,学习投入的“行为观”遭到了学术界的质疑,提出单从行为出发研究大学生学习投入是片面而短视的,因为它排除了那些对解释学生投入来说十分重要的认知因素,忽略了学生的认知投入与外显行为可能存在的矛盾[18]。弗雷德里克斯(Fredricks)[19]提出学习投入是一个元概念,本身包括了行为投入和认知投入;并且认知投入的强度有质的不同,从低层次的记忆、浅层学习方式和浅层学习策略到深层学习方式和深层学习策略都归属其中。目前,将学习投入的“认知观”纳入理论范畴已被学界普遍接受[20]。例如,苏林琴[21]将认知投入纳入了分析框架,并发现认知投入同行为投入一样对学生的学习收获有积极作用。但是,上述研究并未考察认知投入作为一种有限资源会对学生收获带来何种影响。这样说是因为认知投入的多少会涉及学生的认知负荷,故而学生的认知负荷水平就成为影响学生学习投入度的重要因素。认知负荷理论的提出者斯韦勒(Sweller)[22]认为学生学习所使用的工作记忆的容量是有上限的,因此个体在同一时间内只能执行有限数量的任务[23]。当学习等智力活动强加给工作记忆的认知负荷超过其最大容量时,个体的学习收获就会降低[24]。综上可知,无论是行为投入还是认知投入并非“越多越好”,而是可能存在“适度区间”。基于此,本文提出研究假设2:假设2a:学习投入超过一定限度后对学业表现有显著负向影响。假设2b:学习投入超过一定限度后对高阶思维能力有显著负向影响。三、研究设计(一)数据数据来源于课题组2016年12月开展的全国本科生能力测评(National Assessment of Collegiate Capacity,NACC)。通过对我国四年制本科院校10%的抽样,该调查对16省(自治区/直辖市)83所公办普通高校的近1.6万名在校本科生进行了问卷调查和批判性思维能力测评。按年级划分全样本后,大一学生样本为8245人,大四学生样本为5457人。如无特殊说明,本文的研究样本为大四学生样本。(二)变量1. 因变量:学业表现和高阶思维能力(1)GPA。GPA与在校本科生息息相关,是国内外高等教育衡量学生学业表现的一个通用计量单位,也是高校向学生分配奖项、奖学金、保研资格等稀缺资源时所依据的一个重要标准。因此,本文使用学生自我汇报的GPA来表征学生的学业表现,问卷题目为“您的学分绩点为 (4.0分为满分①)”。清洗数据后,有效样本量为3328②。(2)批判性思维(Critical Thinking,CT)能力。当前,批判性思维能力是政府、社会、高校公认的高阶思维能力,也是研究者检验学习投入“越多越好”效应的常用指标。本研究使用由33道客观试题构成的“全国本科生批判性思维能力测评”量表[25]现场集中测评了学生的批判性思维能力。该量表合理地反映了中国文化和中文语境,是测评批判性思维能力的首个本土化测评工具。测评时长为50分钟,每题1分,满分33分。按通行做法,本文将其转化为百分制。测评结果显示,量表的克隆巴赫系数为0.623(较高),满足测量和研究需要;分别以被测学生的自评批判性思维能力、高考总成绩、高考语文成绩、高考数学成绩和高考英语成绩为效标,效标效度分别为0.094、0.364、0.185、0.296和0.273(p<0.001),表明量表的校标关联效度较高,测评工具有效。2.自变量:学习投入及其二次项泽普克(Zepke)[26]指出学习投入的已有研究存在三个问题,其中之一是学习投入试图强调学生学习的方方面面,而这恰恰忽视了特定场景、特定内容的学习所具有的特殊性及其对学习成果的独特影响。因此,本研究中的学习投入主要指学生的课业学习,将常见的人际互动等学习投入变量当作控制变量纳入模型。学习投入由“我的学习主动性”和“我对课程学习的投入度”构建。其中,课程学习包含了学生的行为投入和认知投入,前者强调完成老师布置的学习任务,后者关注学生对课程知识的记忆、理解以及应用[19, 27]。这样说是因为行为投入和认知投入并不是泾渭分明的,而是对学习投入不同维度的侧重,并且很大程度上重叠在一起难以完全区分开来[28-29]。两个题项均采用李克特5点计分法设计,1表示非常低,5表示非常高;克隆巴赫系数为0.829,内部一致性较高,满足研究对信度的要求。参考已有构建变量的方法[30],学习投入为题项求和后的平均值,平均值越高表示学生的课业学习投入越高。同时,为回答研究假设2,本文构建了学习投入的平方项,以考察学习投入对学生学业表现和高阶思维能力的影响方向、影响程度及其适度区间。3. 控制变量学生个体特征是影响学生学业表现和高阶思维能力的重要因素,因此本文首先对学生的性别、户口进行了控制。其次,还控制了对学生学业成果有影响的独生子女、父母受教育年限、父母职业阶层和家庭经济水平感知四个变量。另外,本文控制了与学生就读情况有关的变量,包括学校类型和学科类型。最后,对学生的学情投入进行了控制,包括学生是否参加过或准备参加GRE考试、是否学习过或准备学习批判性思维课程、是否参与过本科生科研等三个分类变量,以及院校支持满意度、生师互动质量、生师互动频率、生生互动频率等四个连续变量。其中,院校支持满意度指学生对学校提供的“学业”“社交”支持的满意度,生师互动质量指“老师”“班主任/辅导员”对学生的影响,生师互动频率和生生互动频率指与“老师”“同学”交流互动的频率。基于工作样本的描述性统计见表1。
(三)分析方法如何避免遗漏变量可能带来的估计偏差是使用截面数据分析学习投入效用的一个难题。为有效克服该问题,本研究参照吴愈晓和张帆[31]的做法做了两种努力。其一,使用区域固定效应模型对大学所在区域进行控制。这是因为东部、中部、东北部和西部的经济发展水平及其高等教育质量存在明显的地域差异,对其进行控制可有效降低区域层面的遗漏变量所带来的估计偏误。其二,使用似不相关回归(Seemingly Unrelated Regression,SUR)模型代替传统的普通最小二乘法(Ordinary Least Squares,OLS)进行估计。本研究有GPA和批判性思维能力两个因变量,而且两者显著正相关(r=0.165,p<0.001),再加上估计它们的自变量是一致的,这不可避免某些没有纳入模型的因素会同时影响两个因变量[32]。因此,使用两个单独的OLS回归模型分别估计两个因变量时不可避免出现它们的残差项会显著相关,从而降低估计效率。使用SUR模型就是将上述独立的两个模型进行联合估计,这在一定程度上不仅可以改善因遗漏变量带来的估计偏误,也可以通过系统估计提高估计效率。具体的SUR模型如下: