全国教育科学规划课题成果公报 | 章建石:综合评价:如何回应新一轮高考改革的要求?
一、育人与选拔夹缝中的综合评价
近年来,我国的考试招生制度正在经历一场深刻的变革。如何消除高校人才选拔中“以分数论高低”“见分不见人”的弊端,建立“综合评价、多元录取”的考试招生制度,是高考改革的重点和难点。其中,“综合评价”是进行多元录取的一个前提,如果高中对学生的评价还局限在学科能力上,那么“多元录取”仍旧只能在分数上做文章。因而,如何拓展学生评价的维度、创新评价技术与方法就显得极其重要。只有“多维”的内容,才可能进行“多元”评价。这就对考试评价提出了一个新的命题,即除了学科能力,还有哪些能力或素养需要评价?除了纸笔考试这一手段外,还有哪些适用的评价方式?
目前,中学广泛开展的综合素质评价就可以看作这方面的探索。然而,尽管综合素质评价实施多年,但实际效果并不理想。这一轮高考改革将综合素质评价作为重要的参考,但在具体操作上仍面临较多困难。究竟如何参考,在多大程度上参考,这些疑问反映了教育界对综合素质评价结果的使用还存在争议。在高校人才选拔中,综合素质评价与人才选拔标准到底是“软挂钩”还是“硬挂钩”,这一问题一直难以形成共识。对基础教育而言,实施综合素质评价是课程改革的必然要求,是促进学生全面发展的重要抓手;而对高校人才选拔而言,综合素质评价常常陷入“不用不重视,一用就走样”的矛盾之中,难以作为实质性的选拔依据。如果高校不将其作为人才选拔的标准之一,那么中学开展综合素质评价的动力就显得不足甚至流于形式;如果将其作为人才选拔的重要标准,就赋予了综合素质评价“高利害”属性,容易导致其在实际操作过程中失真,反过来又限制了其使用范围。
综合评价还需要回归其作为一种校本评价的特性来进行更深入的探讨。校本评价主要是以学校为主体、在学校内部进行的以促进教学改进为目的的活动。校本评价是学校校本管理的重要手段,其过程性评价的特质决定了其与学校教学工作的结合更为紧密,甚至可以说内嵌于教学活动中。校本评价又是相对低风险的,因为其评价结果主要服务于微观层面的教学反馈。课程改革实施以来,校本教研的广泛开展推动了校本评价的实施,其在实践领域的深入开展为提升基础教育质量奠定了基础,赋予了教育评价新的生命。在这个过程中,一个极其关键的变化是:校本评价冲破了分数的桎梏,拓展了评价的维度,探索了多种有效的评价方法和手段。从根本上讲,校本评价只有具备了在评价维度和评价方法上的多样性,才能更好地发挥育人与促进教学改进的功能,这与统一高考的刚性及其要求的可比性有着天然的冲突。
校本评价倡导多元性评价,本质上各校评分并不具有可比性。而现实的统一高考制度恰恰需要各校的评分在同一个标准下比较。如何解决这一矛盾,不同国家和地区从制度和技术层面都进行了探索。
二、校本评价在高校人才选拔中应用的几种类型
(一)美国高校招生的折算录取指数模式
在大部分美国高校的招生中,影响录取与否的因素较多,按重要程度由高到低排序分别为:在中学开设的大学预备课程(AP课程)成绩、高中课程的强度(选课的数量和难度)、学术能力评估测试(SAT)或美国大学入学考试(ACT)成绩、中学全部课程的成绩(GPA)、入学申请书的写作。[1]其他还包括:中学年级排名、中学升学指导教师的推荐信、学生的兴趣、面试和课外活动等。不同层次、不同类型的大学根据自己的需要对学生提出SAT或ACT成绩的要求。其中,GPA、高中课程的强度和中学排名等是很重要的校本评价标准。为操作上的便利,不少高校会将上述若干重要的影响因素进行加总,折算成学业指数(Academic Index),将其作为录取学生的重要依据。
折算学业指数的核心在于将学生学习中的表现进行量化处理,形成可用以客观比较的数值。这一过程的特点是将过程性评价结果——学生的年级排名与其他终结性评价结果进行合成。在具体操作上,通常将年级排名转化为对应的分数,计算方法是:把学生排名乘以2减去1,然后除以当年年级总人数的2倍,这样会得到一个小于1的数值,最后依据这个值在提前制定的表上查到对应分值,这个分值就可以与其他标准化考试的成绩相加,得到总的学业指数值。总体来说,美国大学的招生做到了多元录取,一方面是标准的维度多元,包含了学习成绩、兴趣、面试表现和课外活动等多方面的因素,对学生的评价相对比较综合;另一方面,即使在同一个成绩维度下,也通过将校本成绩与统一考试成绩相结合、标准化考试与多种考查相结合的方式来实现。
(二)中国香港地区高校招生的统计校验模式
从2007年开始,香港考试与评核局(以下简称“考核局”)着手探索如何有效使用校本评价的结果,期望将学校任课教师在日常教学过程中对学生的评价纳入其文凭考试的成绩之中。在几年试验的基础上,2013年进行校本评核的科目达到了12科。[2]近年来,考核局要求所有学校考生须完成有关科目的校本评价,并且其结果将影响学生的升学。然而,这种做法面临一个巨大的挑战,即如何使不同教师、学校所作出的校本评价结果之间具有可比性。为确保不同学校的评分具有可比性,考核局通过统计方法,对学校提交的校本评价结果作适当的调整,重新得到纳入最后总成绩的分数。其目的在于:维持校本评核成绩在学校之间的可比性,以确保校本评核的公平;维持校本评核成绩在年与年之间的素质、信度及效度;搜集数据回馈学校,以进一步优化校本评核的施行。[3]这种用统计方法来调整分数的基本思路是:考试组织机构通过建立有关统计模型,用终结性评价结果来校验过程性评价结果,即参照各学校学生在统考中的成绩来对校内考试成绩进行统计调整,以消除不同学校之间评分标准上的差异。在这个过程中,如果某学校的校内成绩低于与其在终结性考试中水平相当学校的校内成绩,该校内成绩将被适当调高。相反,如果成绩高于其他学校则会被调低。需要强调的是,尽管经过调整后学生的校本成绩会发生变化,但其在学校中的位次不会发生变化。
(三)中国台湾地区高校招生的特殊招生类型
台湾的大学在招生上主要有“考试分发入学”、“甄选入学”和“繁星计划”三种方式。其中,校本评价的使用主要体现于后两种方式中。在“甄选入学”中,考生由高中推荐或者个人申请,须参加“学科能力测验”并且达到校系规定的成绩标准,同时要参加由校系单独主办的考核,包括笔试、口试、书面审查资料、小论文和实验等。在这个过程中,学生在中学期间的学习表现普遍得到高校的关注。校本评价的结果与其他方式的评价结果共同决定大学是否录取学生。“繁星计划”是为缩减城乡差距而实施的,给予城乡高中生平等的大学入学机会,采用各高中单独“推荐保送”的入学方式。学生只要“学科能力考试”成绩符合大学要求,且高一、高二学期总平均成绩排在所在中学前20%,就可以由所在中学向大学直接推荐录取,同一所大学只能在每所中学录取一人。“繁星计划”的实施,增加了偏远地区高中学生进入优质大学的机会,有利于促进教育公平。
台湾高校对校本评价结果的使用主要是通过另外设置特殊的招生类型来实现。目前,以“甄选入学”和“繁星计划”方式入学的学生比例已接近一半,高职院校对校本评价更为关注。不容忽视的是,高校在招生上的自主权是这种方式得以推行的前提。
(四)韩国、英国高校招生的特殊模式
除了上述三种主要的校本评价结果使用模式外,韩国和英国高校招生的经验也颇具特色。韩国的大学十分重视学生在高中阶段的表现,具体包括:高中学习成绩;是否担任过干部;参加社团活动竞赛、科学作品展览等情况。在对校本评价结果的使用上,从2002年起,韩国大学入学考试不再计算总分,而是将各科考试成绩按一定比例转换为9个等级,高校录取时参考其成绩分数等级和日常成绩作出综合评定。[4]在现行的招生管理体制下,韩国高校招生的录取标准也呈现多样化的特点。高校在拟定录取标准时,至少有四种方案备选:(1)仅根据高中在校成绩;(2)高中在校成绩加上“大学修学能力考试”成绩;(3)高中在校成绩加上高校考查成绩;(4)前三项成绩之和。[5]除此之外,还可根据学校与专业的特点确定不同标准的权重。
英国近年则不断强化各种证书考试在高校选拔中的作用,在招生录取中,高校普遍从主要依据学生的证书成绩开始向注重对学生进行综合评定转变,或将两者结合起来。英国“证书+综合考评”的高校录取选拔制度强调在高校录取时主要依据申请人预估的A-levels证书或同等证书成绩,同时通过学校的推荐意见、个人陈述、以前提交的作业、单独举行的考试或联考(一般只有选拔性高校的特定专业才需要)、面试等手段对申请人进行综合考评,然后决定是否录取,是无条件录取还是有条件录取。[6]其中,校本评价结果主要体现在推荐意见和提交作业中。
三、新高考改革要求下校本评价的出路
在本轮高考改革中,综合评价的改革目标要求“既看统一高考成绩,也看学生的平时成绩;既看学生的考试分数,也看学生的综合素质”1。笔者认为,在现阶段各种现实条件的限制下,统一高考成绩在高校选拔中的主导地位仍无法撼动,其在维护社会公平、保证选拔科学性层面的价值更无法被取代。在这一前提下,学生的平时成绩和综合素质这两个主要由中学实施的校本评价结果如何在高校人才选拔中发挥作用,需要在考试技术和制度设计层面来共同推动。
学生的平时成绩是过程性评价的主要结果,各种阶段性测试、期中考试和期末考试等成绩都是重要的校本成绩。与统一高考相比,这些过程性评价对知识点的考查相对集中,既可顾及考查的知识面,又可保证必要的深度。从测量学的角度来看,集中的测试无论是在考试内容还是具体的能力目标上都更加全面,有利于减少考试结果的误差,因而对学生作出的评价也比较客观,能更加科学、准确地反映学生的真实水平。国内外大量的研究表明,在控制其他变量的前提下,学生在高中期间的成绩对大学成绩差异的解释非常显著,甚至超过了一些标准化考试的成绩。因而, 47 31983 47 15289 0 0 1109 0 0:00:28 0:00:13 0:00:15 3558人才选拔的逻辑来看,这些结果应当成为重要的依据。但是,如何保证学生平时成绩的可比性是一个难题。对此,考试技术层面的创新非常必要,而且也是一个比较切实可行的选择。笔者采用了回归和多层线性模型,探讨了利用统一考试成绩来校验校本考试成绩的可行性,比较了各种校验模型的成效,[7]并且在有关考试项目中进行了广泛的使用,取得了良好的效果。用统一考试的成绩来对不同学校的校本成绩差异性进行一定的调整,从而使得校本成绩具有可比性,进而突破其在人才选拔标准中使用的种种限制,从根本上讲符合教育教学的规律,也克服了将考试作为单一人才选拔工具的弊端。校本成绩校验的价值并不仅在追求成绩的比较和使用,而且其彰显了把过程性评价结果纳入综合评价的合理诉求,为人才选拔标准的设置提供了实证依据。
学生平时成绩之所以能以统一考试的成绩来进行校验,有一个重要前提:两者都必须是同一维度下的评价结果。平时成绩和统一考试成绩无疑都属于对学生学科能力考评的范畴。具体到综合素质评价,其评价维度的多元化使得上述校验模型失去了比较的共同基础,因而,如何在高校人才选拔中科学、有效地使用这些成绩之外的多元评价结果,考试技术恐怕难以发挥实质性的作用。这就需要在制度设计层面也就是招生环节进行相应改革。其中,国际上通行、国内部分高校也在探索的特殊招生类型可能是一条比较理想的出路。特殊招生类型的设置从本质上来看是选拔标准的多元化,或者说是在多元的维度下来进行权衡和比较。只有这样,才能避免在同一个尺度下对学生进行并没有多少教育内涵和育人功能的比较,才能让学生综合、多维的素养充分展现出来。
[注释]
[1] Melissa,E.Clinedinst,et al.State of 2011 College Admission[R].National Association for College Admission Counseling,2011.
[2] 香港考试与评核局.香港中学文凭校本评核简介[G/OL].(2013-10).http://www.hkeaa.edu.hk/tc/sba/introduction.
[3] 香港考试与评核局.香港中学文凭校本评核分数调整机制[G/OL].http://www.hkeaa.edu.hk/tc/sba/moderation_sba_scores/.
[4] 刘志东.韩国大学录取制度改革分析[J].当代韩国(秋季号),2011:24.
[5] 杨继龙,但昭彬.韩国高校招生考试制度述评[J].教育测量与评价,2010,(9).
[6] 王立科.英国高校招生考试制度改革动态及其启示[J].考试研究,2008,(4).
[7] 章建石.高校自主招生选拔中校本成绩校验的模型及成效比较[J].清华大学教育研究,2016,(1).
(责任编辑:张蕾)
论文来源于《教育科学研究》2017年第7期
“课题成果公报”专栏由全国教育科学规划领导小组办公室与《教育科学研究》共同创办,主要介绍全国教育科学规划课题优秀成果。专栏的开设旨在立足和服务于我国教育改革与发展的重大理论和现实问题,及时反映全国教育科学研究课题成果的最新进展,加强学界前沿的沟通和交流,促进教育科研的改革与发展。