查看原文
其他

【“四个评价”笔谈(10)】张会杰 等:为了更好地学习: 增进教育测评有效性的基本原则

张会杰 等 中国考试 2022-04-25

编者按:2020年6月30日,中央全面深化改革委员会第十四次会议审议通过《深化新时代教育评价改革总体方案》(以下简称《方案》)。《方案》提出,教育评价事关教育发展方向,要全面贯彻党的教育方针,坚持社会主义办学方向,落实立德树人根本任务,遵循教育规律,针对不同主体和不同学段、不同类型教育特点,改进结果评价,强化过程评价,探索增值评价,健全综合评价,着力破除唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,建立科学的、符合时代要求的教育评价制度和机制。这是继2018年全国教育大会提出“扭转不科学的教育评价导向”后指导教育评价改革的又一份纲领性文件。为深入探讨《方案》提出的“改进结果评价,强化过程评价,探索增值评价,健全综合评价”(简称“四个评价”),本刊邀请专家围绕“四个评价”展开笔谈,同时欢迎广大专家学者就此问题展开更广泛的讨论。



作者:

张会杰,华东师范大学教育学部考试与评价研究院,副教授。


原文刊载于《中国考试》2020年第9期第20—26页。



摘要:对于学习的测评、为了学习的测评、作为学习的测评是教育测评的3种范式,它们之于课程与教学目标的达成相辅相成、互为补充,共同组成以学习为本的测评。增进教育测评有效性的基本原则主要有:寓测评于教与学,探索多维度的测评方法,选择易于促进学习的测评方法,不同测评项目的评价标准协同一致,让学生知晓评价标准,学习过程中持续测评学生,允许学生参与测评过程,分析与报告学生的学习结果,提供反馈以促进学生的学习。为促进学生更好地学习,需要根据课程与教学目标选择适当的测评范式、手段、工具和策略。



关键词:教育评价改革;有效测评;测评范式;对于学习的测评;为了学习的测评;作为学习的测评


  教育测评是教育改革和发展的风向标和指挥棒。由于教育具有长期性、生成性及效果的迟滞性,测评具有间接性、内隐性及主观性等特征,科学有效地组织实施教育测评一直是教育教学实践中的难题。2020年6月30日,中央全面深化改革委员会第十四次会议审议通过的《深化新时代教育评价改革总体方案》(以下简称《方案》)指出,教育评价事关教育发展方向,针对不同主体和不同学段、不同类型教育特点,改进结果评价,强化过程评价,探索增值评价,健全综合评价,着力破除“五唯”的顽瘴痼疾,建立科学的、符合时代要求的教育评价制度和机制[1]。《方案》提出的“四个评价”,将成为当前教育改革尤其是教育评价改革的重要议题,切实增进教育测评的有效性更是全面落实“四个评价”的重中之重。
  教育评价基于事实确认、价值判断与价值选择依次展开,其有效性是立足于评价目的和评价目标而言的。美国心理学家Robert J. Mislevy认为,心理与教育测评理论发展至今大致经历2个阶段:第一阶段是标准测验理论,第二阶段是以认知诊断为核心内容的新一代测评理论[2]。基于标准测验理论的测评着重关注考生的行为反应及其潜在特质的相对位次,较少关注考生的认知过程,其测评思想可概括为“对于学习的测评”(assessment of learning);基于新一代测评理论的测评拓展到对被试个体差异的诊断、分析与解释,与“为了学习的测评”(assessment for learning)和“作为学习的测评”(assessment as learning)的测评思想高度吻合。

 1

对于/为了/作为学习的测评:测评的3种范式

1.1 “对于学习的测评”:“评价即测量”范式
  “对于学习的测评”与行为主义学习观相关,测评旨在核查学生是否达到既定的知识与技能的习得要求,通过比较预定的学习目标与学生的当下表现作出判断。“对于学习的测评”支持证据论证,教师通过测试与考核等方式收集学生学习的相关证据,以此确认学生达到既定目标的程度。这种测评范式可概括为“评价即测量”,评价更多被视为学生实际掌握状况的测量工具,通常作为相对独立的环节在学习结束时进行。“对于学习的测评”范式理论与实践历史悠久,在1949年出版的经典著作《课程与教学的基本原理》中,“现代教育评价之父”泰勒就提出,评价是查明已形成和已组织的学习经验,在实际上带来多少预期结果的过程[3]85。泰勒的测评思想可视为“对于学习的测评”范式的典型代表。


1.2 “为了学习的测评”:“支持与促进学习”范式
  “为了学习的测评”与建构主义学习观相关,测评旨在了解学生能做什么或不能做什么,帮助学生进行审议和作出决定。建构主义认为,在知识的心理建构过程中,学习者首先从自身的经历中形成对世界的感知,使自己适应当前的图式,继而反思并应用这些感知,使图式发生变化。这种测评范式与当代学习理论紧密相关,可概括为“支持与促进学习”的测评范式。“为了学习的测评”更加注重学生学习的过程,主张充分挖掘测评在支持学习方面的潜能,在坚持教师测评主体地位的同时,凸显测评服务对教学活动的调节和优化。


1.3 “作为学习的测评”:“测评即学习”范式
  “作为学习的测评”与认知科学密切相关,测评旨在使学生成为自主的学习者,它要求学生意识到自己需要什么,并在学习过程中评估和调控自己的学习,以达到先前设定的目标[4]。这种测评范式凸显学生在学习中自我反思和自我调节的积极作用,可概括为“测评即学习”评价范式。此范式中,教师仍然发挥主导作用,但学生的主体性显著提升,而且特别强调发展学生的评价能力。人类所有的行为举止,只要不是盲目感情冲动行事或只是机械地例行公事的话,似乎都包含评价[5]。评价包含了人类心智的全部高级功能——知觉、经验、观察、分析、类化、比较、综合、解释、判断、决策等。学生有必要掌握这些评价技能,这是学生成长为自主探究的终身学习者和自主决策的问题解决者所必备的元认知技能。“作为学习的测评”面向学会学习,专注于学生对测评的主体性参与,以及测评对学生元认知技能的发展与支持。
  对于/为了/作为学习的测评范式各有侧重:“对于学习的测评”和“为了学习的测评”暗含一个基本假设,即学习主要发生在对知识和经验进行输入、加工和编码的阶段,测评则是对学生已经习得的学习结果进行确认和标识,就像物理测量并不改变客体的形状、尺寸、重量等物理属性一样,“对于学习的测评”和“为了学习的测评”本身并不引发学生学习;“作为学习的测评”则视测评为学习过程的重要部分和组成学习能力的必要策略。2008年以来,《科学》杂志发表的关于提取式学习能够产生更持久的记忆保持和更好的学习迁移[6-7]等前沿成果揭示,对学习者的测评不同于物理测量,对学习者的测评本身产生有意义的学习,有助于增进长效记忆、加深理解、重塑认知结构[8],以测评为表现形式的提取式学习是人类最具成效的学习策略之一。基于此,专家提出要培养学生自我测验的学习策略,以促进学生的学习[9]
  总之,3种测评范式彼此关联,于课程与教学目标的达成相辅相成、互为补充,共同构成以学生学习为本的测评(learning-oriented assessment)。测试与评价对学习有重大影响,要促进学生积极地投入学习、更好地学习,需要根据课程与教学目标选择适当的测评范式、手段、工具和策略。

 2

增进教育测评有效性的基本原则

  近几十年来,促进学习的价值追求日益成为国际测评的主流趋势,经济合作与发展组织(OECD)根据教育测评的这一趋势及面临的挑战提出测评政策的改进建议[10]22-27。Rita Berry博士根据澳大利亚教育和培训部在2002年构建的对于/为了/作为学习的测评基本框架,提出增进教育测评有效性的十大原则[11]。这些建议和原则对优化测评设计、改善测评质量、充分发挥测评效果具有指导意义。笔者基OECD的建议和Rita Berry博士提出的十大原则,同时结合《方案》提出的“四个评价”,提出增进我国教育测评有效性的9项基本原则,并初步构建如图1所示的框架。

  教育测评系统性强,涉及测评方法、测评标准、测评过程、测评主体、测评结果等方面,9项有效测评的基本原则中:原则1属于上位原则,是在课程与教学目标下设计测评的基本出发点,同时也是测评元评价的根本依据;原则2~9属于下位原则,侧重于测评的实施,原则2和原则3关注测评方法,原则4和原则5关注测评标准,原则6关注测评过程,原则7关注学生的主体性,原则8和原则9聚焦于测评结果的分析与使用。新时代教育评价改革的深化离不开一线教师和测评政策制定者对这些原则的认知、理解及恰当运用。


2.1 原则1:寓测评于教与学,教、学、评有机融合
  测评事关教育发展方向,必须遵循教育教学规律。泰勒指出,除非将评价与课程密切地整合起来,否则,成为学生注意焦点的,甚至成为教师注意焦点的,将是评价而不是课程目标[3]99。结果评价、过程评价、增值评价、综合评价的设计和实施必须与课程的学习目标以及教与学的内容保持一致,并作为教与学持续改进的依据。当前教育教学高度重视学生通过学习形成正确的价值观念、必备品格和关键能力,不同学段、不同类型的教育对上述目标的具体内容与培养规格各有侧重,测评活动的设计、测评任务的设置、测评方法的选择等应紧密围绕学生价值观念、品格与能力的发展状况展开。立足课程的学习目标,通过各种手段,观察、收集、记录和分析学生的学业表现,进而诊断学生的学习状况和能力进展,并利用从测评中获得的信息调整和优化教学活动。
  寓测评于教与学,教、学、评有机融合,这一原则对教学质量的影响是根本性的。一线教师在测评中容易犯这样的错误:把教师要做的事情作为目标,却忽视对期待学生发生的变化进行确认;列举教学过程中关涉的各种学习要素(如学科概念、原理及方法等),却没有具体说明学生掌握这些要素要达到的层次水平;采用抽象的概括化的理念,比如,采用“激发兴趣”“学习态度”“创新能力”等来陈述目标,却缺乏对抽象理念的明确界定及细化分解,由此导致相关测评活动的虚化与泛化。教、学、评有机融合,意味着教与学的目标被明确和具体地描述,能依据这些目标设计开发出有针对性和可操作性的测评任务,同时,评价也是澄清教与学目标的有力手段。教、学、评的有机融合亦为教育测评的元评价提供了基本的参照依据。


2.2 原则2:探索多维度的测评方法
  由于教与学目标的多维度而非单一性,与之匹配的测评理应在形式、广度和深度上有所不同,从而全面准确地反映学习发展的不同方面。传统的教育目标分类学将教学目标分为认知目标、情感目标、动作技能目标,测评时自然应当从认知领域(知识的主类别:事实性知识、概念性知识、程序性知识、元认知知识;认知过程的类别:记忆、理解、应用、分析、评价、创造)[12]、情感领域(兴趣、态度、欣赏、价值观、情绪意向或倾向、坚毅品格等)、动作技能领域(某些肌肉的或运动的技能,对材料和客体的某种操作或协调运动等)等维度入手。不同维度的学习目标呼唤与之相适应的测评方法,除纸笔测试外,还可通过档案袋、实验、访谈、表演等方法观察和记录学生的行为表现。如泰勒所言,获得任何有关教育目标所期望的行为的有效证据,都是一种合适的评价方法[3]86
  多维度测评方法的优势在于:首先,能够使各具特点的学生有机会得到认可和鼓励,因为人类的智能是多元的,每位学生都有自己的优势智能;其次,它传达了一个重要的理念,即学习是复杂的,关键的学习成果通常有多重表现,需要不同的技能才能充分展示;最后,当采用表现性评价和真实性评价时,有助于激发学生的学习兴趣和参与热情。改进结果评价、强化过程评价、探索增值评价、健全综合评价必然要依托多维度的测评方法,可以在对于/为了/作为学习的测评范式中选择和使用相应的测评方法。

  需要明确的是,最值得关注的是测评的质量而非数量,对于想要测评的特定构念,绝非是采用越多的测评方法就越好,而是要选择与测评目的尽可能匹配和适用的测评方法。选择测评方法时需要严格遵守这项原则,充分考虑学习目标的类型及其特性。


2.3 原则3:选择易于促进学生学习的测评方法
  从教学目标设定的合理性角度出发,维果茨基提出“最近发展区”的概念,指出最佳的目标应当是最能有效地促进学生学习进步的目标,是学生通过自主学习以及外界的引导和帮助能够达到的水平,这个水平位于学习者发展区域的上界[13]。选择易于促进学生学习的测评方法与这一学习理念高度契合,指向“为了学习的测评”和“作为学习的测评”。在设计测评时,应更加自觉地明晰测评任务指向的学生素养的发展维度;在选择测评方法时,应选择那些容易促进学生学习的测评方法,比如,“请学生用自己的语言概括和解释所学的内容并作出评价”,是目前我国基础教育领域普遍应用的一个简易且有效的测评方法。
  伴随大数据技术对学生学习数据的实时采集与智能分析,对学生学习状况及其最近发展区的动态评估和诊断具备了初步的技术支持。依托大数据技术的快速发展和大规模应用,利用云计算、移动互联网和物联网等技术,有望进一步拓展测评的方法和技术,提高测评的实效性与便捷性。选择易于促进学习的测评方法,既是教育评价改革能否落地和不断深化的关键,也是当前教育评价改革需要着力突破的瓶颈。


2.4 原则4:不同测评项目的评价标准协同一致
  学生的学习发展是各方主体共同努力的结果,这同样适用于测评。教育测评具有鲜明的导向性,不同测评项目只有经充分整合并被视为一个统一的整体后才能实现其潜力;因此,要充分重视不同测评项目以及同一测评项目各组成要素的协同效用,防止目标导向的彼此抵牾。当前,各学科的纸笔测试正朝着尽量呈现生活中的问题情境,更加注重测试指向的现实意义等方向发展。在日常的教育教学活动中,针对学生丰富和鲜活的行为表现,需进一步增进教师间的协作,尽量采用一致的测评标准,这种专业合作和协同对测评潜在功用的发挥至关重要。
  在当前深化教育评价改革的时代背景下,预计各地将出台涵盖结果评价、过程评价、增值评价和综合评价的测评政策,要特别注意不同测评项目间的协同一致。OECD指出,尽管各国国情有较大差异,传统也各不相同;但是,有一个共同的政策侧重点,即在测评框架内视协同效应(synergies)为各类测评项目及教育改革方案设计的根本着力点,强调用整体的方法建立一个统一的评估和测评框架,避免重复,防止目标不一致[10]22。概而言之,对学生的测评,对教师和学校领导的考核,对学校和教育系统的评估,等等,不同类别的测评项目必须在目标及标准上协同一致,激励相容。


2.5 原则5:让学生知晓评价标准
  评价是基于标准和准则作出判断的过程。测评标准与测评活动及任务紧密相关,测评标准内嵌着对学生的学习期望,学生有必要清楚地知晓学习的目标是什么,以及如何证明自己掌握了这些目标,这是学习发展的“脚手架”。发展与教师大体一致的质量观念是学生取得进步的必要条件[14]。教师在编制教学计划的同时进行测评设计,每项测评活动与任务都应附有明确界定的评价标准,并在学期开始时有效地传递给学生,让学生知晓测评的目的和评价标准。有效的标准应该与学习目标高度一致,同时清晰、明确、合理、详细且透明、公平无偏见、易于学生理解和交流[15]。将好的学生作业和差的学生作业作为样板和示范是一种实用且高效的评价策略,可以使学生准确地把握评价标准[16]49-53
  我国颁布的2017年版普通高中各学科课程标准,在原有内容标准的基础上,增加“学业质量标准”,明确学生完成学科学习任务后各学科核心素养应该达到的水平[17]。教师可参照这一框架制定测评标准,在征求学生意见的基础上,调整、补充、优化标准,经研讨形成学生理解和认同的评价标准。对于某些测评项目,还可以让学生参与评价标准的制定。让学生知晓评价标准,还有助于防范教师在测评时可能出现的实质性疏忽或错误。


2.6 原则6:学习过程中持续测评学生
  从教学目标达成的角度看,由于教与学是持续发生的;因此,在学习过程中应持续测评学生的学习状况,以便学生出现学习困难时能够得到切实的帮助。持续测评学生可以及时识别潜在的问题,并在此基础上向学生提供反馈和鼓励。泰勒指出,不能仅在教学结束时对学生进行测验,要了解学生的学习变化,必须先在早期做一次评估,再在后期做几次评估,才能确定所发生的变化[3]86。此外,从“作为学习的测评”的角度看,测评本身亦是线索驱动的认知搜索和知识重构的过程,是有效学习的重要组成。
  美国顶尖一流大学在持续测评学生方面的经验值得借鉴:这些大学为每门大课组织庞大的教授—助教—作业批改者体系,布置大量作业习题并对习题精心分类;除正课外,要求学生必须上一周2次的小班习题课(由助教上),课堂上常有各种小测验(计入最后成绩);教授和助教为学生提供很多课外答疑时间;学生间还会组织“解题班”“学习班”等;全体学生必须参加的大考试每学期(约12周)有3~4次[18]。与之相比,我国的高等院校每学期(约18周)一般只安排期中、期末1~2次考试,教师通常根据学生一门课程期中和/或期末测试成绩作出最终判断。整个学期内为学生分配一系列测评任务是强化过程评价、提升课业挑战度的关键举措。不少教师尚未意识到持续测评对有效学习的重要价值,也有教师和管理者认为频繁的测评不切实际,会显著增加授课教师的负担,解决的思路是在教学与学习中嵌入测评任务,让测评成为教学活动和学习过程的一部分,同时尝试依托助教以及在读研究生的力量。


2.7 原则7:允许学生参与测评过程
  学生的学习与发展状态是教育测评的重心,测试与评价的根本目的是促进学生更好地学习。“为了学习的测评”“作为学习的测评”强调将学习成效的评价责任部分让渡给学习者,学生被视为测评的局内人而不是局外人,有机会对自己和同伴的学习作出判断。良好的自我评价和同伴评价能提供宝贵的学习经验并支持终身学习,同伴互评的合作学习能丰富学习体验,使学生的合作交流能力和思辨能力得到提升,促进学生高阶思维和元认知能力的发展。“作为学习的测评”的最终目标还在于使学生学会评价,让学生成为自己的最好评价者[19]。根据自我评价及同伴评价的结果,学生可以确定现有学习状态与既定学习目标之间的差距,借助反馈信息不断调整以促进自身对学习的理解。Jan Chappuis提出,所有评价策略的落实均需要教师引导学生参与到评价中来[16]1
  学生参与测评的过程包括:确定测评方法与标准,选择和收集与测评标准相匹配的证据,判断证据与标准的匹配程度,得出评价结论。允许学生参与测评过程强调的是学生在学习中所承担的主体角色,学生是学习状态的分析员、学习过程的监控者和学习活动的负责人,教师要娴熟地扮演指导者、示范者和合作者的角色,及时给予学生改进建议。


2.8 原则8:分析与报告学生的学习结果
  分析与报告学生在测试和评价任务上的表现,对学生的作答结果和任务完成作出准确解释有助于确认教与学需要改进的领域,这不仅能启迪教师的教和学生的学,也是避免陷入“仪式性评价”局面的抓手。分析与报告学生学习结果的思路主要有:1)常模参照,将学生的表现与常模进行比较,以确认学生在团体中的相对位次;2)标准参照,将学生的表现与预先确立的标准进行比较,分析学生是否达到标准,着重报告学生对学习目标或内容的掌握;3)增值参照,将学生经过一段时间学习后的表现与学习前的表现进行比较,着重报告学生学习的进步状况。
  在分析和报告学生的学习结果时,教师可以考虑采用定性的而不是单一的分数,综合报告学生所表现出的努力状态,学习态度和习惯,个性和成就水平,以及其他可能助力或阻碍学习的相关信息。教师也可以通过学生对评价活动的参与,有意识地引导学生学会区分客观事实、主观意见、价值判断及臆测之间的差异,使学生从被动的被分析对象和评价结果的接收者转为学习结果的分析者和解释者。这个环节需要密切关注学生对这些信息的理解和接受度。通过聚焦对测评数据和结果的分析解释,以适度透明化的形式向学生、家长提供学生学习成就的证据,可以减少盲目比较,助力学生自身的成长和发展。


2.9 原则9:提供反馈以促进学生的学习
  学生评价自身学习、识别差距进行改进,离不开教师和同伴的反馈。提供反馈以激发和催化学生的学习反应是学习过程的基础。反馈有评价性反馈和描述性反馈,前者通常会告知学生与他人或某个标准相比较的表现水平,后者则包括学生学习状态的描述以及后续改进的建议等。传统的测评反馈主要是评价性反馈,以分数和排名呈现,这一常模参照视角下的反馈,其核心功能是帮助教师和学生把握当前的相对位次,建立起竞争意义上的水平认知;但是,分数和排名难以说明学生在多大程度以及在哪些方面达成了学习目标,也难以提供如何提高改进等信息。因此,提供及时、全面的反馈对学生学习的调控和支持非常重要,教师应持续地向学生和家长提供涉及学生学业表现、需要改进的方面、途径和策略等方面的信息。
  给予反馈并不直接带来进步,基于反馈采取行动才能进步。教育评价除关注是否为学生提供反馈、是否考虑到相关改进建议如何与学生的学习目标和后续的行动相结合外,还应更加关注反馈能否被学生理解、内化并加以运用,更加关注教学中是否为学生创造出根据反馈建议采取行动的机会。这就要求反馈的内容更加侧重于学生任务的完成状况及其改进上,反馈的形式要从教师单向的“独白式反馈”走向师生多次交互的“对话式反馈”,比如:先由学生阐述自己的问题和需要的帮助;教师和同伴针对学生的疑问和需求给出反馈意见,并通过教师提供范例、同伴帮助解读等方法促进学生理解;收到反馈后,学生表述对这些反馈的理解,以便教师和同伴判断其是否全面准确地理解了反馈[20]。反馈过程中尤其要引导学生基于反馈信息,自主制订下一阶段的学习计划,并自我监督和调整自己的学习活动[20]


  在我国,教育评价改革是块“硬骨头”,要啃下来并非易事。《方案》的推出为“以学生学习为本的测评”及测评有效性原则的应用、检验及发展带来了发展契机,这同时也是一个充满挑战的开拓之旅。期待测评学界及一线教师通过对有效测评进一步的探索,切实促进学生更好地学习。



相关文章



●  “教育评价改革研究”系列文章

●  周光礼, 袁晓萍. 聚焦“四个评价” 深化教育评价机制改革[J]. 中国考试, 2020(8): 1-5.

●  张楠, 宋乃庆, 申仁洪. 新时代教育评价改革的价值意蕴与实践路径[J]. 中国考试, 2020(8): 6-10.

●  张志勇, 杨玉春. 综合评价是考试招生制度改革的根本方向[J]. 中国考试, 2020(8): 11-15.

●  刘学智, 田雪. 新时代基础教育评价改革的路向转变[J]. 中国考试, 2020(8): 16-19.

●  许海霞, 王蕊, 马陆亭. 教育评价改革的几个关键问题[J]. 中国考试, 2020(8): 20-23.

●  刘海峰, 李木洲. 构建“四位一体”功能互补的教育评价新体系[J]. 中国考试, 2020(9): 1-4.

●  何莲珍. 以语言评价专业化建设推动教育评价改革[J]. 中国考试, 2020(9): 5-9.

●  雷新勇. 关于教育评价改革的若干思考[J]. 中国考试, 2020(9): 10-14.

●  朱立明, 宋乃庆, 罗琳, 等. 新时代教育评价改革的思考[J]. 中国考试, 2020(9): 15-19.






您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存