全文约5300字,阅读需12分钟
导读
部分教师对形成性评价的认识多来源于“望文生义”或“口耳相传”,所以对形成性评价尚存在误解。形成性评价是什么?它具有怎样的特点和价值?
只有在正本清源的基础上清楚回答这些问题,才能让广大教师准确理解形成性评价的概念内涵,把握并在实践中切实贯彻形成性评价的理念精髓。
作者丨赵德成 北京师范大学教育学部教授、博士生导师
来源丨教育科学研究
(一)不能将形成性评价简单等同于表扬,形成性评价首先是教育评价,是考查学习目标达成程度的一种手段形成性评价又称过程性评价,是在教学过程中即时、动态、多次对学生实施的评价,它注重及时反馈,用以强化和改进学生的学习。反馈是形成性评价的重要特点,也是形成性评价发挥作用的重要机制。但值得注意的是,在教学实践中,有些教师将形成性评价简单地等同于表扬,认为重视形成性评价就是在教学过程中对学生的行为表现及时进行反馈,多使用激励性评价语言,多表扬学生,以培养其学习兴趣和激发其学习动机。于是,课堂上教师的表扬声不断,但学生究竟学得怎么样以及学生在达成目标过程中表现出哪些优势与不足,学生和教师却不甚清楚。这是对形成性评价最为常见的一种误解。
现代意义上的教育评价起源于20世纪三四十年代的美国。在“八年研究”(1934-1942)期间,泰勒(Ralph.W.Tyler)提出了广泛而富有创新意义的课程和评价的概念体系。他认为,“课程是一组从多方面设计的学校经验,这些经验的设计和执行是为了帮助学生达到特定的行为结果”,而教育评价作为教学方案的一个部分,“在本质上是确定课程和教学大纲在实际上实现教育目标程度的过程”。基于这种理解,泰勒开发了行为目标评价模式(objectives-based evaluation model),即泰勒模式(Tyler's model)。此后又涌现出CIPP评价模式、目标游离评价模式、外貌模式、应答模式、鉴赏模式、建构主义评价模式等诸多不同的理解和操作模式。这些模式丰富、拓展和深化了人们对教育评价的理解,但它们并没有突破泰勒模式的基本框架,考查目标达成程度仍然是教育评价的核心任务。
形成性评价作为教育评价的下位概念,也是依据评价目标收集有关信息,分析目标达成程度的一种手段。而表扬是教师在通过评价明了学生达成目标程度之后所采取的一种激励措施,它与形成性评价联系紧密,有时甚至同时发生,但从概念上来说两者是两回事,教师必须将两者区分开来,将形成性评价首先看成教育评价,当作一种评判目标达成程度的手段。
(二)将学生平时作业成绩记录下来,并按较高比例折合计入最终分数,还不算是重视形成性评价,形成性评价的本质特点是将所收集的信息用于改进形成性评价关注过程。但在实践中,有些教师认为,只要将学生平时的作业成绩记录下来,并按较高比例将其折合计入最终分数,就是重视形成性评价。这是对形成性评价的又一种常见误解。在这种情况下,教师关注的其实是学生的分数和等级,是学生学习的阶段性结果,而不是对学习过程本身的分析与改进。学生在学习过程中或者说在追求目标达成的过程中究竟有哪些优势与不足,教师如何针对这些过程性特点调整教学活动,教师并不知道,因而通过形成性评价改进教与学的初衷也就无从实现。
从历史角度看,形成性评价最早由美国著名评价专家斯克里文(Michael Scriven)提出。1967年,斯克里文指出评价可以发挥两种功能。一方面,“它在方案持续改进过程中具有重要的作用”,另一方面,“评价过程可以帮助管理者分析方案效果,也就是评判已实施的课程方案是否取得了充分、显著的进展,以证明学校系统各种支出的合理性”。他提议用“形成性评价”和“终结性评价”(summative assessment)来指代评价的两种类型。自此,形成性评价概念被明确提出和使用。
1969年,美国评价专家布卢姆(Benjamin Bloom)将形成性评价移植到学习评价领域。他指出,传统测验主要是对学生进行评判和分类,但实际上学习评价还有另外一种功能。“与此相反的是‘形成性评价’,它可以在教学过程中的任一阶段给学生提供反馈和纠正。这里的形成性评价指的是教师和学生在学习过程中采用简短测验所做的评价。尽管这种简短测验也可以评分,也可以作为评判和分类的依据,但如果它与评分过程分离开来,主要用作教学的辅助与支持,那么它就是一种更为有效的形成性评价。”
形成性评价与终结性评价的区分是相对的。同一个测验既可以是形成性的,也可以是终结性的。布卢姆等人曾经用恒温器和寒暑表来类比形成性评价和终结性评价的区别,他们分析道,“课业教程中所举行的平时测验或者测试,就好像是测量室温的寒暑表。寒暑表可能是十分精确的,然而除了记示或测示室温之外,它对室温起不了什么作用。对比之下,恒温器根据与既定标准温度的关系来记示室温,其后随即制定各种改正程序(即打开或者关闭火炉或者空调机),直到室温达到既定的标准温度为止。因此,寒暑表只能提供信息,而恒温器却能提供反馈与各种改正办法,直到室温达到所需要的温度为止”。终结性评价就像寒暑表,是对学习的评价;而形成性评价是恒温器,是为了改进的评价,它在评判学习有效性的同时对教与学进行及时调整,以确保过程的有效性,促进目标的最终达成。一个学习评价活动,无论在教学过程中的哪个时间点举行、由谁设计、在哪里实施、以什么方式举行以及内容覆盖范围有多大,只要所收集的信息用于诊断、分析和改进教师的教与学生的学,那么,它就是形成性评价。
形成性评价的本质特点是评价所收集的信息主要用于改进。不能将形成性评价简单等同于平时分数记录簿。教师只有把握形成性评价的本质特点,对平时作业进行深入分析,考查学生学习的过程,既看到学生所取得的成就和进展,又客观识别学生距离目标的差距和不足,并在分析原因的基础上调整教与学,将平时作业和测验作为教学改进的基础,它们才真正发挥了形成性评价所应有的作用。
(三)形成性评价关注过程,过程上的改进可以促进结果的达成,形成性评价是改善学生学习、促进学生发展的重要手段与前面两种误解有关,有些教师在实践中“重视”了形成性评价,但由于没有把握形成性评价的本质特点,致使形成性评价的发展性功能没有充分发挥出来,改进教与学的效果不明显,于是又滋生了第三种误解。这种误解认为形成性评价形式大于实质,没有什么实际用处,教师还是要将目光聚焦于结果,直接抓结果。
许多学者曾对形成性评价的价值进行过深入分析,指出形成性评价对学习改进具有实质性的促进作用。这些促进作用主要体现在以下几方面:(1)导向告诉学生什么是最重要的以及哪些需要重点学习,使其将精力集中在重要的目标方面;(2)诊断分析学生达成目标的程度,识别学生表现中的优势与不足,判定学生是否为后续学习奠定了必要的基础;(3)反馈让教师和学生知道学生的成就水平,为教与学的改进提供依据;(4)强化提供机会给学生去练习某些技能和巩固学习成果;(5)激励欣赏学生所取得的成绩和进步,激发学生成就动机,培养自信心和自我效能感;(6)改进基于形成性评价的反馈意见,教师改进教的策略和安排,学生也改进学的策略、技能和安排;(7)长远发展学生基于持续的形成性评价意见,形成个人发展预期和规划,从而影响其后续课程选择乃至职业生涯设计。
研究者还通过准实验研究考查形成性评价对学生学习成就的影响。1991年,美国学者邦吉特·庄斯(Robert L.Bangert-Drowns)等人对29项有关研究进行元分析,探讨在一学期内教师开展形成性测验的次数与学生学习成就改善之间的关系,结果(参见表1)发现:(1)形成性测验从无到有,对学生学习成就产生的影响很大,效果量为0.34,使实验组学生学习成就提升了13.5个百分位;(2)形成性测验的频率与学习成就改善幅度有显著相关,在一个学期中教师开展形成性测验的次数越多,学生学习成就水平提高得越多;(3)当形成性评价的频率增加到一定水平,其效果量的增长会减速。豪斯奈克(John P.Hausknecht)等人于2007年对107项有关准实验研究进行元分析,也发现了相似的结果,这些研究的平均效果量达到0.26,学习成就水平提高了10个百分位。
表1 形成性测验频率与学习成就的关系
由此可见,有效的形成性评价可以通过对教与学的过程的改进,促进教学目标的达成,是改善学生学习、促进学生发展的重要手段。
形成性评价强调“评价最重要的目的不是证明,而是改进”,凸显了评价的发展性价值,在实践中应予大力倡导和推广。在未来的课程和教学实践中,要进一步推动形成性评价的应用,笔者提出如下具体建议。
长期以来,我国教师教育(包括师范生培养和教师继续教育)对教育评价重视相对不够。很多教师没有接受相关培训或者接受的培训较少,导致他们对形成性评价的认识及行为出现偏差。教师教育机构在教师培训中要有意识地加强相关培训,教研部门也要在教研活动中加强相关研讨,使教师准确理解形成性评价的本质,掌握形成性评价的基本策略,提高实施形成性评价的能力。在教学实践中,形成性评价实施的策略有很多,除了单元测验、平时测验和当堂检测等各种大小测验之外,还有分享学习期望、提问、讨论、反馈、自我评价、同伴评价等策略。有效使用这些策略可以引导教与学的过程,使教师和学生知道学习者现在哪里(通过提问、讨论、自我评价和同伴评价)、将朝哪里前进(通过分享学习期望),以及如何抵达那里(通过讨论和反馈)。教师只有抓住形成性评价的本质特征,在实践中切实关注学生学习过程的分析与改进,评价的发展性功能才能落到实处。
20世纪80年代以来,以认知主义学习理论为基础的建构主义学习理论在教学领域逐渐流行起来,并进而推动了教学与评价领域的改革。一些新兴评价方式逐渐被应用。其中最引人注目的是表现性评价(performance assessment)和成长记录袋评价(portfolio assessment)。表现性评价通常要求学生在某种特定的真实或模拟情境中,运用先前所获得的知识完成某项任务或解决某个问题,以考查学生知识与技能的掌握程度,或者问题解决、交流合作和批判性思考等多种复杂能力的发展状况。它强调创设真实情境,即便是模拟情境,也必须能激发学生在真实情境中相似的反应,以考查学生在现实生活中分析问题和解决问题的能力,因此,有人也将它称为真实性评价(authentic assessment)。成长记录袋评价根据教育教学目标收集学生的相关作品及其他有关证据,反映学生在学习与发展过程中的优势与不足,反映学生在达到目标过程中付出的努力与进步,并通过学生的自我反思激励学生取得更高的成就,是一种典型的质性评价方式。两种新兴评价方式都强调在教学实践中自然嵌入评价,关注学生学习与发展的过程,注重教学与评价的有机结合,因而很好地体现了形成性评价的理念,适合教师在形成性评价实践中使用。
形成性评价是教师在教学过程中即时、动态、多次进行的评价,但它绝不是“随便”的评价。教师所采用的各种形成性评价举措都要放在教育评价的框架内予以设计。换言之,形成性评价也必须根据教学目的,依据教学目标设定评价标准,并选择合适的评价任务以收集信息。如果一个形成性测验(如单元测试)的评价任务数量过少或不能很好代表欲评价的范围,它的内容效度(content validity)就不符合测量学要求;如果一个具体的形成性评价任务不能有效激发要评价的关键行为,不能准确反映要评价的目标的达成程度,它的结构效度(construct validity)就无法保证。一旦形成性评价的效度出现问题,基于评价所形成的推论就站不住脚,而基于推论所提出的改进办法也很难奏效。因此,教师在教学实践中要科学应用形成性评价,确保形成性评价的准确性和有效性。
认知诊断理论是新一代心理与教育测量理论的核心,是认知心理学与现代测量学相结合的产物,是当前国外心理测量学领域的一个研究热点。在传统测验形式下,测验结果只能报告学生的一个最终得分,但对于有相关测验得分却具有不同认知能力、或有不同测验得分而具有相同认知能力的现象无法作出合理解释。而新一代测量理论指导下的认知诊断测验(Cognitive Diagnostic Test)成功解决了这一问题。认知心理学关注个体的日常体验如何被转换、加工或者表征为心理表象和声音以及如何存储起来为后来所用。将认知心理学与现代测量学结合起来的认知诊断测验,不仅可以对学生掌握所考查内容的情况作深入描述,而且可以细致诊断学生在认知加工上的优势与不足,对个人当前发展状况进行综合反馈并提供补救建议,从而有针对性地促进学生学习和发展。目前,认知诊断测验主要用在大规模社会性考试中,尽管该测验题目的编制比较复杂,但有些研究者和教育者已经开始尝试将它应用于日常形成性测验(如Jang,2008[19];Li,2011[20])。教师在形成性评价中可以借鉴新一代测量理论,更深入地关注学生的学习过程,细致分析学生的认知表现,发现学生在知识状态和认知结构上的差异,从而有针对性地改进教学。
过程性评价的理念与功能
过程性评价的特征、分类与工具
实施表现性评价需要注意的三点问题
表现性评价的内涵与设计方法
108家学报投稿方式汇总
关于我们:
《高校教学创新100人》是面向高校老师和师范生的知识型媒体,关注教学创新、课程创新、终身学习、混合学习、虚拟教研室等方向,我们致力于“让一部分师生率先触摸教育未来”!
备注“职务+姓名”,加入读者交流群
联系我们:
王慧 主笔&内容老师 微信号:HofMarchbh
张沉浮 主编&总负责人 微信号:chenfu3721