查看原文
其他

范美琴等:“大评价观”视野下的增值评价路径分析

范美琴 中国考试 2022-04-25

作者:

范美琴,江苏省教育考试院,中级经济师;
杨从意,江苏省教育考试院,副研究员;
朱文琪,江苏省教育考试院,中学高级教师。


原文刊载于《中国考试》2017年第12期。

摘要:近30多年逐渐兴起的增值评价,是一种回归评价本质的教育评价方法,有其明显的特点与优势,在教育领域得到了一定程度的应用。当然,作为一种正在发展中的评价方法,自身还存在着一些问题。教育考试“大评价观”的提出恰恰为我们带来了新的发展思路。基于“大评价观”视野建立一个增值评价的立体化路径,从“克服对象单一、扩充评价对象、避免内容窄化、丰富评价内容、突破方法局限、拓展评价方法”等多方面着手,实现评价对象、内容及测量方法的“多维度”,从学生成长的多个过程着手,实现评价的“多流程”,并围绕学生核心素养建立一个长期追踪学生学业表现的立体化评价系统,才能最终体现出质量监测、认知诊断、改进教学等“多功能”和价值,为借助教育评价提升教育质量、促进学生全面发展提供了新的途径。

关键词:增值评价;基础教育;高等教育;大评价观;路径分析


  在我国教育评价领域,中学教育质量大多仍然在用“中高考升学率”“重点率”等指标来考核,甚至热衷于奖励“中高考状元”;大学教育质量评估也往往流于形式,缺乏科学的标准和有力的证据。如果仅仅将教育质量作为静态的研究对象,即使进行再全面的科学分析,对提高教育质量的作用终究有限。评价需要更加贴近教学质量的生成过程,发挥改进而非证明的功能。近30多年逐渐兴起的增值评价方式,是基于过程性和个性化特征的评价方法,是一种回归评价本质的有效方式。教育部考试中心在2017年7月召开的“新高考改革背景下的评价工作”研讨会上,要求专业化考试机构要树立“大评价观”,围绕高考“立德树人、服务选才和引导教学”的核心功能,开展新高考形势下的“大评价”工作,着力体现“三个全”——全维度、全流程和全功能。鉴于此,我们基于“大评价观”视野,开展增值评价有效路径的探索与分析,既适应了时代的要求,又满足了现实的需要,为借助教育评价提升教育质量、促进学生全面发展提供了新的思路和途径。


1

增值评价的概念与特点


  增值评价的概念最早起源于美国。从广义上来讲,“增值”是指一定时期的学校教育对学生成长发展所带来的积极影响,而增值评价即是对这种影响程度的测量。从狭义上来讲,增值评价是指通过追踪研究设计,收集学生多个时间点上的多次学业水平表现,以进步与变化作为评价的核心,对学生自身进行纵向比较,并考虑学校或教师较难控制、对学业水平产生影响的一些因素,考察学校或教师对学生学业水平的“净效应”,从而对学生学业进步情况和学校教育教学质量进行评价。可以说,增值评价是一个立体坐标系统,从经度来讲,可以链接一段时期内纵向的多次学业水平表现;从纬度来讲,可以涵盖影响学生学业水平的多种因素,因而成为一种得以大力提倡的现代教育评价方法。


  相较一般的终结性评价,增值评价具有明显的特点与优势。一是有利于促进关注点的改变,贯彻发展性评价的要求。增值评价既不提倡仅用一次考试成绩对学生进行横向的常模参照比较,也不同于与某一固定标准相比较的标准参照评价,而是从发展性评价的视角,提倡依据学生多次学业水平表现开展纵向比较。这样的评价方式倡导的是与学生自身的发展进行比较,关注的是学生自身的成长和进步,实现的是对学生学习起点、过程及其结果的全过程关注。这有利于引导学校和教师从只关注一次考试结果,到关注学生多次考试的进步,从只关注尖子生,到关注每一个学生的发展,从而将关注点转移到每一个学生的发展、变化和进步上,让学生在与自身的比较中,获得发展与成长的动力。二是有利于促进教学改进,发挥评价的诊断功能。增值评价可以为学校提供纵向或概括或详尽的数据,学校可以从中分析和认识自身的教学质量、发展趋势和优势不足等,作为改善教学管理、提升教学成效的参考和依据之一。增值评价也可以在一定程度上将影响学生学业表现的自身、家庭、学校等因素以及学校依靠自身力量较难控制的一些因素分离出来,找到学校教学管理引起的“净增值”,帮助学校寻找影响学生学业表现的内在动因。三是有利于促进教育公平,发挥评价的激励作用。按照传统的升学率、重点率来评价学校,又不考虑入校时的生源基线水平,一般学校尤其薄弱学校一开始就输在了起跑线上,后续发展得不到认可。而增值评价给各级各类学校划上了一个全新的起跑线,考虑出口、入口的增量,使各类学校之间的比较基于同一标准,更为公平合理,保证了教育评价过程的公平性与客观性。这不仅有利于促进薄弱学校树立发展信心,也有利于敦促重点学校更好地发挥生源优势,体现评价的激励功能。


2

国内有关增值评价的探索与实践


  近年来,增值评价在我国得到了一定程度的探索。学术界涌现了一批实证研究,如边玉芳等基于浙江省金华市 39所高中开展的增值评价、辛涛等对某市 40所高中开展的增值研究、李金波等基于浙江省 544所中学开展的增值研究、章建石基于大学生就读经验和课程学习经验开展的质量增值影响的实证研究。这些研究既有多元线性回归分析,使学业水平的影响因素成为评价对象,又有多水平模型分析,综合考虑影响学业表现的各个层面的因素,分离出教育教学效能的净效应。这些研究使我们在增值评价的技术和成效上取得了一定的突破。教育考试机构也开展了一些试点工程,如国家教育考试评价研究院在云南省、海南省推行的增值评价的探索实践,天津市教育招生考试院建立的面向学校用户的增值评价体系。


  当然,任何评价方法的优势都是相对的。通过实践,我们发现增值评价作为一种新的、正在发展中的评价方法,自身也存在着一些问题。


  第一,关于最佳模型的问题。运用多水平分析模型开展增值评价是一个主流方式。目前有几类多水平模型,这些模型对数据的处理方式,包括使用的统计软件均不同,到底哪一种模型最贴近学生发展等实际,能够科学地分解学生的成绩,尚需作进一步的研究。虽然多水平分析模型的使用极大地推进了增值评价的研究,但统计方法自身也存在对现实世界的解释问题。学生的发展模型到底是否与多水平线性模型相一致,目前还没有更好的办法来证明,这也在一定程度上削弱了该评价方法的应用与推广。因此,如何借助教育统计的相关研究,既能够深入理解教育问题,又能够产生对现实问题的合理解释,成为增值评价研究的一个核心问题。


  第二,关于垂直等值的问题。由于增值评价采取追踪研究设计,因此,存在纵向数据的链接和等值问题,这是增值评价的基础。一方面,不同时间点的测验质量都会影响等值的效果。比如,高中增值评价经常使用的中考、高考测试,由于考试目标、难度要求、成绩分布等都有较大的差异,即使采取再完美的等值技术也会存在误差;另一方面,等值技术本身的发展同样制约等值的效果。目前存在诸多的等值设计、等值模型和等值方法,也存在众多可能导致等值误差的因素,围绕等值问题还有许多问题需要作进一步的探讨和研究。随着高考“一年多考”的实施,研究人员加快了“分数等值”的研究。这一问题的最终解决需要借助教育与心理测量研究的发展。


  第三,关于内容窄化的问题。目前大部分增值评价仍是基于标准化考试成绩的评价模式,即使考试的内容与形式是对学科知识和能力的考查,也不能完全体现学校教育与教学的成效。教育的根本任务是立德树人,学校围绕这一根本任务,为学生提供的是一系列的教育服务,包括教授学科知识与能力、培育学生的健全人格、促进学生的健康成长和社会适应等多个方面,重点是培育学生发展的核心素养。将评价内容仅局限于统考测试科目成绩,不利于引导学校教育,更不利于学生的全面发展。在“大评价观”视野下,学校教育增值究竟该从哪些方面来考察和测量,如何让学生的核心素养在增值评价中体现出来,这些都是值得进行深入探讨的问题。


  第四,关于接受程度的问题。目前普遍推行的终结性评价虽然备受诟病,但并不是所有的学校都排斥,也不是所有学校都接受增值评价。一方面,增值评价技术比较复杂,也比较繁琐,学校教师只有接受专门培训才能读懂评价报告;另一方面,不同层次的学校立场不同。一般学校特别是薄弱学校持欢迎和支持的态度,毕竟在目前传统评价模式下这样的学校没有太多的优势;但对于重点学校来说,生源的先天优势被打破,利益格局受到冲击,因此,一些先期试点省份出现了部分名校抵触的现象。


3

“大评价观”视野下增值评价的路径构建


  尽管增值评价存在一些问题,教育考试“大评价观”的提出恰恰为我们带来了新的发展思路。新高考改革背景下的评价工作要体现“三个全”——全维度、全流程和全功能,增值评价如能够从“多维度、多流程、多功能”的视角重新梳理目前评价工作面临的挑战与争议,构建一条立体化的路径,将对解决目前评价工作存在的问题大有裨益。


3.1 “多维度”视角下的路径分析

  从“多维度”的视角来看,增值评价应包含评价对象的多维、评价内容的多维以及测量方法的多维。具体来说,可从以下3个方面加以努力。


  第一,克服对象单一,扩充评价对象。增值评价的对象不能仅仅局限于某一个群体。比如,学生接受高等教育的成效也许在多年后才能完全显现出来,这就要求我们开展高等教育增值评价时不能仅局限于在校生群体,有可能的话,还要对已经走上工作岗位的校友群体进行某些方面的追踪评价。比如,对基础教育的增值评价不能仅局限于学生群体,教师、家长、同伴甚至社会也都是学生个人能力成长与发展某些方面的见证者,这些群体都应纳入评价对象的范畴。这体现了对评价对象的多维要求。


  第二,避免内容窄化,丰富评价内容。目前增值评价存在内容窄化的问题,成功的教育评价始于评价目的的价值澄清。增值到底该测量哪些方面,需要回归增值评价的最初目的与功用进行探究。增值评价最初起源于美国的学校效能评价,应用于学校问责的主体框架,也就是说,增值评价是用来检验学校教育的教学质量,那么,衡量教育教学质量的核心标准应该是增值评价的主要内容。《国家中长期教育改革和发展规划纲要(2010—2020年)》指出,要把促进人的全面发展、适应社会需要作为衡量教育质量的根本标准。根据这一指导思想,我国学生发展核心素养应运而生,以培养“全面发展的人”为核心,分为文化基础、自主发展、社会参与3个方面,综合表现为人文底蕴、科学精神、学会学习、健康生活、责任当担、实践创新6大素养。根据这一总体框架,进一步提出了针对学生年龄特点的各学段学生的具体表现要求。核心素养实际上就是关于知识、技能、情感、态度、价值观等多方面要求的综合表现。增值评价作为一种发展性评价方法,是建立在符合学校教学实际和动态教学效能基础上的概念,核心指向已经在逐步顺应新的教育质量的衡量标准,发生了从单纯注重学习成绩向学生整体性发展诉求的转变。因此,不能仅仅依据标准化考试成绩的发展变化来定义增值,要立足评价内容的多维要求,建立基于学生核心素养的评价标准,根据核心素养的基本要点开展增值评价,才能真正起到科学检验和评价学校教育教学质量的作用。


  第三,突破方法局限,拓展评价方法。教育增值本身是一个动态的、多维度的活动,因此需要根据不同维度的要素设计不同的方法。从国内外的相关研究来看,增值指标的收集和获取主要有两种方法:一是具有直接性、客观性的学生标准化测试,二是具有间接性、主观性的自陈式量表或自我评价法。两种方法都有其优势与局限。标准化测试因为动用了大量的人力财力,往往质量比较高,具有较高的信度、效度,数据易于收集,也便于不同地区、不同学校的横向比较;缺陷在于对情感、态度、人格等非认知层面的测量几乎无法实现。而自陈式量表或自我评价法最大的亮点在于凸显了对学生主体的关注,将学生的就读经验、学习经历等态度与感受纳入考量范畴,对教学质量的生成进行深度检视,数据更丰富,更贴近教学实际,反映了质量生成的内在特征;主要批评集中在自我评价到底可不可信、自陈式量表的效度如何保证的问题上。因此,我们很难通过单一的评价方式获得准确的增值指标,要聚焦方法的多维。“多法并用”是一种值得提倡的方式。在未来的数据获取过程中,研究者应当努力寻求两种测量方法的相互融合,取长补短,尽可能获得更为全面、客观的数据信息。此外,随着测量技术的不断发展、认识的不断提高、实践的不断深化,增值统计技术中的最佳模型、垂直等值等问题也会得到更为有效的解决。


3.2 “多流程”视角下的路径分析

  从“多流程”的视角看,增值评价应覆盖学生成长的多个过程。既要考察学生目前的学业水平表现,又要向前追溯或向后延伸至多个学期、多个学年的学业水平表现;既可考察学生在中学学习阶段的学业表现,又可考察学生在大学求学阶段的学业表现。值得注意的是,我国的增值评价大部分指向于中学评价,对于大学的增值评价则偏少。当然,相比于中学评价的成绩增值观,大学的增值测量更为复杂。国内知名的本科教学水平评估也主要是考察高校教学的投入等状况,对学生本身发展的关注比较欠缺。目前,我国高等教育改革已进入深水区,如何客观评估高等院校的教育效力,科学地测量高校学生在校期间的学习成效、发展表现及增值情况,是我国高等教育质量保障研究的热点与难点,更是增值评价应该重点拓展的领域。


3.3 “多功能”视角下的路径分析

  从“多功能”的视角看,基于多维度、多流程的增值评价,最终可以体现出多方面的作用和价值。于学校来讲,可以起到教育质量监测、认知诊断、改进教学等多方面的作用;于教育行政部门来讲,可以起到以评促改、以评促教、引领教学的良好作用,对更加有效地进行教育决策、加快教育改革发展等起到促进作用。当然,我们也要解决好增值评价结果合理运用的问题,既要发挥运用考试等各类数据服务教育评价的作用,又要防止出现简单地拿增值结果问责学校的后果。



  综上所述,在目前大力推进义务教育均衡发展、推动普通高中多样化发展、全面提高高等教育质量的时代背景下,在“大评价观”视野下,增值评价为如何评价目前的教育质量、如何借助教育评价促进教育质量的进一步提高,提供了新的思路和途径。借助这一理念,基于学生核心素养建立一个长期追踪学生学业表现的立体评价系统,形成一种全新的立体化评价方法和路径,给教育价值的考量创造了前所未有的可量化的维度,为提高教育质量、促进学生全面发展开拓了全新的进步空间。









您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存