李勉:基础教育评估监测: 教育督导体系建设的新领域和新挑战
原文刊载于《中国考试》2021年第5期第48—55页。
作者
李勉,北京师范大学中国基础教育质量监测协同创新中心副教授。
摘要
评估监测是新时代教育督导体系中的重要组成部分。将评估监测纳入教育督导体系,有利于加强教育督导对教育质量的关注,有利于提升教育督导工作的专业化水平,也有利于提高教育督导机制的开放性。我国基础教育评估监测已取得了一定的进展,但仍存在评估监测的理念认识有偏差、组织管理多头交叉、技术方法单一、结果没有得到充分应用等问题。改进基础教育评估监测,需要:1)明确评估监测的功能定位,区别评估监测与选拔性考试的不同;2)建立由教育督导部门统一归口管理、多方参与的组织机制,厘清国家、省(自治区、直辖市)、地(市)、区(县)各级评估监测机构的职能;3)加强评估监测的基础研究,促进评估监测技术方法的升级换代;4)加强评估监测结果应用的制度建设和能力建设,强化基于评估监测结果的整改与问责。
关键词
教育质量监测;教育督导;评估监测;教育评价
正文
2020年2月,中共中央办公厅、国务院办公厅印发《关于深化新时代教育督导体制机制改革的意见》(以下简称《意见》)。《意见》从督政、督学、评估监测3个方面明确了教育督导体制机制改革的目标和路线,是新时代教育督导工作总的指导和遵循。其中,在评估监测方面提出,要建立教育督导部门统一归口管理、多方参与的教育评估监测机制,为改善教育管理、优化教育决策、指导教育工作提供科学依据[1]。这是我国从国家层面首次通过文件的形式明确评估监测在教育督导体系中的重要地位,评估监测将与督政、督学并驾齐驱,成为教育督导行使职能的重要方面。为此,有必要对我国教育督导体系中的评估监测进行系统性分析,为进一步加强评估监测建设、促进教育督导功能的发挥提供参考。
1
评估监测在教育督导体系中的价值与作用
评估监测是指以预定教育目标为依据,通过对各种活动、措施、环境、资源等过程要素状态信息的持续收集、动态跟踪、客观描述与及时反馈,对教育活动是否在按照预定计划执行、向预定目标靠近等运行轨迹作出监控、预警和修正,从而确保有效实现教育目标的活动[2]。《意见》中的评估监测包括对不同学段的评估监测,如幼儿园办园行为评估、义务教育各学科学习质量监测、高等教育评估、博士硕士学位论文抽检等。因不同学段的评估监测有较大差异,为加强分析的针对性,本文仅就基础教育阶段的评估监测进行分析。评估监测在教育督导体系中的价值与作用主要表现在以下3个方面。
第一,将评估监测纳入督导体系有利于加强督导工作对教育质量的关注。很长一段时间以来,我国教育督导的重点在于政府投入、学校硬件、师资数量、学生入学率、巩固率等方面,旨在监督和推动各级政府重视学校办学条件的改善、保障教育事业的优先发展。随着基础教育进入内涵式发展阶段,质量和均衡成为基础教育发展的两大议题,教育督导工作也应据此开展。将评估监测纳入督导体系有利于加强教育督导对教育质量的关注,使得教育督导的关注领域拓展至学生发展状况、教师专业素养、学校管理水平等方面。通过开展评估监测,全面掌握教育质量的数据信息,分析国家和区域教育质量状况中的优势和薄弱点,揭示客观教育教学规律,有助于提高督导工作的精准度和有效性,为改善教育管理、优化教育决策提供依据和参考。
第二,将评估监测纳入督导体系有利于提升督导工作的专业化水平。教育督导工作有别于一般行政工作的特点之一是其专业性;但在部分地区,教育督导工作的开展主要还是依靠政府的行政权力而非专业权威,直接导致了督导工作质量不高,难以对实践工作产生有效的指导作用[3]。在教育治理体系现代化建设的宏观布局下,要真正发挥教育督导的价值和作用,就要促进教育督导从行政型向专业型发展。将评估监测纳入教育督导体系,能够加强教育统计、测量、评价在督导工作中的应用,提高督导手段的科学性,同时还有利于加强教育督导队伍建设。当前,很多省、地(市)、区(县)都通过不同形式建立了评估监测机构、组建了评估监测队伍,其中相当一部分工作人员具有教育统计与测量、教育评价等专业背景。按照督政、督学、评估监测“三位一体”教育督导体系构建的要求,评估监测队伍也应该成为教育督导队伍的重要组成部分,这能进一步丰富督导队伍的专业背景和人员类型,有助于提升整个督导队伍的专业化水平。
第三,将评估监测纳入督导体系有利于提高督导机制的开放性。很长一段时间以来,督导部门都是作为教育行政机构的一个内设部门存在,“督导体系与行政体系不分、监督乏力”[4]是让教育督导饱受诟病的地方。与此同时,我国第三方测评机构及相关社会组织的发展起步相对较晚,加之多元主体参与教育督导存在制度性壁垒,由政府主导的教育督导机制运行惯性仍较强[5],在客观上造成了教育督导相对封闭的局面。在这种体制下,教育督导的公信度和权威性难以得到社会认可。将评估监测纳入教育督导体系,建立教育督导部门统一归口管理、多方参与的评估监测机制,是提高督导机制开放性的重要渠道,有助于突破政府系统内部评估的局限,增强教育督导的公信力。目前,我国部分地区已经采取了政府购买服务的方式,委托第三方评估监测机构独立开展教育评估监测并发布相关结果和报告,甚至还将评估监测结果作为督政、督学的重要依据。这对提高教育督导的开放性、增强评估监测结果的公信力起到了重要的推动作用。
2
基础教育评估监测面临的问题与挑战
2015年,国务院教育督导委员会办公室印发《国家义务教育质量监测方案》,标志着我国国家义务教育质量监测制度建立,同时也标志着评估监测作为教育督导体系的组成部分开始运行。与此同时,地方评估监测实践也随之兴起。据统计,我国目前已有28个省(自治区、直辖市)、28个地(市)、90余个区(县)成立了本级评估监测机构,形成了“以机构建立带动工作发展”的体系建设思路[6],相当一部分地区建立了面向本地区的教育评估监测制度,并开展了将监测结果应用于教育教学改进的实践探索。我国在教育特别是义务教育评估监测方面有很大进展,但是还面临一系列问题和挑战。
2.1 评估监测的理念认识存在偏差,以评估监测之名开展统考统测的做法仍然存在
近年来随着国家层面评估监测制度的建立,不少地方也开始了针对本地区的评估监测探索实践。然而,相当部分地区关于评估监测的理念认识存在偏差,以评估监测之名开展统考统测的做法并不少见。具体而言,主要表现在以下3个方面。
一是重学业成绩,轻身心发展。不少地方开展的评估监测只对语文、数学、英语、科学等科目进行测查,而对学生的品德表现、身体素质、心理健康、情感态度、艺术素养等方面则未涉及,关于学生背景信息和教育环境状况的调查也较为薄弱。此类评估监测对学科教学的诊断与指导能起到一定作用,但不利于发挥评估监测对促进学生全面发展的价值导向,也不能全面掌握素质教育的实施状况。
二是重横向对比,轻纵向增值评价。一些省(自治区、直辖市)、地(市)及区(县)层面的评估监测在最终呈现评估监测结果时,将所有学校、班级,甚至学生、教师进行大排队,并公布结果。这种做法没有充分考虑学校和学生自身的基础和背景,不利于调动基础薄弱或生源较差的学校的积极性,甚至还将原本旨在诊断问题、促进改进的评估监测演变成了对学校、学生的高利害测试,很可能导致部分地区、学校的操练应对,从而影响后续评估监测的客观性和真实性。科学、专业的评估监测可以通过锚题设计和等值技术处理,对不同年度的评估监测结果进行纵向追踪对比,从而反映区域、学校教育的变化趋势,但由于相关技术的缺失,这种纵向增值的评估监测在区域层面并不多见。
三是重结果状况,轻原因分析。不少地区和学校仅关注评估监测结果的学业成绩和其他一些关键指标的排名,而对这一结果背后的原因及影响因素则没有给予足够的重视。实际上,要发挥评估监测对于教育教学改进的诊断、指导作用,首先要分析问题及其背后的原因。这既需要对评估监测的数据进行全面分析,找到本区域或学校在教育质量发展中的薄弱点和影响因素,也需要结合教育教学实践经验进行分析,把关注点从教育结果产出拓展至教育过程和教育环境。
2.2 评估监测的组织管理缺乏统筹设计,项目之间重复交叉
我国目前各类教育评估监测项目类型较多,既有来自同一层级不同部门牵头组织的项目,也有来自国家、省(自治区、直辖市)、地(市)、区(县)等不同层级的项目,由于缺乏统筹规划,造成了评估监测组织管理多头、评估内容重复交叉的局面。
从横向来看,各类评估监测缺少归口管理,教育督导部门、基础教育管理部门、教育教学研究机构等均在不同程度上行使着评估监测的职能。在教育系统内部,不同部门(处室、科室)根据自身工作需求开展了不同类型的评估监测,如义务教育质量监测、教育质量综合评价、素质教育督导评估、学校标准化建设监测、教育现代化建设监测、课程教学诊断评估等。由于没有进行统一、科学的规划和管理,不同评估监测类型和项目在内容及指标上存在交叉、重叠的地方,且评估数据不能共享,导致数据重复收集,给学校增加了负担。在教育系统之外,还有卫生、食品、安全、消防、应急管理、城管等相关部门对学校开展的各种专项评估监测,这些项目由于缺乏归口管理和统筹,评估主体各自为阵,评估任务往往呈现出多、散、急的特点,在一定程度上对学校正常教育教学工作造成了干扰。
纵向来看,由于国家、省(自治区、直辖市)、地(市)、区(县)不同层级的评估监测职能定位不够清晰,导致在实践中出现了种种问题:一些省份监测的学科内容与国家监测相同,其得到的结果与国家监测也大体相似,造成了资源的浪费;一些地区本身并不具备开展监测的力量和条件,其监测工具还未达到统计测量学的标准和要求,但也贸然照搬“国际惯例”“国家标准”,单纯为监测而监测;还有的地区对国家、省级监测发现的问题并不重视,未进行认真分析,更未采取措施,却一味开展区本化甚至校本化监测,不仅未起到实际作用,还大大增加了学校负担。
2.3 评估监测内容相对局限,技术方法单一
尽管经过一些年的探索实践,我国教育评估监测取得了突出进展,但在评估内容设计、技术方法等方面还存在比较大的提升空间。
一是评估监测内容主要围绕学科课程展开,较少测查学生适应社会发展需要的素养和能力。我国当前的评估监测内容主要围绕学校课程教学科目,对于了解学生对照课程标准的达成度及教育教学实施状况具有一定的参考作用。但是,未来社会更需要的是,学生在接受过教育之后表现出来的整体性的、跨学科性的、可迁移性的综合素质和能力(如学生的审辨思维、问题解决能力、创新能力等),因此更需要对这些方面进行评估监测[7]。这既是落实国家关于立德树人根本任务的使命需求,也是国际教育测评的重要发展趋势。未来的评估监测有必要围绕核心素养和关键能力开发相应的测评工具和测评方法,加强监测内容设计的前瞻性和全面性。
二是评估监测方式较为单一,缺少信息技术和多元化测评技术的应用。总体而言,目前评估监测以纸笔测试和问卷调查为主。纸笔测试在测查学生对知识技能的掌握方面有很大优势,但对了解学生的高阶思维能力、合作能力、问题解决能力、沟通能力等有较大的局限性。PISA等国际大型教育质量监测已采用计算机测试代替纸笔测试,并应用了自适应技术、“代理人”设计[8]等信息技术手段开展测评,值得我国在开展评估监测时加以借鉴。此外,目前国内开展的评估监测以量化测评方式为主,缺少质性数据信息,如何借助综合素质评价等其他评价数据弥补纯量化数据的缺陷,增强评估监测数据的立体化[9],也值得深入研究。
三是评估监测设计以采集横断面数据为主,缺少纵向追踪设计的评估监测。目前我国教育评估监测项目主要是针对特定学生群体的抽样监测,属于学生群体发展状况的横断面数据,难以结合学生的成长教育环境对学生的发展轨迹进行立体、全面的刻画。纵向追踪性设计能较好地弥补这一缺陷,其通过对同一个学生群体及其成长教育环境的持续追踪,精细反映学生的发展轨迹,并就学生发展结果与教育环境之间因果关系进行解释。美国国家教育进展评估项目(NAEP)除国家、州级层面常规评估监测外,还专门设计了长期趋势评估项目,该项目每4年开展1次,目的在于了解全国9岁、13岁和17岁青少年的知识与技能水平,掌握基础教育质量的发展趋势[10]。该评估框架不会随着课程内容、教学方式的变化而变化,从而能实现评估结果的纵向可比性。
2.4 评估监测结果应用程度有限,对教育决策和教育教学改进的作用没有得到充分彰显
评估监测结果的应用程度和应用范围是决定评估监测的价值能否充分显现的重要因素。尽管我国部分地区在评估监测结果应用方面已经积累了一些经验,但总体而言,监测结果应用的制度、机制及相关人员开展结果应用的能力仍然存在一些缺陷。
一是缺乏强有力的制度约束。总体而言,我国目前并没有落实评估监测结果应用的制度。一些评估监测结果反馈以后,并没有对开展整改的时限和复查时要达到的标准提出明确要求,从而在一定程度上导致了整改力度不够。更为重要的是,由于缺少关于对相应责任人的约谈、通报、问责、社会监督等制度约束,导致评估监测结果无法从根本上得到重视,评估监测中反映出来的问题无法得到根本解决。这也正是《意见》针对的痛点问题,需通过进一步深化教育督导问责机制改革加以解决。
二是缺乏清晰的分工协作机制。评估监测结果的应用需要多个部门协同联动,督导部门牵头负责评估监测的结果反馈与解读,相关行政部门、业务部门甚至中小学校应该根据责任分工,各自认领评估监测中反映的问题并制定整改方案,最后由督导部门对整改效果进行复查。然而,在实际工作中,很多地方对基于评估监测结果开展改进的主体责任认识不清,所有改进任务仍交由督导部门承担,并没有将其传达到承担相应职责的行政部门或业务部门,评估监测结果也就难以为现实教育工作带来改观。
三是缺乏专业的培训指导。对于绝大部分教育行政、教研、教师、校长甚至相当部分的科研人员来说,评估监测是一个较新的领域,他们自身并不一定具备教育测量与评价的专业知识,能否读懂评估监测的数据结果、能否从数据中发现教育教学中存在的问题并分析原因,成为制约评估监测结果应用的一个重要方面。在这种情况下,评估监测的培训和结果应用指导就显得非常重要。实际上,由于一些评估监测工作缺乏系统性、延续性,相关组织者往往只是将之作为一项任务来完成,评估监测结束即宣告任务完成,评估监测的目的、方法等前期宣传和介绍不够,评估监测结果的解读和说明也不充分,由此使评估监测结果的应用范畴受到较大局限。
3
加强基础教育评估监测的思考与建议
基于以上分析,笔者就如何加强基础教育评估监测、完善教育督导体系提出以下思考与建议。
3.1 统一理念认识,明确评估监测的功能定位,注重区分、宣传评估监测与选拔性考试的不同
评估监测在教育领域还属于新生事物,明确评估监测在教育治理体系中的功能和定位,提高教育系统内外对评估监测的认知度和认可度,是评估监测面临的重要课题。作为教育督导体系的3大组成部分之一,评估监测在整个教育治理体系中应当发挥引领、诊断、咨询和督促的作用。“引领”是指评估监测的内容应该体现对教育发展的导向作用,要能反映党和国家各项教育方针政策的落实情况,尤其要对当前教育存在的热点、难点问题进行评估监测。“诊断”是指通过比照国家相关政策标准及同类地区、学校的发展状况水平,找到本地区、本学校的薄弱点,为教育教学实践改进提供参考。“咨询”是指将评估监测结果作为政府决策的参考和依据,对相关政策的出台发挥咨询作用。“督促”是指通过建立评估监测结果公布及与之配套的整改、复查、约谈、问责等一系列制度,督促各级教育行政部门和学校尊重教育规律、规范办学。
在开展评估监测的理念宣传过程中,要特别明确评估监测与传统考试评价的区别[11]。与传统考试评价相比,评估监测的专业内涵主要体现于:在评估目的上,评估监测重在对区域整体教育状况的问题诊断和成效检验,而非对学校、学生个体的甄别和选拔;在评估内容上,评估监测关注教育发展的全方位、全过程,尤其注重从教育结果产出的角度对学生德智体美劳各方面的发展状况进行评估,而非只限于学业成绩;在评估方式上,除判定结果外,评估监测更加强调归因分析,而非只关注目前所处水平和横向排名;在评估结果应用上,评估监测强调措施跟进和改进效果,并要对改进效果进行跟踪复查,而非以一次终结性结果而告终。
3.2 建立由教育督导部门统一归口管理、多方参与的组织机制,厘清国家、省(自治区、直辖市)、地(市)、区(县)各级评估监测机构的功能和定位
针对目前评估监测项目繁多、组织多头、交叉重复的状况,应加强顶层设计,明确“管办评分离”的原则,实现教育督导部门的归口管理,同时整合教育协会、学会、教研室及其他具有教育评估监测职能的机构和资源,减少重复交叉和不必要的评估监测项目,提高评估监测的效率和效益。同时出台关于第三方机构参与教育评估监测的制度办法,规范评估监测的开展,提高评估监测工作的专业性和公信力。
与此同时,要进一步厘清国家、省(自治区、直辖市)、地(市)、区(县)各级评估监测机构的职能定位[12]。国家层面的评估监测重点在于掌握全国教育质量和均衡状况,为国家教育决策提供信息参考。省级层面在配合做好国家监测的同时,可以错开国家监测的学科和领域,根据本省的政策和实践需求开展一些专项监测。鉴于评估监测工作的专业性和技术性,建议地(市)、区(县)层面将主要精力用于国家和省级评估监测结果的应用而非区域化的监测体系建设上,如地(市)层面重点要对所辖区(县)教育发展中存在的问题及原因开展调研、分析,指导区(县)用好监测结果。区(县)层面要加强对本地中小学校的常态分析和观察,帮助明确学校教育教学存在的问题及原因,协同当地教育行政、教研部门制订问题改进清单和方案,并在中小学校督导评估中加强对改进情况的追踪和复核。
3.3 推动评估监测技术方法的升级换代,建立教育督导大数据平台
当前,我国评估监测已经建立了制度框架,也初步探索出了适合我国国情的评估监测程序和方法,下一步的方向是要继续提升评估监测的科学化和专业化水平,促进评估监测技术方法的升级换代。这需要大量的基础性研究工作作为支撑:既包括对新时代背景下教育质量的内涵界定、教育质量关键影响因素模型构建等基本理论研究,也包括人文素养、创新能力、审辨思维等领域的测评工具和方法研究;既包括人机交互测试、自适应测试、实时动态数据采集等基于信息技术和人工智能的新型测评技术研发,也包括将督学入校观察记录、学生档案袋评价等质性评价方法与量化监测相融合的技术研发。这些基础性研究的广度和厚度直接决定了我国评估监测的科学性、精准性和应用性。
在评估监测领域很重要的一个方面是要加强教育督导的信息化,建设教育督导大数据平台,实现数据资源的开放共享和分级使用。这不仅能提高数据使用效率、减少重复性的数据上报,还有利于全面反映教育发展状况、揭示客观教育规律,从而提高督导工作的精准性和针对性。建设教育督导大数据平台,能够实现以下3个方面的互通:一是督政数据、督学数据和评估监测数据的互通。督政数据的主要对象是政府,督学数据的主要对象是学校,评估监测数据的对象既包括政府也包括学校。打通以上3类数据,能使不同来源的数据相互印证,提高督导工作的精准性。二是教育投入数据、教育过程数据和教育结果数据的互通。要将有关教育事业统计数据、教育经费数据、学生学籍信息等督导系统以外的数据纳入教育督导大数据平台,便于全面了解各区域的教育背景状况及教育的投入-产出效益。三是不同年度的数据互通。要对数据平台的框架结构进行整体化设计,使不同年度的指标内容和数据类型保持稳定,以便对各区域、各学校的发展趋势进行追踪分析。
3.4 加强评估监测结果应用的制度建设和能力建设,强化基于评估监测结果的整改与问责
要发挥评估监测的价值和功能,加强评估监测的结果应用是关键。目前大部分评估监测存在结果应用不充分、对教育实践改进的推动作用较为局限等问题,这也是教育督导工作普遍存在的一个共性问题。为此,《意见》对深化教育督导问责机制改革提出了相关要求,主要通过完善报告、反馈、整改、复查、激励、约谈、通报、问责8个方面的制度,强化教育督导的权威性和严肃性。就评估监测的结果应用而言,在进行以上制度建设过程中,还应该特别注意以下3个方面的问题:一是要科学解读结果。要对评估监测结果进行全面、科学的解读,避免只关注学业成绩、忽视课业负担和身心发展,只关注横向排名排队、忽视与自身相比的增值幅度等情况。二是要明确责任主体。评估监测结果反映出的问题往往是系统性的,在整改过程中需要对改进任务进行精细化的切分,明确责任主体,如关于课程设置、教研教学等方面的问题由基教、教研部门负责,有关资源配置、使用效率等方面的问题由计划财务、电教部门负责,有关师资配备、人员培训等方面的问题由人事部门负责。此外,涉及经费、资源等条件保障方面的问题时,还要提请政府统筹协调。只有通过多个不同科室、部门的协同联动,才能推进相关问题的有效解决。三是加强原因分析。评估监测反映出来的问题只是结果和现象,要从根本上解决问题,还要对结果进行深入分析,必要时还要开展专项调研,使调研的质性分析和量化的评估监测数据相互印证,以此寻求解决问题的途径和方法。
除加强评估监测结果应用的制度建设外,还要加强能力建设,提高教育行政管理人员、校长和教师使用评估监测数据的意识和能力:一方面,要让相关人员明确评估监测数据结果的意义和价值,引导督导人员重视评估监测数据的应用,提升督导人员“用数据说话”的意识;另一方面,要通过相关培训,帮助相关人员读懂评估监测数据和结果,能从中找准教育行政管理和学校教育教学存在的问题,并结合教育教学实践经验进行原因分析,从而采取有针对性的改进措施,推动教育教学工作不断进步。
参考文献
点
更多相关文章
▷ 李政. 我国高职分类考试招生:价值意蕴、问题表征与改革路径[J]. 中国考试, 2021(5): 40-47.
▷ 邱懿, 薛澜. 我国高等职业教育考试招生制度现状、问题与展望[J]. 中国考试, 2021(5): 33-39.
▷ 徐路明. 基于简易式百分等级成长模型的学业增值评价[J]. 中国考试, 2021(3): 9-14.
▷ 关丹丹, 韩宁, 章建石. 立足“四个评价”、服务“五类主体” 进一步深化高考评价改革[J]. 中国考试, 2021(3): 1-8.
▷ 袁建林, 刘红云. 过程性测量: 教育测量的新范式[J]. 中国考试, 2020(12): 1-9.
▷ 秦春华, 姜佳玥. 深化考试招生制度改革 推进新时代教育评价改革[J]. 中国考试, 2020(12): 10-14.
▷ 周洪宇. 深化教育评价改革 加快推进教育现代化——《深化新时代教育评价改革总体方案》解读[J]. 中国考试, 2020(11): 1-8.
▷ 张会杰. “四个评价”落实中的主要矛盾及化解思路[J]. 中国考试, 2020(11): 9-16.
▷ 刘海峰, 李木洲. 构建“四位一体”功能互补的教育评价新体系[J]. 中国考试, 2020(9): 1-4.
▷ 何莲珍. 以语言评价专业化建设推动教育评价改革[J]. 中国考试, 2020(9): 5-9.
▷ 雷新勇. 关于教育评价改革的若干思考[J]. 中国考试, 2020(9): 10-14.
▷ 朱立明, 宋乃庆, 罗琳, 等. 新时代教育评价改革的思考[J]. 中国考试, 2020(9): 15-19.
▷ 张会杰, 赵唯杜. 为了更好地学习:增进教育测评有效性的基本原则[J]. 中国考试, 2020(9): 20-26.
▷ 刘建达, 李雪莲. 英语课程的教学评价改革[J]. 中国考试, 2020(9): 27-31.
▷ 周光礼, 袁晓萍. 聚焦“四个评价” 深化教育评价机制改革[J]. 中国考试, 2020(8): 1-5.
▷ 张楠, 宋乃庆, 申仁洪. 新时代教育评价改革的价值意蕴与实践路径[J]. 中国考试, 2020(8): 6-10.
▷ 张志勇, 杨玉春. 综合评价是考试招生制度改革的根本方向[J]. 中国考试, 2020(8): 11-15.