查看原文
其他

教育测评变革的实践探索:指向问题解决过程的测试工具开发

杨磊 吴欣歆 中国教育学刊 2023-06-28
7点击上方蓝字关注我,了解更多内容

本刊刊载之全部论文,从不收取任何版面费、审稿费、编辑费,如有言称收费者,必为假冒。

欢迎投稿→

官方网站:www.jcse.com.cn


作者信息
杨磊/北京师范大学文学院博士研究生;
吴欣歆/北京师范大学文学院研究员,博士生导师。本文摘要
核心素养时代的教育评价追求“教-学-评”一体化设计,共同指向课程目标的达成。分析现有研究成果发现,教学、学习与评价存在断带循环现象,阻碍了三者的有效互动与有机融通。梳理国内外研究结论与实践经验,从测试工具开发角度入手,依托表现性评价理念,构建基于问题解决过程性能力的测试命题模型,立足纸笔测验的工具开发,有助于推进教育测评变革的实践探索。

核心素养时代引领了教育评价范式的变革。新的教育评价范式,厘定了教学、学习、评价三位一体的关系,要求评价镶嵌在教学与学习的进程中,发挥持续监控目标达成情况的作用。从语文学科来看,《普通高中语文课程标准(2017年版2020年修订)》(以下简称“高中课标”)与《义务教育语文课程标准(2022年版)》(以下简称“义教课标”)新增的“学业质量标准”即是“促进教、学、考有机衔接”的印证。从学业水平测试的角度来看,要求开发出符合教育评价范式变革理念的测试工具。本研究综合分析当前教育评价范式转型的现实困境,借鉴教学实践探索的有益经验,吸取“问题解决”与“表现性评价”的优势,拟定开发“指向问题解决过程的测试工具”,以期为促进教育测评变革提供新的实践路径。

一、教育评价范式转型的现实困境

教育评价范式的变革要求教学、学习与评价之间保持高度一致性,并在循环互动关系中实现三者的动态发展。我国教育研究者着眼于教学理论与实践、测试工具开发与结果运用三个方面,力求形成三者的循环互动,促进核心素养背景下的教育教学变革,但从既有研究成果来看,测试研究尚不能满足教学理论与实践研究发展的需求,导致教、学、评陷入断带循环的现实困境。

(一)测评滞后于教学实践探索

目前,基于课程标准的课程改革、育人方式改革与考试内容改革未能同步推进,教学和考试的良性互动仍未形成。对于培育核心素养的教学实践探索深度远超测评核心素养发展的命题实践探索。通过对现有研究的综合分析发现,在教学研究层面,研究者聚焦“单元整体教学”“项目化学习”等新型教学模式,探讨如何采用创新性教学策略实现培养学生核心素养、训练学生思维能力、落实立德树人、促进深度学习等目标。在测试层面,现有研究集中于对学生学科能力的考查、对核心素养落实情况的评估,以及相关能力指标体系模型的建构。

虽然两类研究均呈现出对核心素养培育的重视,但是教学层面的研究已经将核心素养培育理念下沉到具体课堂教学中,探索更为具体可行的素养培育策略。而测评研究仍停留在理论层面,将核心素养作为上位评价目标,以此为依据关照各学科符合核心素养要求的能力指标建构和测评框架拟定,尚未深入分析考查内容维度和命题方法。

(二)评价理念向测试命题实践层面延伸存在障碍

2020年颁布的《中国高考评价体系》在理念上明确了由传统的“知识能力立意”评价向“价值引领,素养导向”评价的方向转变。虽然近年来核心素养、立德树人、关键能力等词语出现频率较高,佐证了测试理念的发展与转变方向,但是深入测试工具开发层面,命题理念仍旧难以下沉到命题实践中。

测试工具开发主要包含测试工具框架的建构和命题策略两个方面。在测试工具框架建构上,研究者聚焦学科能力,探索符合评价变革理念的测试框架,如中学生使用科学证据能力的测评模型、科学有效的表现性评价质量框架等。此类框架以核心价值为引领,强调学科素养导向,以培养关键能力为重点,突出必备知识的基础作用。在命题策略上,研究者从目标导向、情境创设、任务驱动等角度,探索符合课程改革理念发展的命题方式。在命题实践上,情境化试题成为主要的探索方向,创设情境、设计任务,要求学生设计学习方案、完成学习过程,呈现学习结果。遗憾的是,此类探索大多停留在命题形式上,在测评内容和测评理念上仍未突破传统思路的限制。

目前,测试理论层面已经达成共识——测试工具的开发应以评价理念的发展方向为引领,构建符合新型评价理念的测试框架,命制与之相匹配的试题。在命题实践层面,先进测评理念难以下沉到命题实践中,对具体学科知识的考查仍然是测试主体,评价理念向测试命题实践层面延伸存在障碍。

(三)测试结果难以有效反拨教学实践

《深化新时代教育评价改革总体方案》明确指出“要充分发挥教育评价的指挥棒作用”,依据评价结果,对教学活动进行反思和改进,促进教学质量的提升。但在实际教学中,分数、升学、文凭、论文和帽子五项评价要素成为评价的重要指标,消解了测试结果对教学实践的正向引导。如何正确收集、解释和运用量化评价信息成为重要的思考方向。

2018年我国首份《中国义务教育质量监测报告》明确指出义务教育阶段学生学业表现良好,综合应用能力相对薄弱,具体表现在科学探究能力和科学思维能力上。区域基础教育质量监测积累了大量监测数据,如语文学科关注不同区域、城乡、性别等人口学因素影响下学生阅读与写作能力的表现情况,以及认知投入、行为投入、情感投入等心理学表征对学生阅读和写作能力的影响,提出了具有针对性的教学改进建议。在教学实践应用层面,受高利害评价的驱使,诊断性评价结果难以反拨教师的教学行为,导致有结果无改进。

综上,教学实践探索与命题实践探索发展不平衡、测评理念变革与测试工具开发滞后、诊断性测评结果与教学行为转化困难等问题的存在,构成教育评价范式转型的现实困境:教、学、评的发展落差为循环结构构建带来挑战。

二、关注问题解决过程的教学实践特征

在教学实践层面,项目式学习、现象式学习和STEAM教育模式等教学探索,为推进问题解决过程测评工具的开发积累了丰富经验,通过对相关实践案例的分析发现,具有如下几方面特征。

(一)创设学习情境,倡导具身体验

创设真实的学习情境是开展教学的首要环节。情境本质上是指个体在开展社会实践活动时所依赖的社会环境,是人们社会行为产生的具体条件。在教学场域下,情境则起到关联学生学习行为与其发生环境的作用。“高中课标”将情境分为社会生活、个人体验和学科认知三种类型。可见,在学科教学层面,情境不仅要关注外部环境,更要突破“生活环境”的限制,延伸到个体认知和学科认知维度。项目式学习中的“情境”强调项目产生的背景、目的、对象和影响因素,以复杂、综合的要素构成真实或虚拟的情境。现象式学习中的“情境”则强调现象与个人视域、生命进程间的关系,关照学习者自身的先验知识。而以跨学科整合为本质属性的STEAM教育,则以为学习者创设一种隐含多学科内容、复杂问题的情境为基础,提高学习的挑战性与趣味性,从而促进学习者的跨学科学习。

(二)明确驱动问题,构建任务网络

从概念内涵角度来看,项目式学习旨在用真实但结构不良的问题案例来提升学生的学习能力。现象式学习是以真实世界中的现象为学习的起点,着重培养学习者把握现象、理解现象和解释现象的能力。STEAM教育是在复杂问题解决的需求下产生的调用多学科知识与技能混合学习的教学模式。三种教学模式均以问题解决为起点,围绕核心问题构建多个具有鲜明逻辑关系的驱动性学习任务。学习任务的构建首先要满足问题解决的基本需求,任务之间存在多种逻辑关系,具体包含递进式关系、平行式关系和对立式关系。关系间的交织构成了复杂的学习任务网络,学生在完成任务的过程中逐步实现对驱动问题的关照与解决,从中获得学习经验,发展核心素养。

(三)倡导过程性评价,发挥评价反拨效应

2021年印发的《义务教育质量评价指南》指出要“强化过程性评价和发展性评价,有效发挥评价的引导、诊断、改进、激励功能”。三种教学模式最终的落脚点都在形成“项目作品”“学习产品”或“以多种表征方式创造性地呈现学习结果”上。在完成学习任务、解决驱动性问题的关键环节,学生都需要形成具有创造性的学习产品。复杂的学习任务网络赋予了学习产品内部构造蕴含多向度逻辑关系以合理性。每一阶段的学习产品都对下一阶段或最终学习产品的形成提供经验支撑。学生在学习过程中积累的点状学习产品,在评价环节联结为线性评价内容,学习产品的外在表征成为评价的主要着力点,最终实现由教学产品向评价内容的有机转变,促进教、学、评的深度融合,从而有效发挥评价对教学的诊断、引导、改进功能。

(四)开放学习场域,整合学习资源

从真实生活和发展需要角度出发的学习方式的变革,对学生的跨学科学习能力提出了新的要求。在学习资源的开发上,也呈现出鲜明的跨学科整合特征。现象式学习的逻辑起点是“真实世界的现象”,项目式学习和STEAM教育则将跨学科资源整合作为课程实施的关键要素。在生发学习问题现实机制的影响下,单一学科知识难以满足解决复杂社会性问题的需要,跨学科学习资源的开发与整合,为学生深度探究学习问题提供了新的支架和路径。在学生学习的过程中,只有调动多学科资源,在个人、社会、自然的动态平衡中,突破人文、自然、科技等学科壁垒,才能够达到参与实践活动、完成学习任务、解决驱动问题、发展核心素养的学习目标。而开放自主的学习场域为跨学科资源整合提供了时空基础。

三、指向问题解决过程的测评工具开发

教育评价范式的转变呼唤测评工具的变革。本研究结合课程标准中学业质量标准的相关理念,提出“指向问题解决过程”的测评工具开发理念,能够有效弥合测评与教学之间的差距、消解评价理念与命题实践之间的障碍、提升测试结果对教学改进的反拨效应,实现学业质量标准“帮助教师和学生把握教与学的深度和广度,为阶段性评价、学业水平考试和升学考试命题提供重要依据”的目标,促进教、学、评循环结构的建构。

(一)融合问题解决与表现性评价优势开发测评模型

问题解决是指,通过对已有知识经验的重组加工,找到破解问题的方法与途径。表现性评价是在真实或模拟真实的情境中评价学生应用知识解决问题的能力,表现性评价是问题解决能力形成性评价的一种典型方式。本研究融合问题解决与表现性评价两方面优势,提出“基于问题解决过程能力”的测评理念,该理念一方面突破了表现性评价难以通过传统纸笔测试测评的弊端,另一方面将考查“学科能力”细化为考查“学科学习能力”,实现考查能力由点向链的转化。

综合分析关于“问题解决过程”和“表现性评价”的相关研究发现,对于问题解决的过程有多种分类标准。四分法大体可总结为发现问题、分析问题、提出假设和检验假设四个阶段。五分法包含问题发现、问题表述、问题分析、问题解决和问题评价五个阶段。PISA(2003)将问题解决的过程划定为理解问题、描述问题、展示问题、解决问题、反思问题解决方案和交流解决方案六部分。PISA(2015)将问题解决维度发展为探究与理解、表征与系统化、计划与执行、监控与反思。每个环节在逻辑上层层递进,最终形成一个“问题解决循环”。各种划分标准都将问题解决过程归于“问题规划—问题探究—创造解决—反思评价”四个环节。表现性评价则依附于问题解决的具体过程,是基于产品和行为的测量,这种测量需要将特定的知识或技能应用到实际环境或条件中。它更关注学生在完成具体任务过程中的具体表现和理解水平,强调学生在答题时的意义建构。简言之,表现性评价评的是学生执行具体任务的能力和他们在此过程中所做成品的质量。综合上述内容,本研究尝试构建“指向问题解决过程”的测评模型(见图1)。

1 指向问题解决过程的双螺旋结构模型

“义教课标”中明确指出,考试命题要“依据学生在真实情境下解决问题的过程和结果评定其素养水平”并能够通过命题考查“学生在语文学习过程中形成的能力、方法”。由此可以看出,在新一轮课程改革中,测试更加关注三个层面的内容:一是以情境为基础,二是以问题解决过程为线索,三是兼顾能力与素养的考查。学业质量标准对学生核心素养的发展水平、对课程内容的学习程度、对学生学业成就的表现特征均作出了整体性描绘,是考试命题的关键依据。因此,参考“义教课标”中考试命题与学业质量标准的相关要求,“双螺旋结构”以情境为起点,由一条明线和两条暗线组成,明线是学生解决问题的行为过程;暗线是学业质量标准中明确的测评目标的全面达成,具体表征为学生在完成以阅读与鉴赏、表达与交流、梳理与探究等语文实践活动为代表的问题解决过程中,表现出来的学科知识、能力和发展的学科核心素养两方面。“问题解决”链条构成了评价的内容维度,是能力与素养的载体;“表现性评价”链条则构成了评价的形式维度,规定了评价的方式与角度。双链螺旋上升的交叉处成为观测学生能力与发展水平的平台,即以表现性评价的方式,观照问题解决过程中的素养表现以及生成的产品质量。综上所述,结合模型的具体属性,本研究尝试构建“指向问题解决过程”的能力要素(见表1)。

表1 指向问题解决过程的能力指标要素

(二)依据测评模型建构命题框架

依据“双螺旋结构模型”和“能力指标要素”,以创设问题情境为命题的逻辑起点,以问题的解决过程为行为链条,采用标识性任务构建产品化成果的方式,搭建表现性评价的测量观测平台,拟定“指向问题解决过程的命题框架”(见图2),以期为命制符合“问题解决过程”的试题提供更为直观的参考。

图2 指向问题解决过程的命题框架

此命题框架是对“双螺旋结构模型”的具体化呈现。第一个层次关注的是问题解决过程试卷的宏观架构层面,分为问题规划和问题探究两个维度。第二个层次关注的是测试要素的组织层面。在问题规划维度中,学生需要依据问题情境,发现探究性问题,并自主设计问题解决方案,在此过程中实现对能力要素1~3的考查。在问题探究过程中,学生要依据问题解决方案,完成一系列测试任务,最终达成解决问题的目的。在上述过程中完成对能力要素5~8的考查。第三个层次是学习产品层,学生在解决问题的过程中,每一个环节都会形成特定的学习产品,这些产品就成为观察学生能力与素养发展水平的重要载体,并以能力要素9~10的相关要求评估产品质量。第四个层次是监控调节层,学生在完成产品后,需要回顾反思解决问题的过程以及生成产品的质量,并将回顾反思的经验作用于前续作答中,对作答结果进行调节与修正。从命题操作层面来看,使用此命题框架需要着重关注以下三方面关键特征。

1.创设结构不良的问题情境

从情境真实性的角度关照,结构不良的问题情境更符合真实生活的基本要求,更能够考查学生问题解决的过程性能力。结构不良的问题情境赋予了学生选取多样化探究起点的可能,依据情境中的复杂要素,学生在融合创生中明确研究问题,规划研究方案。

2.设计标识性测试任务

标识性测试任务是指在学生探究问题解决的过程中自然形成的任务,其特点表现为两方面:一是非特意性,测试任务的设计要符合问题探究的基本过程,避免“为了设计而设计”的现象;二是阶段性,测试任务是问题解决过程某一阶段的完整环节,具备“设定问题—分析问题—解决问题”的基本行为逻辑。任务与任务之间还要呈现典型的、符合问题解决过程的逻辑关系。前一个任务要为后一个任务的达成提供经验支撑,后一个任务的完成要实现对前一个任务的反思与监控。学生在问题解决的过程中,要在任务与任务之间反复“跳跃”,在知识与能力的复现和监控中达成素养测评的目的。

3.生成产品化学习成果

测量的本质是将可观测证据与所测能力建立联系。学习产品是学生完成阶段性测试任务,实现问题解决全过程的可视化成果,是各级能力要素的外显性依附,是表现性评价在纸笔测试上的主要着力点。学习产品的产生路径与标识性任务的完成路径保持高度一致,每一项测试任务都应以生成产品化成果为终点,在经历问题解决全过程后,也要以产品化成果作为衡量过程性能力的主要标志。因此,对于学习产品的设计与衡量要以标识性任务为逻辑参照,并在此基础上作出创新性表达与尝试。

以此命题框架为依据开发的测试工具,在G省、X市、Z市等地区初、高中开展工具检验。检验结果如表2所示。

表2 模型拟合指数

从模型的拟合指数来看,CFITLI值均大于0.90RMSEA均小于0.05,说明数据和模型拟合度良好,能够证明测评框架的合理性。

(三)指向问题解决过程的评分设计

《义务教育课程方案(2022年版)》中指出评价要“注重对学习过程的观察、记录与分析,倡导基于证据的评价”。“指向问题解决过程”的测评模型的底层逻辑强调,对于学生能力和素养的评估不仅源于学生的作答结果,也隐于其作答过程。而学生对于情境的理解、对问题的规划以及对于问题的探究路径存在个性化差异,导致难以用预设水平取代学生实际作答水平。因此,要想准确厘定学生能力与素养的发展水平,就需要首先解决预设水平与实际水平之间的差异化问题。梅斯雷弗提出的ECD设计强调以证据为中心开展评价设计,为实现准确评估学生在问题解决过程中表现出的能力与素养,提供了工具支持。

图3呈现的是“基于问题解决过程能力”测评的评分设计思路,分为自上而下的“先验性等级”划分和自下而上的“实际作答等级”划分两部分。“先验性等级”以课程标准中学业质量标准的相关要求为依据,建立符合学科核心素养和能力发展要求的等级划分框架;“实际作答等级”以学生生成的产品和创生性问题解决过程为参考,根据学生的实际情况划归能力等级。二者呈现互补性的动态平衡关系,综合以学业质量标准为代表的“预设等级”与学生作答实际情况,拟合成 “问题解决过程”等级评定框架。

图3 指向问题解决过程的评分设计思路

指向问题解决过程性能力的测试工具已经运用于不同学段不同区域的语文学业质量测试,测试数据良好,数据驱动下的教学变革受到普遍认可。实践证明,指向问题解决过程的测评理念与“创设真实而富有意义的学习情境,凸显语文学习的实践性”的教学建议具有一致的观点与起点,有效解决了测评滞后于教学实践的困境;指向问题解决过程的命题框架将命题理念合理下沉到命题实践层面,弥合了命题理念与工具开发之间的差距;表现性评价在指向问题解决过程的测评理念中的应用以及自上而下与自下而上的评分设计思路,为测评结果有效反拨教与学行为创造可能。因此,基于问题解决过程性能力的测试工具能够消解测评理念、教学实践与测评结果运用之间的矛盾,促进教、学、评的连续性循环,为教与学方式的变革、数据反拨课堂教学的发展提供参考依据,实现对学生核心素养的考查与评估。

(本文编辑:蒲丽芳)





本文内容刊登于《中国教育学刊》2023年第一期,内容以正式出版物为准,图片来源于包图网,仅作分享交流用。著作权归原作者所有,若转载请按以下格式注明来源↓↓↓
本文转自微信公众号“中国教育学刊(ID:zgjyxk)‘’



《中国教育学刊》是由教育部主管、中国教育学会主办的中国教育学会会刊。1980年创刊,月刊。刊物定位于教育应用性研究,是面向基础教育的综合性学术刊物,以“坚持理论创新、彰显实践引领、发扬学术民主、萃取科研精华”为办刊宗旨。

《中国教育学刊》是中国人文社会科学核心期刊、CSSCI(中文社会科学引文索引)来源期刊、全国中文核心期刊。

《中国教育学刊》主要读者对象是:中小幼教师、教育科研人员和行政管理干部,师范院校、教育学院、教师进修院校的师生,学会及其分支机构的管理与研究人员,以及包括学生家长在内的所有热心教育事业、关心青少年儿童成长的人士。



下期预告

恭贺新春|卯兔迎春,阖家欢乐


点我“分享”“点赞”“在看”都在这里

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存