查看原文
其他

袁建林 刘红云:过程性测量:教育测量的新范式

袁建林 刘红云 中国考试 2022-04-25

作者:袁建林,湖南大学教育科学研究院助理教授;
刘红云,北京师范大学心理学部教授。


原文刊载于《中国考试》2020年第12期第1—9页。


摘要:过程性测量是教育评价理念、技术方法与操作规范系统性革新所衍生的新测量范式,其实质是获取学生在教育教学或测验活动中的过程性表现,从中抽取测量证据推论学生的潜在特质水平或心智活动过程。基于真实教育活动过程评判学生是过程性测量的基本精神追求,技术工具应用是其不可或缺的方法手段,基于证据进行推理是其秉持的基本信条。过程性测量主要有面向成长与发展过程的测评和面向内在心理活动过程的测验2种形式。过程性测量实践需区分被测特质结构的稳定性和发展性,规范操作形式,以确保测量的科学性与公平性。



关键词:教育评价改革;过程性测量;教育测量


  中共中央、国务院印发的《深化新时代教育评价改革总体方案》提出要“改进结果评价、强化过程评价”[1],阐明了新时代教育评价改革具体方略,反映教育评价从结果导向到过程导向的转变。政策层面教育评价改革思潮的变化与教育评价理论与测量方法技术发展的新趋向息息相关。近年来,过程性评价、表现性评价成为学界讨论较多的评价思想和理论;在技术的拥趸下,过程性测验成为大规模教育测验发展的新形态,技术支撑的教与学的过程测评付诸于实践。教育评价理论和教育测评实践的发展都在凸显过程性特征。本文着力于“测量”,借用范式理论框架,力图阐明“过程性测量”这一测量新范式,明晰过程性测量实践中的一些关键问题,以期深化对教育测量的认识。

 1

过程性测量的生成路径

  教育测量与评价是2个有巨大差异而又紧密关联的概念。教育测量是对教育中的客体属性进行量化或质性描述,教育评价是在某种标准下对教育对象的价值或者属性进行评判[2],测量是评价的基础,评价思想、评价理念又决定测量方法手段的运用,通常以“测评”概览两者之间的关系。从教育评价理念发展与测量实践变革的整体趋向来看,传统结果导向的教育测评亟待改进,过程性评价理念兴起,并落实到过程性测量实践层面。


1.1 传统结果导向的教育测评亟待改进
  在传统教育测评中,考试(或称标准化测验)是测量方法与手段层面的典型形态,主导考试评价理念与思想的是终结性评价或总结性评价,主要通过设计测验试题与工具测量学生的学业水平,进而衡量教与学的效果。从时间上来看,考试一般发生在阶段性教学活动完成之后,主要关注阶段性教育教学的结果,是对阶段性教学成效的检验;此外,考试主要依据学生对测验试题的作答结果而不是内在心理过程对学生进行评判:因此,传统考试是一种结果导向的测验。从教育教学的构成要素来看,考试是教育教学中不可或缺的环节,期中考试、期末考试是检验阶段性教与学成效的重要手段,对于支撑教学活动开展、评判教育教学成效有着普遍性价值;然而,传统结果导向的评价理念与测量形式也受到学者的批评,多数批判性的观点认为,终结性考试忽视学生的成长过程,看不到学生的发展变化,学生内在心理的生动性、丰富性和复杂性得不到体现。从测评的功能角度来看,纸笔考试有其自身局限性,测量真实问题解决能力、批判性思维等高阶能力存在一定困难。从教育系统层面来看,受制于现行社会观念与制度环境,考试在某种程度上助长“唯分数论”“片面追求升学率”等现象[3]。总体来看,传统结果导向的教育测评存在功效层面的困境,容易衍生教育生态的异化,这已成为国际学者的普遍共识[4];因此,《总体方案》提出改进结果评价,这是对传统结果评价的深层次反思。


1.2 过程性评价理念的兴起
  源于对传统标准化测验的批判,表现性评价是国内外学者讨论较多的新评价理念。表现性评价是指在尽量合乎真实的情境中,运用评分规则对学生完成复杂任务的过程表现或结果作出判断[5]。从内涵来看,表现性评价指向学生在真实任务情境中的问题解决过程,强调基于任务完成的过程表现对学生进行评价。对于评价改革而言,其核心意义在于发展新的评价形式,这种新评价形式关注问题解决的过程而不仅仅是结果,实质上是一种过程导向的评价理念。教育评价改革也与课程教学改革紧密关联。在21世纪初的课程改革中,有学者明确提出要开展过程性评价,以适应课程与教学的发展,主张采取目标与结果并重的方式,在课程实施的过程中对学生学习的效果、过程及与学习密切相关的非智力因素进行全面评价[6]。当前在核心素养教育改革背景下,推行综合素质评价是教育评价改革的核心内容,改革的基本主张是采用“写实记录、形成档案”的评价形式,客观记录学生成长过程中集中反映综合素质主要内容的具体活动,形成综合素质档案作为升学录取的依据[7]。表现性评价、过程性评价和综合素质评价尽管在概念表象层面并无关联,但它们具有共性改革精神,都主张评价要关注过程,即学生的学习过程和评价活动中的任务完成过程。如果以结果与过程作为分野,它们无疑都是过程导向的评价理念,本质上都是过程性评价。


1.3 技术应用促进过程性测量实践的发展
  从价值取向来看,过程性评价无疑是一种具有生命力、符合教育教学改革价值诉求的评价思想,但在教育测评实践中,表现性评价、综合素质评价等过程性评价理念面临操作困境[8],过程性评价理念难以落实到测量层面。近年来,技术的应用催生出多种基于技术的新型测验,例如游戏化测评(game-based assessment)、基于模拟的测评(simulation-based assessment)等,这类测验符合过程性评价理念的基本主张,属于过程性测验,并在大规模测评实践中得到应用。PISA2012为测量学生复杂问题解决能力,开发交互式测验任务,获取学生任务完成的过程性表现,基于过程性表现分析学生问题解决过程和所采用的问题解决策略等[9]。ATC21S(Assessment & Teaching of 21st Century Skills)项目采用“人人交互”的方式测量合作问题解决能力,实时记录2名学生合作完成任务过程中的对话与关键行为,形成过程数据,再从过程数据中抽取指标推论学生的潜在能力[10]。过程性测验所产生的过程数据成为教育测量领域关注的焦点问题,并由此衍生出多个研究方向。较多研究关注如何从过程数据中抽取测量指标,也有许多研究者关注基于过程数据的新测量模型开发[11]。在教与学过程的测评层面,嵌入式测评(embedded assessment)、智慧测评、学习分析等成为智能时代教学与评价的核心内容。在线学习系统可以实时记录学生学习过程中的互动交流、学习资源使用、学习作品生产、学习反思与成长等,形成学习过程的全记录。从全面记录的学习过程中挖掘信息、评估学生的学习状态、追踪学习状态的发展、优化学习过程是嵌入式测评、智慧测评关注的主要内容,其中,利用各种复杂的智能化技术挖掘学习过程信息、评估学习状态是基础,其实质是对学习过程的测量。从过程性视角考量,技术支撑的教与学过程测评是过程性测量实践发展的重要表现。总体来看,得益于技术的支撑,过程性评价理念逐渐落实到过程性测量实践层面。

 2

过程性测量的范式释构

  本文提出“过程性测量”这一新概念,旨在突破传统结果导向测量的认知边界,拓展教育测量的认知范畴。但过程性测量究竟是什么?与传统教育测量是什么关系?教育测量界尚缺乏讨论。本文基于范式理论框架,将过程性测量界定为一种新测量范式,提出过程性测量的2种具体形式,以此明晰过程性测量的意涵。


2.1 过程性测量是一种新测量范式
  范式一般指研究共同体所共同遵守的信念、价值观、技术手段等的总和,主要包括3个方面:一是理论层面的思想、信念、价值观等,构成范式的理论基础;二是方法层面的技术、方法、程序等,是范式的操作环节;三是规则层面的原则、规范、标准等,在理论与方法之间起中介作用,促进理论转化为实践[12]。教育测量是一项系统性活动,依据范式理论,教育测量活动所共同遵循的一套固有的评价思想理念、测量方法手段和操作规范的总和构成特定教育测量范式,在实践中主要表现为教育测量活动所具有的特定形式与过程。
  过程性测量是教育测量的新发展,具体来说,指获取学生在教育教学或测验活动中的过程性表现,从过程表现中抽取测量证据,推论学生潜在特质水平或心智活动过程。从形式与过程来看,过程性测量实质上包含3个重要阶段:首先,获取过程性表现;其次,基于过程性表现抽取测量证据;再次,基于测量证据推论被测内容。这与传统刺激-反应式的测量具有较大差别,主要在于过程性测量需要获取过程性表现,并基于过程表现抽取测量证据,这一特点也凸显过程性测量所蕴含的过程性核心意涵。也正因如此,人们难以基于“量化潜在特质”的传统测量观对过程性测量进行全面解释。与传统教育测量相比,过程性测量所遵循的评价思想理念、所采用的方法手段及所秉持的操作规范存在系统性差异,必须将过程性测量置于新测量范式框架下进行诠释。
  第一,基于真实教育活动过程评判学生是过程性测量的基本精神追求。狭义上的教育活动一般包括教学活动与评价活动,过程性测量追求基于真实的教学活动过程与评价活动过程对学生进行评判。一方面,教学活动具有过程性、动态性。过程性测量坚持教育教学活动的动态观、生成观,承认教学活动的过程性价值,坚信教学活动历程中内在生成实在事件及其历史情境之于评判学生的价值与意义,从真实、客观的教学活动过程探寻学生发展状况、衡量学生的成长与进步是过程性测量的基本追求。另一方面,测验活动具有过程性。现有测验所获取的直接测量证据是学生完成测验任务的结果性表现,不能反映学生问题解决的内在心智活动过程。过程性测量需要获取测验活动中的过程性表现,致力于从过程性表现揭示学生的潜在能力,关注的是学生问题解决的过程,而不仅仅是问题解决的结果。从理念层面来看,过程性测量范式源于过程性评价理念,指向教育教学活动的发生过程和学生内在心理过程,旨在凸显教学与评价活动的过程性价值。
  第二,技术应用是支撑过程性测量有效开展不可或缺的方法与手段。过程性测量面向教育活动过程,需要实时记录教学与测验活动中学生的真实活动轨迹,获取学生学习的过程性表现,其中采用什么样的方法手段获取学生真实的过程性表现,是过程性测量面临的关键问题。从现有过程性测量实践来看,技术的应用与支撑是开展过程性测量实践不可或缺的工具与手段,主要包括建构过程性测量形式的工具性技术和服务过程性测量的复杂数据处理技术。一方面,信息技术是支撑过程性测量活动开展的基本工具。基于教学活动过程的测评需要开发在线教学平台或者信息化测评系统,利用信息化平台实时记录教学活动中的完整过程,包括教与学的内容、学生学习状态、学习成果、师生之间的互动等真实性事件,生成以时间轴为中心的过程性数据,形成教学活动的过程性表现。与此类似,在基于信息技术的过程性测验中,需要利用信息技术开发交互式、真实性测验任务,建构复杂问题情境,实时记录学生在完成测验任务中的真实性表现,形成过程性测验表现。另一方面,过程性表现中的测量证据挖掘需要先进数理统计模型和复杂数据处理技术的支撑。过程性测量所形成的过程性表现必然是形式多样、结构复杂的过程性数据,这类数据难以直接应用于推论学生潜在特质水平与心理过程,需要利用大数据、机器学习领域中的先进技术,从过程数据中挖掘测量证据,抽取关键测量指标,最终基于测量模型推论学生的潜在特质水平。因此,从方法技术层面来看,先进技术应用是过程性测量范式不可或缺的工具与手段。
  第三,基于证据进行推理是过程性测量秉持的基本信条。过程性测量到底是什么?回答该问题也可以从教育测量的本质出发进行诠释。所谓测量的本质,即人们应该秉承什么样的测量观。在心理与教育测量发展之初,遵循科学测量的一般范式,Stevens认为“测量就是依据特定规则给事物赋予数值”,并提出4种测量尺度[13]。“测量是确定潜在心理属性的量”这个基本意涵具有普遍解释力和广泛适用性。随着认知与学习科学的发展、技术的进步及在教育测评中的应用,教育与心理测验形式日趋复杂,需要测量的潜在特质日趋抽象,所获取的测验表现愈加难以解释,依据量化潜在特质这一功能主义倾向的测量观解释日益复杂的教育与心理测量形式日趋乏力。Mislevy等重新审视各种已有的测量理论、技术和方法,提出以证据为中心的设计理论(evidence-centered design,ECD)[14],认为测量是基于证据进行推理。这一新测量观对于解释教育与心理测评实践中日趋复杂的测验形式、方法与技术提供了全新的思想和严谨的诠释框架。过程性测量是教育测量的新发展,属于测量的子范畴。综合2种测量观的意涵有助于进一步明确过程性测量的本质:首先,过程性测量遵循量化潜在特质的经典测量观,确定被测对象潜在心理属性的量级大小是过程性测量的基本出发点;其次,ECD理论为过程性测量提供了基本的诠释框架。过程性测量需要获取学习与成长或任务完成中的过程性表现,需要建构证据规则,从过程性表现中提取测量证据,进而基于测量证据、应用测量模型对被测潜在特质进行推论。从测量的本质层面来看,过程性测量是基于过程性测评表现提取测量证据、推论潜在特质水平的过程。


2.2 过程性测量的形式
  教育测量是一项系统性活动,存在其固有特征和操作形式。在传统测验语境中,标准化的测验操作形式可简括为明确测验目标与内容、开发与检验测量工具、施测与评分、测验结果应用4个基本阶段。过程性测量的核心在于凸显教育教学与测验活动中的过程性价值,指向学生的学习过程和内在心智过程。从测量活动发生的时空场域来看,过程性测量主要包括面向成长与发展过程的测评和面向内在心理活动过程的测验2种形式。


2.2.1 面向成长与发展过程的测评
  传统总结性、终结性评价话语体系中的考试评价发生在教学活动完成之后,教学评价只针对教学的结果而看不到教与学的过程,教育过程的生动性、丰满性得不到体现。过程性评价理论认为教学与评价应该相互交融、相互作用,因而过程性测量的首要价值在于凸显教育教学的过程性价值,指向教育教学中学生的成长、进步与发展。从实践层面来看,面向成长与发展过程的测量主要表现在2个方面:一方面,技术领域中大数据测评、学习分析、智慧测评的兴起促进了技术支撑的学习过程测评的发展。从测量的角度来看,在线学习系统对于学习动机、学习参与、学习效果等学习状态的动态评估,需要利用数据挖掘、学习分析等技术从过程性数据中挖掘证据,推论某一时间节点的学习状态[15],其实质是一个测量问题,也就是在线学习中的过程性测量。另一方面,综合素质评价改革为教学场域中的真实性学习过程测评建构新的范式。综合素质评价强调写实,记录学生学习与成长过程中集中反映综合素质主要内容的具体活动,形成评价档案,制定科学评价方法,寻求客观依据,供招生与改进学习使用。在有关综合素质评价政策语境中,并没有规定如何衡量学生综合素质表现差异的具体方法与程序。有研究者指出,综合素质评价改革的复杂性需要从评价涉及的功能定位、材料信效度、操作流程、评价方法、评价呈现方式等方面建构新的测评范式[16]。在实践中,为避免综合素质评价的主观随意性,促进综合素质评价结果的可比较性,大多通过设置加权关键指标体系区分学生差异[17],实际上已转化为一个测量问题,即真实教学场域中学生学习过程的测量。
  从测量的操作形式来看,在线学习平台中的过程性测量和综合素质测评具有以下共性:首先,需要实时、真实地记录学习活动发生的完整过程;其次,需要从学习过程中挖掘、提取测量与评价的证据;再次,依据客观证据对被测内容作出推论;最后,测评结果被应用于改进教学或作为升学依据。因此,面向成长与发展过程的测评逻辑可概括为:记录真实学习过程→提取测量证据→推论被测内容→测评结果应用。


2.2.2 面向内在心理活动过程的测验
  人的心智活动具有过程性,教育测量所指向的心智潜能在测验发生过程中需要经历丰富的动态心理过程。当前,要有效测量以核心素养为代表的复杂技能,需要揭示学生内在的心智活动过程。例如,一般认为问题解决能力包含探究与理解、表征与形成、计划与执行、监控与反馈4个阶段,对问题解决能力的测量需要构建动态性的任务情境,诱发其心智活动过程,获得过程性表现,进而推断问题解决能力、问题解决的过程以及所采取的策略,以此确保测验的科学性和有效性。同时,测验活动的发生也具有过程性,获取心智活动的外在过程性表现也是当前教育测验形式变革的重要特征,主要表现为基于信息技术所构建的交互性、动态性测验。获取丰富任务情境中的过程性表现,有利于核心素养这类复杂技能的测量,有利于揭示所需测量的心智潜能所经历的动态心理过程。总体上,揭示学生内在心理过程,是当前教育测验发展的重要方向,这类新型测验属于过程性测验,是过程性测量范式所蕴含的另一层含义。
  从实践层面来看,过程性测验存在2种层次。其一,通过获取学生在测验中的过程性表现推断学生潜在特质水平。这类测验应用信息技术构建真实的表现性任务,获取被试完成任务过程中的行为表现,形成过程数据,从中抽取测量证据,进而利用测量模型对复杂技能进行有效推论。ATC21S项目对合作问题解决能力的测量是这类测验的典型代表。其二,基于学生在测验中的过程性表现进一步推断学生解决问题的思维过程、情感态度的变化。这类新型测验利用学生测验的过程性表现,深入挖掘各类有效测量证据,不仅能推定学生潜在特质水平,还能推断学生的问题解决过程,探寻问题解决的有效路径和策略以及情感态度的变化。总体来看,过程性测验与传统结果导向测验的本质区别在于2个方面:一是基于测验中的过程性表现而非作答结果来推断潜在能力水平;二是能够进一步基于过程性表现推断学生的问题解决策略与思维过程,揭示学生的内在心理过程。过程性测验是对传统测验功能的极大突破,也是过程性测量的核心意涵所在。

 3

过程性测量的实践要义

  过程性测量是教育测量适应教育发展与时代变革的产物,在测评功能、技术方法及与教育发展的适切性等方面有其优越性和先进性。然而,作为一种新的测量范式,过程性测量形式繁杂、操作缺乏规范性,还有更多深层次问题需要在测量实践中引起足够重视。


3.1 区分被测特质的稳定性与发展性
  现代心理学的研究表明,人格、智力、态度等潜在心理特质具有相对稳定性和发展性的特点[18]。儿童的心智具有发展性,是现代心理与教育所秉持的基本观点,这表现为经过较长一段时间学习与生活,学生的认知、情感态度会有明显的进步和成长;但在较短的时间范围内,儿童的发展与进步却难以“窥见”,其潜在心理特质可以视为是稳定的,也就是说潜在特质结构在较短的一段时间内表现为相对稳定。在经典测量理论、项目反应理论等教育测量理论中,被测特质的稳定性是这些测量模型得以成立的基本假设之一。传统测验活动发生在教学完成之后,相对于教育教学活动的连续性与动态性,传统测验持续时间短,学生的潜在特质具有相对稳定性的特征,因而满足教育测量模型的基本假设。
  过程性测量面向教育教学过程、面向学生的成长过程。成长意味着学生潜在心智的发展变化与量的增长,即被试的潜在心智在测验持续时间范围内可能是不稳定的,这与大多数教育测量模型所假定的潜在特质相对稳定性存在冲突,因而过程性测量首先要从潜在特质的相对稳定性和发展性考虑测量工作的开展,即在测量活动所持续的时间范围内甄别学生潜在特质是具有相对稳定性还是发展性特征,这需要测量专家、领域专家协同甄别。如果过程性测量活动中学生的潜在特质具有相对稳定性特征,则可以依照传统思路,应用现有的测量模型开展测量;如果过程性测量活动中学生的潜在特质具有发展性特征,则需要应用学习进阶等理论界定潜在特质的动态结构[19],灵活应用现有教育测量模型或者开发发展性测量模型[20],以此精确测量潜在特质的发展变化过程。


3.2 规范过程性测量操作形式
  传统结果导向型测验的外在表现形式是开发测验工具、测量潜在特质,其内在测量学逻辑可简化为刺激-反应模式,即开发测验试题刺激被试心理活动,获取被试对试题的作答反应,基于作答结果推论潜在特质。与此固有范式相比,面向学生学习过程与心智活动过程的测量操作形式更为复杂,需要详尽考虑与设计。
  第一,明确过程性测量持续时长。在传统考试中,测验时长主要与测验试题的数量和难度有关,测验时长的设计更多是一个技术层面的标准化问题。在面向学生成长的过程性测评实践中,测评时长设计关乎测量基本形态的确立和测量进程的展开。确定测评时长是测量活动设计的起点,以此方能区分潜在特质是具有发展性特征还是稳定性特征,明确学习与成长的观察时段,进而对学习与成长过程中所需观察的行为、活动、典型事件进行设计。
  第二,对复杂抽象的潜在特质进行操作性定义。从价值与功能层面来看,过程性测量必然指向核心素养、综合素质等难以通过常规方法和手段测量的内容。这类被测内容结构复杂、高度抽象,要达到有效测量目标,需要先对复杂抽象的概念进行操作性定义,细化指标体系,具体化观测内容,将抽象概念具体化为可观测的行为活动与要求。
  第三,详尽设计过程性测量形式。在实践层面,过程性测量形式多样、名称混乱,本文将其归纳为面向成长与发展过程的测评和面向心理活动过程的测验2大类。与传统结果导向型测验具有的一般性操作形式相比,这2类过程性测验在形式上需要进一步规范。在传统测验中,开发测验试题和获得作答反应是构成整体测验流程的2个核心要素。对于面向成长与发展过程的测评,它没有严格意义上的测验试题这一核心要素,只有学习与成长过程中真实的行为活动与关键事件,而这些关键活动与典型事件是测评的原始依据。因此,面向成长与发展过程的测评要始终围绕“记录什么样的关键事件与活动”“如何记录关键事件与活动”“如何使用原始材料”及“如何呈现测评结果”开展设计,以此确立测评活动的基本形式与过程。对于面向心理活动过程的测验,它需要提供复杂测验任务刺激被试反应,获取复杂测验表现,其测验设计要考虑开发什么样的测验任务、提供什么样的问题情境、采取什么样的技术促进测验进程的动态发展,以及如何记录测验的过程性表现等核心问题,以此规范测验设计。
  第四,建构从复杂测验表现到被测特质结构的证据规则。过程性测量获得的过程性表现必然是复杂多样的结果与数据,难以构成测量的直接证据。依据ECD理论所强调的基于证据进行推理的核心思想,过程性测量需要建构从复杂的测验表现到被测潜在特质结构的证据链条,也就是需要从测验所记录的行为、语言、关键事件、典型活动、工作产品等复杂表现中提取对应操作性定义框架中可观察指标的客观证据。从传统语境来看,就是制定评分规则,完成对复杂测验表现的评分。


3.3 确保过程性测量的科学性与公平性
  确保测量的效度、信度、可比性与公平性是开展测量工作的基本要求。由于形式复杂以及测量进程的持续性和动态性,过程性测量的过程缺乏传统测量所具有的标准化操作流程,面临科学性与公平性的考量。针对本文所区分的2种过程性测量形式,提升其科学性与公平性的基本思路应有所区别。
  面向成长与发展过程的测评在于从学生的独特成长过程中发掘成长规律与群体共性。学生的学习与成长过程是丰富的、动态的生命生成过程[21],每位学生的成长与发展具有独特性和非预见性。独特性指学生的内在精神世界与外在表现具有个性化和唯一性,展示其作为独一无二的主体性存在。非预见性是指学生的身心成长具有多种可能性,其发展与成长过程和最终结果难以预设。与此相对应的是,测评本质上需要构建标准化的指标体系,设计标准化的工具,获取标准化的测验表现,因而发展与成长的独特性和非预见性与测量所要求的标准化存在必然冲突。面向成长与发展过程的测评最大的难题是缺乏统一的测验工具,测评的依据在于获取成长与发展过程中的表现。从测评的科学性与公平性要求来看,面向成长与发展过程的测评在于从个体独特成长过程中发掘成长规律、提炼群体共性特征,这包含2个方面:一是测评指标体系要具有共性,指标体系的具体元素应该是所有测评对象都具有的特征,而不应该是某一个体的独有特征;二是在测验持续时长范围内界定的观测内容要具有共性,从而能获取客观、有效、可比较的测量依据,以此确保测量证据的科学性与公平性。
  面向心理活动过程的测验,其科学性与公平性在于控制无关变量的影响。面向心理活动过程的测验具有传统测验的基本要素和一般流程,由于主要采用基于计算机的交互式测验形式,提升其科学性与公平性需要注意以下2个方面的问题:一是设计开发的问题情境与测验任务能有效刺激需要测量的潜在特质,以此形成测验内容效度的基础;二是剔除无关变量的影响,从复杂测验数据中提取公平、有效的测量证据。面向心理活动过程的测验所获取的原始数据是开放的、包含多种形式的多模态数据,反映了学生在测验活动中的真实过程。从测量的角度来看,原始测验表现是潜在特质水平及其他无关变量综合影响的结果,这些无关因素包括被试与测验系统交互操作的熟练程度、对测验形式的偏好,以及测验时的个体动机、期望等心理因素。因此,测量证据规则界定需要剔除这些无关变量的影响,以此确保面向心理活动过程的测验具有科学性与公平性。

 4

结束语

  长期以来,有关教育测量理论的讨论大多局限于经典测量理论、项目反应理论、认知诊断理论等话语体系,教育测量的发展依赖以数理统计为基础的测量模型发展。目前来看,这有一定局限性。教育测量致力于解构人的内在精神本质,深受教育教学改革思潮、宏观评价理念及新技术发展的影响,心理与教育理论对于人的心智认识不断深化对教育测量提出更高要求。传统教育测量面临功效瓶颈。教育测量理论研究需要突破以数理统计模型发展为着力点的研究框架,从更高层次整合教育与心理的基本理论、数理统计技术、信息技术、智能化技术,发展新的教育测量理论,以此适应社会与教育的变革逻辑。
  本文从教育评价的批判性反思、评价理念变革、技术助力教育测评实践的发展,梳理了教育测量从结果导向向过程导向嬗变的理路,提出过程性测量这一新测量范式。从范式角度来看,过程性测量在基本理念、方法手段、操作规则层面是传统结果导向测量的系统性革新,过程性测量范式的形成有其学理逻辑。然而,过程性测量是新事物,并不完善,尚有许多问题需要深入研究。同时,传统的标准化考试依然存在普遍性价值,过程性测量不能替代传统考试,但它指引着教育测量未来发展的趋向。


更多相关文章

张会杰. “四个评价”落实中的主要矛盾及化解思路[J]. 中国考试, 2020(11): 9-16.


周洪宇. 深化教育评价改革 加快推进教育现代化——《深化新时代教育评价改革总体方案》解读[J]. 中国考试, 2020(11): 1-8.


精彩回顾 | “深化新时代教育评价改革研究”系列文章




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存