基于证据的教师增值评价:走向智能时代的教学效能评测
牟智佳1, 高雨婷1, 武法提2
(1.江南大学 “互联网+教育”研究基地, 江苏 无锡 214122;
2.数字学习与教育公共服务教育部工程研究中心, 北京 100875)
[摘 要] 探索增值评价是深化新时代教育评价改革总体方案中的应有之义,增值评价从投入和产出视角关注教育主体间的成长与变化,彰显了师生共同发展的内在旨趣。教师增值评价在实践进路上体现为主体、监测、结果、时空、目标的多重向度,在发展理路上体现为认知、测量、伦理的基本限度。教师增值评价的证据形成流程折射出从数据到信息再到证据,最后形成证据库的变化过程。教师增值评价的证据链节涵盖教学起点证据、教学投入证据、教学结果证据、教学增值证据,证据连接体包含教学交互证据与教学优化证据,其分别将教学投入与产出、教学反思与教学起点进行关联。基于证据的教师增值评价分析框架是以证据为中心,以教学投入、学生产出、教学增值为支撑,通过施教、诊断、改进建立循环体,构成面向教与学流程的评价闭环。其运行路径则是以教学评测数据根基平台为抓手,构筑数据感知、证据评价、教学行动、实时反馈的一体化评测体系。
[关键词] 教学证据; 教师增值评价; 教学效能; 教学投入; 核心素养
教育评价对教育高质量、高成效、高效益发展起到重要的导向作用,评价要从面向结果的测量逐步转向面向诊断和改进的模式上来,提高立德树人的成效。随着《深化新时代教育评价改革总体方案》的发布[1],增值评价在文件中被正式提出,并以文件的形式鼓励教育工作者们进行探索。增值评价关注学生的成长变化和进步,并以此评估教师教学效能。增值评价早期主要以学生成绩作为评测数据源,数据的广度、深度有一定的局限性。随着大数据与厚数据的兴起与发展,可以对学与教两端进行全方位、全过程、全内容追踪和采集。大数据追求去个性化的学与教的常态模式,而厚数据追求学与教背后的个性特征。基于大数据样本可以揭示学生综合素养与教学模式,基于厚数据样本揭示个体学习心理状态与教学投入。大数据与厚数据的整合可以进一步赋能增值评价,通过对学习过程链条和学与教关系数据的融合分析,能够更精准、更科学地开展增值评价,促进形成证据驱动的教学评价新范式。在数据智能时代下,教育评价正经历从数字到数据再到数智的转变,开展证据驱动的增值评价呼唤理论与实践创新,因此有必要对增值评价的理念、模型、方法、应用等方面进行再审视,推动增值评价理论体系的完善。
(一)教师增值评价的历史回溯
1. 概念缘起
在社会科学学科中,经济学在政治和社会影响方面已经上升到最高水平[2]。经济学中严格的统计模型与分析工具、基于节约的框架思想以及计量经济学的发展,能够帮助决策者获得可见的结果,更好地服务于对复杂社会领域的理解。“增值”作为经济学领域的概念,强调评估时要兼顾“投入”和“产出”,这种经济模式及其思想对教育领域以及教育政策开始产生影响,特别是与教师质量相关的政策和问责举措。
1966年,社会学家James Coleman及其同事在解释学生成绩分数差异时指出,教师素质是学校内最具影响力的变量[3]。之后,经济学家Eric Hanushek开始根据投入(如教育状况、经验年限)和产出(如学生成绩)之间的关系,从经济学视角对教师效应进行概念化[4],并于1971年最早提出教师素质评估的增值模式,即根据教师对小学阶段学生考试成绩的影响来评估教师[5]。1983年,田纳西大学的两位统计学家William Sanders和Robert McLean开始探索使用统计混合模型方法探索基于学生成绩数据进行教学评估的可行性,要解决的问题包括但不限于:学生记录缺失、各种教学模式、教师多年来不断更换的作业、临时学生、不同学校系统的方差—协方差结构等。之后William Sanders等人使用加利福尼亚诺克斯县二到五年级学生三年的成绩,基于Henderson混合模型方法开发了一个统计分析系统[6]。
1992年,在《教育改进法案》通过时,田纳西州以立法的形式将William Sanders等人开发的系统及其评估方案作为该法案的一部分,由此成为后来所熟知的田纳西增值评价系统,其在法案中的主要目的是提供总结性评估信息,以说明学校、教师在引导学生取得正常学业成绩的有效性[7]。1996年,桑德斯等人进一步指出增值模型中所存在的误差因素,即现任教师效能评估忽略了先前教师对学生的持续性影响[8]。增值模型作为增值评价的统计工具,旨在使教师的有效性成为可见的、可量化的对象,在增值模型中,学生的实际标准化考试分数与模型预测的分数进行比较,差异被视为教师的“增值”。这些模型试图将影响学生学习的其他因素(如学习者特征、家庭背景、邻里效应、前任教师的持续影响)与现任教师素质分离开来[9]。
在随后的发展中,教师增值评价理念在许多国家的教育决策者及教育工作者中产生共鸣,其关注点主要涉及三个方面:(1)方法层,如可靠性、有效性、偏差等;(2)管理层,如公平性、透明度、可用性;(3)影响层,如评价结果对学校文化、教师职业的影响等。
2. 现实争议
教师增值评估方法在初期得到广泛热议,倡导者认为通过增值评价筛选教师可以产生巨大效益[10],批评者认为这种测量方式并不能反映教师质量[11]。这两种观点的争论主要源于两个问题,一是学生考试分数增长的差异与教师影响之间是否是因果影响关系,或者通过学生分数对教师进行分类是否存在偏差。例如,田纳西增值评价系统初期模型并未充分控制与个人相关的人口因素,而这些因素不仅影响学习起点,还影响学习速度。二是提高考试分数后的教师是否能提高学生成年后的成绩,或者他们更擅长应试教学[12]。美国当前的政策坚持将教师评估与学生成长的衡量标准联系起来,许多州已通过立法,要求教师评估的很大一部分(通常为30%~50%)与学生标准化考试成绩直接挂钩[13]。尽管William Sanders通过引入家庭社会经济地位和人口统计学变量来优化评估系统[14],然而研究者们认为,即使对学生进行有效、可靠、标准化的评估,以学生考试成绩衡量教师表现的假设也是有问题的[15]。此外,将研究者所提出的教师影响是学生学习进步的主要因素,以及基于学生成绩增长评估教学有效性两种观点结合来看,这种评价陷入循环论证逻辑,使得理论解释力不足,实践改善乏力。
3. 内涵重塑
增值评价是对起点、过程和结果的共同关注,以区间测量为分析手段,以涨幅为评判标准。早期教师增值评价主要以学生表现涨幅作为评判依据,忽视了教师在教学方面的投入及专业发展,而在关注学生表现上也是以学习成效数据为主,对学生其他方面的素养变化关注度不高。新时代下,教育的根本任务是立德树人,教育评价要服务于全程育人、全方位育人,通过对学与教的努力程度及变化对教师效能进行科学、客观评价。基于上述分析,我们认为教师增值评价是以教师为主导、学生为主体,在关注学生核心素养变化与形成的基础上,以教师教学投入与教学输出变化作为教学效能评价的一种主体间关系的发展性评价方式。增值评价的核心要义体现在关注点和参考系的改变上,其中关注点是由传统一次横断评价的绝对值转变为多次纵向评价的增长值,而参考系是选择不同的常模参照进行对比,既可以是区域范围的常模参照,也可以是相近水平的群体常模[16]。
(二)教师增值评价的现实审视
随着教育测量与评价技术的逐步升级和先进评价理念的加持,教师增值评价的研究与实践也在不断革新。在增值评价理论层面,既有理论基础的追溯,也有评价理念的分析。在实践探索层面,既有测量方法、分析模型等算法技术的创新,也有评价模式、评价指标等教学情境中的尝试。为此,我们从多元视角对教师增值评价的结构特征进行剖析和总结,结果见表1。
表1 教师增值评价的结构特征分析
在理论基础上,教师增值评价涉及教育学、心理学、经济学、管理学等多学科,为教师评价和管理搭建了双向互动的桥梁。其中,“输入—环境—输出”理论阐述了学生输入、学生输出与教师影响之间的关系,因此可以用学生输出与输入间的增值来评价教师的影响。学生参与理论阐述了学生参与学习的过程对其结果具有重要作用,因此可以用学生成长结果来评价教师促进学生参与学习的能力。上述两个理论对增值评价产生重要的影响。
在评价理念上,其主要遵循五个方面:(1)增值理念,指教师可以为学生带来额外的增值,主要通过学生增值的绝对数量来进行教师评价;(2)绩效理念,指将学生发展与教师绩效关联起来,以达到管理目的;(3)净影响理念,指排除学生自身条件、成长环境等因素,通过教师对学生成长的净影响来进行评价;(4)诊断理念,指通过阶段性评价及时发现问题,对教学进行诊断和优化;(5)公平理念,一方面指缓解教学的马太效应,使学生在自己的基础上得到相应的进步,另一方面指避免生源问题对教师职业发展的影响,使教师的付出能得到相对公平的回报。
在评价模式上,虽然教师增值评价的最终落脚点是促进师生共同发展,但在国内外实际落地中主要是提升学生的成绩,忽略了学生成长和教师发展。广为熟知的田纳西增值评价模式便是其早期实践者,该模式在建立之初把学生阶段成绩的变化值纳入考试型科目的教师考核,随后迭代出基于学生过程评分和学业成就的评价模式,即学生成长档案袋评价模式和田纳西教育者促进模式。
在测量方式上,早期以提取考试成绩为代表的注重结果的标准化测量,逐渐扩展到以自陈式量表、课堂观察法、成长档案袋为代表,关注过程的测量方式。总体呈现出以数量为中心转向以质量为中心的趋势,所测量的结果从外在显性的数据向内在隐性的数据深入,但整体发展中仍然存在测量数据片面性与教学评估复杂性的矛盾。
在分析模型上,早期模型以增益分数模型和协变量校正模型为代表,主要分析单一学科单一群组两次测试的数据。中期模型以多因变量模型和交叉分类模型为代表,主要分析多学科多群组两次以上测试的数据。现阶段使用最广的是多水平线性回归模型,它不仅可以计算学生个体的增值,还可以从复杂的教育场景中分离出非教师所能控制的因素,从而更加精确地计算出教师在学生成长中所做的净影响。
在评价指标上,其评价主体可以分为学生和教师,在实际应用中往往以学生发展为关注重点,对教师发展的关注度明显不足。其中以教师为评价主体的指标,涉及教学有效性、专业精神以及教学外的表现等。以学生为主体的评价指标主要涉及学业表现和综合素质两类,虽然其评价最终指向学生的发展,但在实施时主要关注学生的学业表现。
在协变量上,影响学生发展的因素涉及个人因素、环境因素、教师因素等。从物理空间上看,校外因素包含个人层面、家庭层面、社会层面,其中家庭经济社会地位是实际落地中重点关注的协变量;校内因素包含学生层面、班级层面、学校层面,其中学生原先知识能力基础以及先前教师的持续性影响是实际落地中重点关注的协变量。
(一)教师增值评价的多重向度
1. 主体向度:师生协同增值
前期教师增值评价主要关注点在于学习者变化,特别是学业成绩的起伏,其关注对象和分析指标都较为单一,这种主客体分离的单向关系并不能有效指导教师如何提高效能。教师作为教学结构要素中的另一重要主体决定了“应该教什么”“如何教”,其对学习过程和结果产生直接影响。师生主体间的相互关系决定了增值评价的双向性,因此,教师增值评价应关注师生的共同变化,两者通过主体间的交互、磋商、建构实现协同增值,即教学胜任力的提升与学生核心素养的形成。
2. 监测向度:动态精准刻画
教师增值评价改变了过去使用静态数据的评价方式,转为使用区间数据进行评测,其评测具有一定的延时性。在数据化环境下,通过网络平台和多传感器对教与学产生的即时数据进行拉取,采用数据治理和模型训练进行智能评测,形成动态评估机制。以教师的起始水平为评判基线,依照教学能力的多维指标采集教学痕迹数据,形成可视化表征的教师增值曲线,将教师从低到高的动态发展变化过程展示出来。
3. 结果向度:个性化诊断反馈
教学投入与教学风格的差异性使得教师对学生产生的影响也具有差异性,教师增值评价结果不仅要关注教学效能,还要给予个性化教学诊断与反馈,帮助其定位具体教学问题,优化教学设计与教学过程,改善教学体验。教师增值评估应不止于对已产生的教学表现进行分析和评价,还应基于关键指标的历史数据对未来增值变化趋势进行预测,便于提示教师及时采取行动。在此基础上,结合预测结果和常模参照值,对增值结果进行个性化智能预警,提前预判风险。
4. 时空向度:多跨场景应用
从评价范围来看,教师增值评测内容应涵盖整个教学流程,既包括线下的课堂教学过程,也包括线上的教学活动。后疫情时代,双线融合成为教学模式的新常态,教师增值评价也需要打破这种双线分离、割裂的评教状态,转为双线共生、相互呼应的评测体系。而该评测体系需要以多跨场景应用为抓手,采用全局评测观念、系统评测思维,通过跨情境、跨数据、跨内容在更大的场景中进行系统化评价,解决评价的碎片化问题。
5. 目标向度:教学效益提升
教师增值评价要为相关利益者提供多维、实时的评价决策方案,达到提高评价效果、效率和效益的目标。评价效果体现在教学质量的改进上,评价效率体现在“数据+智能+反馈”的全流程评价系统中,用较少时间达到评价目标。而教师增值评价的最终目标体现在教学效益上,不止于效果和效率的提升,即通过评价结果进行教学创新,用较少的投入培养更多优秀人才。在教学创新关照下,实现增值评价的身心多重效益、成长累积效益、师生集合效益。
(二)教师增值评价的基本限度
1. 认知限度:指标选用与标准制定
实现全面、立体、透彻的增值评价,需要利用剥离全部协变量的所有指标对师生进行评测。然而师生交互影响的因素复杂且多元,很难列举出对学生发展具有影响和贡献的全部因素,特别是内隐因素,同样也无法准确剥离出教师对学生的净影响,因此选用关键指标进行增值评价显得更为可行。此外,其标准的制定从根本上要服务于教育质量均衡发展的需要,而各地区教育水平的差异使得评价的标准难以达成绝对的共识。
2. 测量限度:模型建构与结果解读
在增值评价中,主体在一段时间内的起点、终点和增值都是可以找到数据进行测量,但其最终发展与每一组数据都不存在严格的线性关系,现有的模型和算法也无法准确得出行为与结果间的概率关系。因而在使用增值模型进行预测和评价时,只能无限靠近“最大概率”的合理。这种数理统计上的自然偏差决定了其分析结果不能过度解读,还需结合其他方式进行多元评价,对结果谨慎解释和应用[25]。
3. 伦理限度:证据采集与隐私保护
教师增值评价需要全方位的证据支持,而有些可用的证据在实际采集过程中并未得到利益相关者的授权。教学投入、教学心理、综合素养等维度的评价涉及多情境的证据采集,这些证据涉及大量的多模态隐私数据,得到的评价结果也会将其隐私数据外显出来,因此在追求证据全面性的同时,还要注意适度性。同时,要从以人为本、尊重隐私理念出发对采集到的原始教学行为数据及衍生出的分析与结果数据进行合理使用。
(一)从数字到数据:教师增值评价的生态转变
以往教师增值评价是以考查学生进步和教师奖惩的教育管理为目标,基于其学科成绩增幅,依托统计分析模型对教师效能进行评价。此阶段的探索也融合了多种测量方式,但受到技术条件的限制,其有效性往往会因测量人员主观性的干扰而降低。其中课堂观察的有效性取决于评估者对教学过程的认知程度、教师能力水平的先验判断、课堂信息抽样的合理程度等方面。自我报告的有效性取决于教师或学生是否有足够的自我觉知、自我意识,以及是否会真实客观地回应。因此,该阶段的评价依据主要是以数字形式呈现的学生标准化考试结果。
数据源于对事实进行物理观察的自然结果或据此进行的归纳与描述,用于表示客观事物的真实信息,包括连续的模拟数据和离散的数字数据。随着教育评价改革和数字化技术的深入发展,教学行为、学习轨迹、师生交互等进一步丰富了教学评价所需的数据。教师增值评价逐渐转向以服务学生成长和教师发展的目标取向,基于教与学过程与结果的多源异构数据,采用数据挖掘与建模对教师效能进行评价。其评价依据主要是以数据形式呈现的多样化教与学痕迹。可以看出,教师增值评价从对教学起点与终点结果进行测量的以教师管理为侧重点的评价生态,逐步转向对教学全周期过程进行监测的以师生发展为侧重点的评价生态。
(二)从数据到证据:循证取向的教师增值评价
数据是智能时代的重要资源,数据赋能已成为各领域关注和研究的热点。数据的海量规模与低价值密度决定了未经分析转化的数据无法直接使用。真实教与学数据,特别是高质量、有效的真实数据是产生真实教学证据的基础。对教师开展增值评价需要在真实环境下采集与教学目标、教与学过程、学习结果等方面相关且合法可用的数据或基于这些数据衍生的汇总数据。通过对适用的真实教学数据进行集成、处理和分析以获得关于教师评价的有效证据。循证教师增值评价就是以“遵循证据”方式对教师投入与教师效能进行科学评判。教师增值评价的证据形成流程如图1所示,该流程体现了从数据到信息再到证据,最后形成证据库的变化过程。
图1 教师增值评价的证据形成
在数据阶段,主要是基于大数据基础组件、云平台对多种教与学数据源进行采集,实现全端数据资产积累,形成扎实的教学数据根基。在信息阶段,主要是对数据进行交换集成、开发、管理,积累有效教学数据资产。在证据阶段,以数据信息为基础,采用增值评估模型和深度学习算法进行教师增值评价分析,具体环节包括证据采集、证据规整、证据核查、证据融合。通过对证据的识别、分层、查验、汇聚,促进证据使用的高质高效。在证据库阶段,通过打通多源证据实现全量整合,基于关联证据形成证据簇。当前,真实教学情境数据的采集尚未形成规范和标准,存在数据不完整、数据标准和数据模型不统一等问题,这进一步影响了数据的使用。后期要加强教学数据治理,评估数据的适用性,为产生有效的教师评价证据做好准备。
(三)从证据到证据链:教师增值评价的循环优化
证据链概念来源于司法刑侦领域,是由两个以上具有客观联系且相互印证的证据链节构成。证据链节和连接体是证据链的基本要素,证据链节由单一证据或指向同一对象的证据簇构成[26]。面向教师增值评价的证据链是指在教学投入和产出过程中,由教与学相互关联的证据链节所构成,并能体现或提高教师增值证据证明力的证据集合体。教师增值评价证据链体现的是教学相长与增值的证成关系,证据链的稳定性依赖于教师与学生的相互影响与促进,这种相互关系包括认知属性和社会属性,认知属性体现在教与学内容上,这决定了证成关系的可靠性,社会属性体现在教与学关系上,这决定了证成关系的合理性。
结合证据链的因果关系,我们从教学发生的完整过程与主要环节出发设计了教师增值评价证据链,如图2所示。其中证据链节包括教学起点证据、教学投入证据、教学结果证据、教学增值证据,证据连接体包括教学交互证据和教学优化证据,这两者分别将教学投入与产出、教学反思与教学起点进行关联。教师增值评价的重点并不在于其证据数量的多寡,而在于评价链条中的证明含量与证明增量。教与学的结构关系体现了教学评价的主要存量,而教学相长决定了教学评价的可增值性,这才是推动教学效果和效能的动力学基础。对于每个证据链节和连接体,我们列出了主要的单一证据,它们与各自的证据链节构成强相关性,体现了教学增值评价的内在结构与逻辑轨迹。教师增值评价的证据链一方面体现出教与学相互链接与印证的完整链条,另一方面也体现了螺旋式上升的循证理念,即从教学投入到教学产出再到教学改进的循环优化。
图2 面向教师增值评价的证据链
(一)基于证据的教师增值评价分析框架
基于证据的教师增值评价依托投入—产出理论,在科学证据和教学实践的基础上,对教学进行系统评估,同时对教与学进行优化,进而形成新的证据与实践,这一过程的目标是促进学生发展,提升教学素养。基于证据的教师增值评价具有目标性、循环性、动态性、融合性,目标性体现教与学目标的达成,循环性体现教与学实践的迭代优化,动态性体现教与学过程的变化,融合性体现多源证据的整合。基于证据的教师增值评价体现了教学投入与教学效能的统一,教学增值与学生增值的统一,教学证据与学习证据的统一,教学诊断与教学改进的统一,是教学评价的一种新范式。
基于上述理念,我们设计了基于证据的教师增值评价分析框架,如图3所示。该框架以证据为中心,以教学投入、学生产出、教学增值为支撑,通过施教、诊断、改进构成循环体,建立面向教与学流程的评价闭环。在教学投入模块中,以教师、资源、环境作为构成要素,以教学目标、教学设计、教学实施为评价环节,围绕教学准备投入、教学认知投入、教学情感投入进行循证评价。该模块中的循证体现为随着教师基于教学优化证据进行教学改进,其施教过程中教学信息、教学状态、教学投入证据动态更新。在学生产出模块中,以学生、能力、实践为构成要素,以学习起点、学习过程、学习结果为评价环节,围绕学习成效、学习能力、思维品质进行循证评价。该模块中的循证体现为采集学生起点证据以及施教过程中教学交互、教学结果证据以供诊断。在教学增值模块中,以评价指标、评价标准、评价模型为实施要素,以教学胜任力能力、教学效能、学生核心素养为评价对象,从增值估算测量、个体增值曲线、分层增值额度等方面进行评价分析。该模块中的循证体现为综合以上两模块产生的证据对教学进行诊断,生成教学增值证据,以及教学优化证据。三个模块相互支撑,以教学目标为导向有效运行,通过分析师生多重交互与意义建构中动态更新的多源证据,完成教学影响向教师增值的转换。
图3 基于证据的教师增值评价分析框架
(二)基于证据的教师增值评价运行路径
从数据到证据再到教师增值评价,需要一系列较为完整、稳定的运行机制,以形成全流程评测路径。评测的根基是数据,评测的依据体现在有效证据上,评测的关键是完整教学周期下的输入、过程和输出变化态势,由此形成“证据+评价+反馈”的教师增值评价运行路径,如图4所示。该路径以教学评价云平台与大数据基础组件为平台支撑,以教学评测数据的采集、治理、存储、查询、智能分析为数据根基平台,通过教学评测证据转化,为教师、学生、教育管理者等角色提供评估支持,形成数据感知、证据评价、教学行动、实时反馈的一体化评测体系。在数据根基平台中,以场景化教学为中心,通过完整的教与学全链路数据采集,实现全端教学评测数据资产积累。以此为基础,通过统一数据治理标准、建立通用数据仓库、赋能教学智能分析,形成完整的数据流建设规范。在证据转化流程中,通过对全场景全维度的数据洞察、教学监测、分类评测,实现对教师“千人千面”的个性化增值评价。在利益相关者评价流程中,以教学周期为中心,将以教师为主导的教学投入和教学产出与以学生为主体的教师增值和净效应相联通。其中,教师增值是关注学与教两端的成长与进步,而净效应则是关注教师变化对学生学习表现和能力增长的贡献。教育管理者则基于学评融合后的反馈结果,通过制定评价标准和决策对教师增值评价进行调控。经过评价和优化的教与学行为及活动重新生成数据,为新一轮教学增值评测提供数据源。基于证据的教师增值评价路径将评价过程和评价证据进行了统整,描绘了教学效能评测的系统流程,助力教育教学提质增效。
图4 基于证据的教师增值评价运行路径
高质量的教学效能体现在师生共同增值上,在遵循教学规律和学习认知发展规律基础上通过增值评价促进学生核心素养形成与教学形态的不断创新,激活主体间共同发展的内生动力。教与学发生的过程和结果构成了证据生成的事实与缘由,教学投入与产出的教导逻辑构成了循证增值评价的证据链,其证明力的强弱反应在教师的净效应上。基于证据的教师增值评价能够精准刻画师生的努力程度,其循证过程实现了由单一数据向科学证据的过渡,促使评价从关注群体外在变化向关注个体身心发展转变。基于证据的教师增值评价需要覆盖全场景的教学监测与分析,开展教学全生命周期数据的全量整合,通过对教学投入指数和学生发展指数进行多维评测,实现对教学的精细化管理,以持续提升教学效益。
本文发表于《电化教育研究》2022年第5期,转载请与电化教育研究杂志社编辑部联系(官方邮箱:dhjyyj@163.com)。
引用请注明参考文献:牟智佳,高雨婷,武法提.基于证据的教师增值评价:走向智能时代的教学效能评测[J].电化教育研究,2022,43(5):17-25.
责任编辑:李 华
审 核:郭 炯
[参考文献]
[1] 新华社.中共中央、国务院印发《深化新时代教育评价改革总体方案》[EB/OL].
(2020-10-13)[2021-10-28].http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm.
[2] LAZEAR E P. Economic imperialism[R]. Boston:National Bureau of Economic Research, 1999.
[3] COLEMAN J S, CAMPBELL E Q, HOBSON C J, et al. Equality of educational opportunity[M]. Washington, DC:US Department of Health, Education & Welfare,1966.
[4] AMREIN-BEARDSLEY A, HOLLOWAY J. Value-added models for teacher evaluation and accountability:commonsense assumptions[J]. Educational policy, 2019, 33(3):516-542.
[5] HANUSHEK E. Teacher characteristics and gains in student achievement:estimation using micro data[J]. The American economic review, 1971, 61(2):280-288.
[6] SANDERS W L, HORN S P. The Tennessee Value-Added Assessment System (TVAAS):mixed-model methodology in educational assessment[J]. Journal of personnel evaluation in education, 1994, 8(3):299-311.
[7] SANDERS W L, HORN S P. Research findings from the Tennessee Value-Added Assessment System (TVAAS) database:implications for educational evaluation and research[J]. Journal of personnel evaluation in education, 1998, 12(3):247-256.
[8] SANDERS W L, RIVERS J C. Cumulative and residual effects of teachers on future student academic achievement[R]. Tennessee:University of Tennessee Value-Added Research and Assessment Center, 1996.
[9] GRIFFEN Z, PANOFSKY A. Ambivalent economizations:the case of value-added modeling in teacher evaluation[J]. Theory and society, 2021, 50(3):515-539.
[10] GORDON R, KANE T J, STAIGER D O, et al. Identifying effective teachers using performance on the job[R]. Washington, DC:The Brookings Institution, 2006.
[11] BAKER E L, BARTON P E, DARLING-HAMMOND L, et al. Problems with the use of student test scores to evaluate teachers[R]. Washington, DC:Economic Policy Institute, 2010.
[12] CHETTY R, FRIEDMAN J, ROCKOFF J E. Measuring the impacts of teachers ii:teacher value-added and student outcomes in adulthood[J]. American economic review, 2014, 104(9):2633-2679.
[13] NATIONAL CONFERENCE of STATE LEGISLATURES. Education bill tracking database[EB/OL]. (2012-06-01)[2021-11-03].http://www.ncsl.org/IssuesResearch/Education/EducationBillTrackingDatabase/tabid/12913/Default.aspx.
[14] BALLOU D, SANDERS W L, WRIGHT P. Controlling for student background in value-added assessment of teachers[J]. Journal of educational and behavioral statistics, 2004, 29(1):37-65.
[15] EVERSON K, FEINAUER E, SUDWEEKS R R. Rethinking teacher evaluation:a conversation about statistical inferences and value-added models[J]. Harvard educational review, 2013, 83(2):349-370.
[16] 李凌艳.如何用好教育增值评价?——对“探索增值评价”的主旨与行动的理性思考[J].中小学管理, 2020(10):8-10.
[17] ASTIN A. Effect of different college environments on the vocational choices of high aptitude students[J]. Journal of counseling psychology, 1965, 12(1):28-34.
[18] CARBONARO B. Tracking, students' effort, and academic achievement[J]. Sociology of education, 2005, 78(1):27-49.
[19] 彭湃,胡咏梅,埃克哈德·克里默.学校增值的一致性与稳定性——基于多水平追踪数据的实证研究[J].教育研究, 2015(7):73-80,88.
[20] WEBSTER W J, MENDRO R L. The Dallas value-added account ability system[M]. Thousand Oaks:Corwin Press, 1997.
[21] 刘艳妹,徐佳玥.美国俄亥俄州指向促进师生共同发展的教师评价系统研究[J].世界教育信息,2020,33(11):58-65.
[22] GITOMER D H, CROUSE K, JOYCE J. A review of the DC IMPACT teacher evaluation system[EB/OL]. (2014-05-10)[2021-11-05]. https://sites.nationalacademies.org/cs/groups/dbassesite/documents/webpage/dbasse_160397.pdf.
[23] 张雅楠,杜屏.增值评价在美国教师评价中的运用和发展[J].全球教育展望, 2017(1):67-78,89.
[24] 岳伟,陈俊源,胡祥恩,莫伦.从TVAAS到Individual Growth:美国田纳西州增值性教师评价发展新趋势[J].现代教育管理, 2019(9):69-77.
[25] 辛涛.“探索增值评价”的几个关键问题[J].中小学管理, 2020(10):1.
[26] 徐芳,郑毅,刘文斌.基于证据链的学术影响力评价方法探索研究[J].科研管理, 2020(5):140-150.
Teacher Value-added Evaluation Based on Evidence: Evaluation of Teaching Effectiveness in the Intelligent Era
MOU Zhijia1, GAO Yuting1, WU Fati2
(1.Research Center of "Internet Plus Education", Jiangnan University, Wuxi Jiangsu 214122;
2. Engineering Research Center of Digital Learning and Educational Public Service, Ministry of Education, Beijing 100875)
[Abstract] Exploring value-added evaluation is an appropriate part of the overall plan for deepening the reform of educational evaluation in the new era. The value-added evaluation pays attention to the growth and changes among educational subjects from the perspective of inputs and outputs, which shows the internal interest of teachers and students in common development. Teachers' value-added evaluation is embodied in the multiple dimensions of subject, monitoring, result, time and space as well as goal in the practical approach, and it is embodied in the basic limits of cognition, measurement and ethics in the development theory. The evidence formation process of teacher value-added evaluation reflects the change process from data to information, then to evidence, and finally to an evidence base. The evidence chain of teacher value-added evaluation includes teaching starting point evidence, teaching input evidence, teaching result evidence and teaching value-added evidence. The evidence connector includes teaching interaction evidence and teaching optimization evidence, which respectively associate teaching input and output, teaching reflection and teaching starting point. The analysis framework of evidence-based teacher value-added evaluation is centered on evidence, supported by teaching input, student output and teaching value-added, and forms a closed-loop evaluation for teaching and learning process through teaching, diagnosis, and improvement. The operation path of evidence-based teacher value-added evaluation is to build an integrated evaluation system of data perception, evidence evaluation, teaching action and real-time feedback based on the basic platform of teaching evaluation data.
[Keywords] Teaching Evidence; Teacher Value-added Evaluation; Teaching Effectiveness; Teaching Input; Core Literacy
基金项目:2021年江南大学本科教育教学改革研究项目“交叉学科融合背景下面向教育前沿的《教育大数据与学习分析》教材建设研究”(项目编号:JG2021156);2021年江苏省高等教育教改研究一般项目“‘数据驱动—成果导向’的教育技术一流人才培养评价模式改革研究与实践”(项目编号:2021JSJG216)
[作者简介] 牟智佳(1987—),男,山东栖霞人。副教授,博士,主要从事学习分析与评价、个性化学习与服务、信息技术与课程整合等方面的研究。E-mail:ambitionyt@163.com。
CSSCI来源期刊
RCCSE中国权威学术期刊
AMI核心期刊
复印报刊资料重要转载来源期刊
《电化教育研究》创刊于1980年,是我国教育与电教界的学术理论园地和权威性刊物,素有“中国电化教育理论研究基地”之称誉。主要研究现代教育前沿问题,服务全国教育教学改革;关注国内外信息化教育理论的创新。
《电化教育研究》开设的栏目主要包括理论探讨、网络教育、学习环境与资源、课程与教学、学科建设与教师发展、中小学电教、历史与国际比较等。
《电化教育研究》