查看原文
其他

唐一鹏 黄忠敬|社会与情感能力培养成效的实证研究——基于SSES数据的国际比较分析

唐一鹏 黄忠敬 华东师范大学学报教育科学版 2023-04-20


本期|精彩

新刊速递 | 华东师范大学学报(教育科学版)2023年第4期目录

特稿

郑永和  等:我国小学科学教师队伍现状、影响与建议:基于31个省份的大规模调研

社会与情感能力

黄忠敬 尚凯悦 张静|成长型思维如何影响学生社会与情感能力的发展?——基于OECD社会与情感能力测评的实证分析

社会与情感能力培养成效的实证研究

——基于SSES数据的国际比较分析


唐一鹏,黄忠敬


华东师范大学社会与情感能力研究中心



      摘要:社会与情感能力是人生成功和幸福的奠基石。2021年SSES(Study on Social and Emotional Skills)全球首测结果发布,为开展青少年社会与情感能力的国际比较研究提供了坚实的数据基础。本文运用DEA(Data Envelope Analysis)方法,将班级规模、教师学历、SSES培训、SSES措施、校园活动作为投入变量,将五大能力作为产出变量,对参加本次国际测评的10座城市的1171所中小学进行培养成效评估,结果发现:(1)各城市中小学的社会与情感能力培养成效普遍较高,小学阶段的均值在0.8以上,中学阶段的均值在0.9以上;(2)在小学阶段,苏州学校的培养成效较为突出,不仅均值最高,而且整体属于高水平均衡型;在中学阶段,培养成效较为突出的城市则是伊斯坦布尔,属于高水平均衡型;(3)各城市共有82所高绩效小学和87所高绩效中学,其中伊斯坦布尔和波哥大的占比较大;(4)学校归属感对各城市中小学的社会与情感能力培养成效提升具有重要促进作用。根据以上研究结果,本文建议应该加强社会与情感能力的国际合作与实证研究,在总结苏州成功经验的同时寻找差距补齐短板,将优质均衡作为我国中小学社会与情感能力培养工作的重要目标。

      关键词:社会与情感能力;SSES;国际比较;DEA;SBM;随机森林

      本文发表在《华东师范大学学报(教育科学版)》2023年第4期 #社会与情感能力  栏目


唐一鹏,华东师范大学教育学部教育学系副教授,华东师范大学社会与情感能力研究中心研究员。


黄忠敬,通信作者,华东师范大学教育学博士,教育学系主任,教授、博士生导师,教育部人文社科重点研究基地基础教育改革与发展研究所副所长。



目录概览

一、研究背景

二、文献综述

三、数据与方法

四、各城市中小学的主要特点

五、成效评估结果

六、启示与建议


     

一、研究背景

      

      2021年OECD发布了社会与情感能力测评(Survey on Social and Emotional Skills)的全球首测结果,在世界范围内引起巨大反响。它是继PISA以来最具影响的国际测评之一,其特色鲜明的口号“超越学科学习”(Beyond academic learning)更是预示着全球教育测评开始向着非认知能力转换(OECD,2021a;袁振国等,2021)。社会与情感能力的研究和测评已经有40多年的历史,不少国家已经开展了体系化的学生社会与情感能力培养项目,其中最有影响力的是美国的CASEL项目和英国的SEAL项目(王松丽,陈瑞生,2017)。社会与情感能力研究在中国也已经有了10多年的发展(毛亚庆等,2018),社会各界对社会与情感能力的重视程度也越来越高,特别是在“立德树人”“五育并举”的时代主旋律下,培养社会与情感能力的重要性越发突出,被认为是人生成功和幸福的奠基石(袁振国,2021),是影响成功与幸福的关键因素(黄忠敬,2020)。社会与情感能力研究的重点,不仅仅在于揭示社会与情感能力和其他原因、结果变量之间的关系,更在于如何探寻培养途径、凝练培养模式和评估培养成效。目前,已经有不少研究关注到学生社会与情感能力的培养问题,既有国际比较(刘志等,2021),也有本土经验总结,但是鲜有研究聚焦培养成效的问题,相关实证研究更显不足。


      2021年SSES首测结果的公布,也预示着中国的社会与情感能力研究进入新的发展阶段——苏州作为中国城市的唯一代表,不仅在本次测评中展现佳绩,也是中国的青少年社会与情感能力研究登上世界舞台的关键一步(袁振国等,2021)。本文正是从国际比较的视角出发,以学校为单位,采用数据包络分析(DEA)方法对参与2019年SSES测评的10个城市的培养成效进行评估,期望能够为我国青少年社会与情感能力的培养提供借鉴和参考。


 

二、文献综述

    

      培养问题是社会与情感能力落地的重中之重,国内外有关社会与情感能力培养的研究日益增多。任静等人(2016)较早地通过梳理国际上的项目来讨论社会与情感能力的培养。姚庆民等人(2017)基于学校实践来介绍如何在学科中培养社会与情感能力。刘志等人(2021)的研究则从更为宏观的视角出发,对OECD国家的社会与情感能力培养进行国际比较研究。上述研究大多偏重于理论和政策分析,基于数据的实证研究相对较少,究其原因,主要是数据的缺乏。毛亚庆等人(2018)基于教育部—联合国儿童基金会的“社会情感学习”项目积累了大量本土数据,开展了有益的探索,但主要局限在我国西部地区。

      2021年SSES测评数据的正式发布为开展跨国实证研究提供了数据基础。徐瑾劼和杨雨欣(2021)利用相关数据进行国际比较研究,提出了关注性别差异、推动家校协同、加强课程建设、构建评价体系等四条培养途径。刘芝延和徐瑾劼(2021)也充分挖掘SSES数据,并聚焦创造力的培养,提出跨学科视野、关键品格养成、家—校—社共育、加强评价改革等培养措施。纵观既有文献,国内尚无对社会与情感能力培养成效进行评估的研究。相比之下,国内外有大量研究聚焦以学习成绩为结果变量的认知技能的培养成效评估,尤其是一些利用DEA、SFA等评估模型对PISA参测学校进行评估的研究更为多见。比如,Mancebon et al.(2012)利用PISA2006的数据对西班牙的公立学校进行评估,该研究选取了两类投入变量(即学校资源变量和学生背景变量)①和一类产出变量(学校科学素养得分),在规模可变假设下利用产出导向的DEA模型计算得到西班牙公里学校在科学素养培养上的平均成效值为0.964。Agasisti & Zoido(2019)利用PISA 2012的数据对28个发展中国家的6800所学校进行评估,该研究从学校资源的视角出发,选取了生师比(人力资源)、生均计算机台数(学校设施)、学校平均SES(学生背景)三个投入变量,以及数学素养和阅读素养两个产出变量,在规模可变假设下利用产出导向的DEA模型计算得到各国的平均成效值为0.699。因此,本文尝试将上述分析方法引入社会与情感能力的培养成效评估之中,在丰富学校评估研究的同时,对社会与情感能力的培养也具有启示作用。



三、数据与方法


      (一)数据

      本文所使用的数据来自OECD开展的SSES测评,包括渥太华(加拿大)、休斯顿(美国)、波哥大(哥伦比亚)、马尼萨莱斯(哥伦比亚)、赫尔辛基(芬兰)、莫斯科(俄罗斯)、伊斯坦布尔(土耳其)、大邱(韩国)、辛特拉(葡萄牙)和苏州(中国)等10个城市,每个城市都由10岁和15岁两个年龄组的学生参加。考虑到本文的研究对象为学校,因此将这两个年龄组分别划归为小学和中学两个学段。数据显示,共有来自上述10城市的1295所学校填写了SSES测评的校长问卷,经过数据清洗和整理,特别是删去投入变量上存在缺失的个案之后,最后实际进入分析的学校数为638所小学和533所中学。如表1所示,在删除有缺失值的学校后,大部分城市的入样率都在85%以上,仅渥太华(小学)、辛特拉(小学),以及赫尔辛基(中学)的入样率偏低。



      本文从经济学视角出发,将学校对社会与情感能力的培养视为一个投入—产出的过程,因此本文中的培养成效从概念上而言是指投入与产出的比值结果,具体可以被操作性地定义为DEA评估得分,该得分也被称为成效值。产出是学生的五大社会与情感能力,包括任务能力、情绪控制、协作能力、交往能力和开放能力。首先,本文根据OECD的技术报告(OECD,2021b;张静等,2021),利用加权后的学生数据,计算每所学校在15项社会与情感子能力上的均值;然后,利用学校层面的15项子能力均值,计算五大能力的均值,并将此作为学校的社会与情感能力的五项产出。


      投入变量的选择是DEA方法的核心与关键,对此,Bessent & Bessent (1980)提出过几点原则,包括:(1)投入变量与产出变量的关系具有理论基础;(2)投入变量与产出变量的关系具有证据支持;(3)投入变量的变动与产出变量的变动具有关联。本文在上述原则的基础上,参考基于PISA数据的DEA研究中所使用的投入变量(Mancebón et al., 2012; Agasistia & Zoido, 2019),同时结合SSES数据的特点,选择了班级规模、师资水平、SSES培养三方面的投入变量。


      班级规模是衡量办学条件的投入变量, SSES校长问卷中设置为9个选项的单选题,包括:15人以下(=1)、16—20人(=2)、21—25人(=3)、26—30人(=4)、31—35人(=5)、36—40人(=6)、41—45人(=7)、46—50人(=8)、50人以上(9)。班级规模越小,表明学校软硬件投入越多、办学条件也越好。本文将该变量进行重新逆序编码(即50人以上赋值为1,15人以下赋值为9),则该变量的值越大表明班级规模越小,从而投入越大。


      师资水平方面的投入变量是教师学历,具体指一所学校全体教师中具有本科及以上学历的教师百分比。该变量来自校长问卷中的PRQM010题,该题让校长填写教师总数、具有本科、硕士和博士学历的人数。本文利用上述数据分别计算了本科及以上学历的教师百分比,将其作为学校层面的教师学历变量②。该变量是一个用百分比衡量的连续变量,数值越大表明具有本科及以上的教师比例越高,也即师资方面的投入越高。


      SSES培养相关的投入变量包括SSES培训、SSES措施和校园活动三个。SSES培训是学校对教师提供社会与情感能力培训的频率。校长问卷的PRQM013题询问校长是否通过学校内部定期培训和校外培训两种方式为教师提供正式的社会与情感能力培训,选项为没有(=1)、持续几周(=2)、持续一个月到一年(=3)、持续一年多(=4)。本文将两种方式的频率选项取均值,作为SSES培训变量。


      SSES措施是学校为培养学生社会与情感能力所采取的措施。校长问卷的PRQM014题询问校长提升学生的社会与情感能力方式,选项包括“要求教师把促进学生的社会与情感能力的发展作为他们工作的一部分(或在课堂上)”等8种。OECD在校长数据库中将该题的作答转换为一个0—100的指数(pr_promsses),本文直接使用该指数进行分析。


      校园活动是指学校为学生提供的课外活动的种类以及学生的参与程度。校长问卷的PRQM019和PRQM020两题分别询问学校为学生提供的活动(如乐队等9项活动)以及学生参与的比例。本文对PRQM019作答中的活动种类进行加总(取值范围0—9,0表示没有,9表示都有),然后将其乘以PRQM020作答中的比例③,最后乘以10得到一个取值在0—90之间的校园活动指数。


      (二)方法

      1. 数据包络分析(DEA)方法

      本文运用数据包络分析(DEA)方法来评估学校的社会与情感能力培养成效。DEA是数量经济学中的一种非参数方法,在企业生产率研究中具有广泛的应用。该方法利用决策单元(Decision Making Unit,以下简称DMU)④的投入、产出数据构建非参数的前沿面(frontier),然后相对于这个前沿面来计算各个决策单元的效率。自Charnes等人提出第一个投入导向(Input Orientation)的规模收益不变(Constant Returns to Scale)的DEA模型之后,DEA方法在理论和实践上不断发展,应用范围日趋广泛,在管理学、经济学、生态学等各学科中经常被使用(成刚,2014)。在教育学中,研究者们将学校视为DMU进行教育投入—产出的成效分析(赵琦,2015)。


      DEA作为非参数评估方法与传统的参数方法相比有很多优点:(1)可以对多投入多产出的复杂决策单元系统的生产率进行评估,同时不受指标量纲不一致因素的影响;(2)DEA模型中投入、产出变量的权重由数学规划根据数据产生,不需要事先设定投入与产出的比重,避免了权重分配时评价者主观意愿对评价结果的影响,具有客观性;(3)DEA是一种非参数估计方法,不需要设定投入—产出的生产函数形式。


     本文采用的是Tone(2001)提出的SBM(Slack-Based Model),其优点在于能够解决特定产出不足的情况所带来的松弛问题。假设特定的DMU0需要m种投入xioi=1,……m)、k种产出yror=1,……k),s-i为第i种投入的松弛变量,s+r表示第r种产出的松弛变量,则基于产出导向(output-oriented)的SBM模型一般表达如下(余泳泽, 2009):


      在上面式子中,τ表示SBM模型的评估得分,该值在0~1之间,S- = ts- , S+ = ts+,Λ= tλo。根据该模型,当投入和产出的约束越松弛,也即 s-和 s+越大的时候,该DMU0的评估得分也越低;当 s-= s+= 0 的时候,该DMU0的评估得分等于1,表示最高绩效。

      借鉴有关利用PISA数据来进行学校评估的文献(Mancebón et al., 2012; Agasisti & Zoido, 2019),本文将SBM模型设定为产出导向型(output-oriented),并假定规模报酬可变(variable return to scale,简称VRS)。所谓产出导向型,是指假设学校教育遵循产出最大化(也即给定教育投入条件下学生社会与情感能力的最大化)而非投入最小化(也即既定学生社会与情感能力水平上的教育投入最小化)的原则。所谓规模报酬可变,是指每所学校,不管其教育投入的规模大小,都可以与最高绩效的学校去比较。最后,值得注意的是,考虑到小学和中学有所不同,为了满足DEA模型对DMU同质性的要求,本文将小学和中学分开进行成效值的估算,因此小学和中学的成效值计算结果并不完全可比。


 2. 随机森林方法

      本文运用随机森林(random forest)方法对影响学校社会与情感能力培养成效值的因素进行分析。该方法是在回归树(regression tree)方法之上发展起来的一种分析方法,已经被引入教育实证研究(Strobl, Malley, & Tutz, 2009)。


      在估计方法上,随机森林一般通过以下步骤实现:


      第一步,利用自助法(bootstrap)从原始数据中抽取样本量为n的子样本,并确定m个特征变量,形成数据集D= {xi1, xi2,……, xin, yi}(i∈[1,m])


      第二步,对每个子样本构建一个回归树,将回归树记为为tj(x);


      第三步,对所有回归树的结果进行汇总(取均值)来得到最优的估计结果,t(x) =∑j tj(x).


      相比于传统的多元回归分析通过设定函数形式来进行拟合并判断统计显著性,随机森林的优势非常明显,不仅不需要设定函数形式,而且可以对自变量的重要性(importance)进行排序,还能进一步给出偏依赖图(partial dependence plot)(陈强,2021)。


四、各城市中小学的主要特点


      (一)各城市中小学的社会与情感能力水平

      社会与情感能力是本文的教育产出变量,表2中呈现了各城市样本学校的整体水平,图1和图2则以蜘蛛网图的形式更为直观地呈现了各城市小学和中学的主要特点。




      第一,从学段来看,小学的社会与情感能力水平普遍高于中学。SSES测评的基本结果之一,便是10岁组学生的社会与情感能力高于15岁组学生(OECD,2021a)。在学校层面,这一结果也仍然成立。整体来看,各城市小学在五大能力上的均值都要高于中学,其中情绪控制的差异最为明显,差值达到32分;开放能力的差异最小,差值为8分。



      第二,从城市来看,小学阶段苏州在五大能力上表现最好,但中学阶段各城市在各能力上表现迥异。各城市的学校在五大能力上的表现差异很大,但是苏州的表现仍然引人注目。苏州的小学在任务能力、情绪控制、协作能力和开放能力上的表现都在10个城市中位列第一,交往能力也仅比大邱低1分。相比之下,赫尔辛基和休斯顿的小学的表现则差强人意,前者在任务能力、交往能力和开放能力上得分最低,而后者在情绪控制和协作能力上得分最低。与小学相比,各城市的中学在五大能力上的得分差异较大,没有哪个城市表现特别突出。


      (二)各城市中小学的教育投入水平

      本文选择了班级规模、教师学历、SSES培训、SSES措施、校园活动5个投入变量,表3中呈现了各城市样本学校的均值,不难发现在班级规模、教师学历和校园活动这三个指标上,各城市之间的差异较大,而在SSES培训和SSES措施这两个指标上,各城市之间的差异较小。



      首先是班级规模变量,如前所述,该变量是一个取值在1—9之间的等级变量,值越高表明班级规模越小。10个城市小学和中学的均值分别为4.9和4.7,表明小学的班级规模要略小于中学的班级规模。具体来看,在小学阶段,班级规模变量取值超过7的仅有赫尔辛基(7.5),说明赫尔辛基的班级规模在21—25人左右;班级规模变量取值小于3的有波哥大(2.4)、苏州(2.6)和马尼萨莱斯(2.7),表明这些城市小学的平均班级规模都较大,在41—45人左右。在中学阶段,班级规模变量取值超过7也是赫尔辛基(7.2),但是比小学略大;班级规模变量取值小于3的却是波哥大(1.7)、马尼萨莱斯(2.0)和伊斯坦布尔(2.9),表明在这些城市,中学的平均班级规模较大,而且普遍大于小学。值得注意的是,苏州的中学班级规模比小学要小。


      第二是教师学历变量,该变量用学校教师中具有本科及以上学历的百分比来衡量学校的师资投入水平。由表3可知,10个城市小学和中学的均值分别为84.1%和82.1%人,表明小学的教师学历普遍要略高于中学。具体来看,在小学阶段,本科及以上比例在90%以上的城市是渥太华、休斯顿和伊斯坦布尔,分别为99.3%、98.7%和92.9%,表明这3个城市的教师平均学历水平最高;本科及以上比例低于70%的城市仅有赫尔辛基(60.3%)。在中学阶段,本科及以上比例超过90%的城市仍然是渥太华、休斯顿和伊斯坦布尔,分别为98.3%、91.1%和91.3%;本科及以上比例低于70%的城市马尼萨莱斯和赫尔辛基,分别为67.7%和69.1%。


      第三是SSES培训,该变量的取值范围在1—8之间,用于衡量学校为教师提供社会与情感能力培训的频率,该变量的值越大表明频率越高。由表3可知,10个城市小学和中学的均值均为3.5,表明两类学校为教师提供社会与情感能力培训的频率基本一致。在小学阶段,SSES培训变量值最低的是渥太华,为2.7分,表明该城市的小学很少为教师提供社会与情感能力方面的培训;最高的是大邱,为4分,仅达到最高值8分的一半,表明该城市的小学为教师提供社会与情感能力方面的培训也不多。中学阶段与小学阶段的情况基本类似,最低值仍然是渥太华,为2.7分,但最高值是莫斯科,为3.8分。


      第四是SSES措施,该变量的取值范围在0—100之间,用于衡量学校为了提升学生社会与情感能力所采取的措施,该变量越大表明采取的措施越多。由表3可知,10个城市小学和中学的均值分别为49.9分和49.6分,小学要略高于中学,表明小学在提升学生社会与情感能力方面所采取的措施更多。在小学阶段,有5座城市的SSES措施变量均值在50分及以上,其中最高的是赫尔辛基,为50.8分。SSES措施变量均值最低的是莫斯科,为49.3分,但与最高值的差距并不明显。在中学阶段,大部分城市的SSES措施变量都低于50分,仅有苏州达到50.2分。但是,并不是所有城市的中学都比小学低,马尼萨莱斯、莫斯科和伊斯坦布尔这三座城市略有提高。


      最后是校园活动变量,该变量的取值范围在0—90之间,用于衡量学生参与各类校园活动的程度,该变量越大表明学生参与程度越高。由表3可知,10个城市小学和中学的均值分别为34.3分和36.8分,表明中学生参与校园活动的程度更高。在小学阶段,校园活动参与程度最高的是莫斯科,达到64.5分,最低的则是赫尔辛基,仅有10.9分。类似地,在中学阶段,校园活动参与程度最高也是莫斯科,达到66.7分,最低的仍是赫尔辛基,为12.1分。总体来看,在同一城市,小学的校园活动参与程度都要低于中学,仅大邱和苏州两个城市例外,中学的校园活动参与程度低于小学。


五、成效评估结果


(一)整体情况

      本部分运用DEA方法中的SBM模型,将班级规模、教师学历、SSES培训、SSES措施、校园活动作为学校社会与情感能力培养的投入变量,将五大能力作为学校社会与情感能力培养的产出变量,评估10个城市1171所中小学的社会与情感能力培养成效。DEA评估的结果是一个0~1之间的数值,数值越大表示培养成效越高,1则为最高值。考虑到学校教育的特点,本文将成效值为1的学校称为高绩效学校,将其他学校称为低绩效学校。评估的主要数据结果呈现在表4中,图3和图4则采用箱线图的形式直观呈现了各城市小学和中学培养成效值的分布情况。




      第一,从整体来看,各城市中小学的社会与情感能力培养成效普遍较好。无论是小学还是中学,整体成效均值都接近或者超过0.9,除了位于辛特拉的一所小学和一所中学之外,其他所有学校的成效值都在0.7以上。由此可见,将社会与情感能力作为产出的学校绩效评估,其评估结果普遍较好,特别是与基于认知能力为主的学校绩效评估相比。例如,Agasisti & Zoido(2019)利用PISA2012的数据,将阅读和数学成绩作为产出变量,对28个国家的6800所学校进行绩效评估,得到的绩效均值仅为0.699。相比之下,本文以SSES数据测算的中小学社会与情感能力培养成效的均值都要高出很多。


      第二,分学段来看,在小学阶段苏州培养成效最好,在中学阶段伊斯坦布尔培养成效最好。表4中的数据表明,苏州小学段培养成效的均值为0.941,在10个城市中位居第一,比整体均值高0.043。相比之下,休斯顿小学段培养成效的均值为0.839,在10个城市中居于末尾,比苏州低0.102。由此可见,小学阶段苏州在社会与情感能力培养上的优势突出。伊斯坦布尔中学段培养成效的均值为0.966,在10个城市中位居第一,比整体均值高0.025,比末位的辛特拉高0.064,优势也十分明显。


      第三,从均衡性来看,各城市呈现出不同特征。如图3所示,在小学阶段,苏州属于高水平均衡型,即箱体较短且位置靠上。苏州的中位数为0.931,最小值为0.863。休斯顿属于典型的低水平均衡,即箱体较短且位置靠下。休斯顿的中位数为0.832,最小值0.783。辛特拉则是均衡性最低的城市,具体表现在其箱体之外的极端值过多(圈和星)。虽然该城市的中位数并不低(0.852),但最小值仅为0.689。


      如图4所示,在中学阶段,伊斯坦布尔属于高水平均衡型,箱体位置靠上。伊斯坦布尔的中位数为0.963,最小值为0.921。渥太华和莫斯科两个城市属于低水平均衡型,箱体位置靠下。渥太华的中位数为0.916,最小值为0.898;莫斯科的中位数为0.918,最小值为0.882。在所有城市中,辛特拉的均衡性最低,虽然中位数不算最低(0.937),但是最小值为0,在所有城市中最低。


      最后值得注意的是,大部分城市的中小学都有高绩效学校(即成效值=1),但是渥太华和休斯顿两个城市比较特殊。渥太华小学阶段的成效最大值为0.950,休斯顿中学阶段的成效最大值为0.966。那么,高绩效学校在各城市之间的分布情况如何?下面小节将展开进一步分析。



    (二)高绩效学校的数量与特征

本文将高绩效学校定义为成效值等于1的学校。在入样的1171个学校中,共有169所高绩效学校,占总体的14.4%,其中小学82所,中学87所。每个城市的平均成效值不同,拥有的高绩效学校数也不同。表5中呈现了各城市高绩效学校的分布情况。



      由表5可知,在小学阶段,波哥大(21所)、伊斯坦布尔(18所)、马尼萨莱斯(15所)和苏州(15所)是拥有高绩效学校较多的城市,分别占小学阶段高绩效学校总数的25.6%、22.0%和18.3%和18.3%,合计超过80%。不仅如此,这四个城市的高绩效学校比例也很高,分别达到24.4%、22.2%、25.9%和20.0%。在中学阶段,伊斯坦布尔表现也十分突出,拥有20所高绩效学校,占中学阶段高绩效学校总数的23%。但从高绩效学校占该城市学校总数的比例来看,却是马尼萨莱斯最高(36.1%),虽然该城市只有13所高绩效学校,甚至低于波哥大的高绩效学校数(17所)。


      最后,本文对高绩效学校和低绩效学校在投入、产出上的特征进行比较,基本数据结果呈现在表6中。通过对比不难发现,高绩效学校的重要特征在于低投入和高产出,即也就是在相同的教育投入条件下,学校整体的社会与情感能力更高。无论是小学还是中学,高绩效学校在五大能力上的均值都明显高于低绩效学校。例如,小学阶段高绩效学校在任务能力、情绪控制、协作能力、交往能力和开放能力上的均值比低绩效学校分别高出31分、24分、26分、17分和32分;中学阶段则分别高出13分、14分、12分、14分和24分。



      从投入变量上来看,无论是小学还是中学,高绩效学校的投入量都要低于低绩效学校,其中教师学历、SSES培训和校园活动这三项指标最为明显。在小学阶段,高绩效学校的教师学历、SSES培训和校园活动的均值分别为61.3、40.1和19.0,而低绩效学校在这三项上的均值分别为87.4、63.2和36.6。类似地,在中学阶段,高绩效学校的教师学历、SSES培训和校园活动的均值分别为54.3、48.3和25.4,而低绩效学校在这三项上的均值分别为87.6、60.1和39.0。由此说明,学校对社会与情感能力的培养并不对资源有很高的要求,一些社会与情感能力培养成效最高的学校,并不一定是靠人力和设施大量的投入来实现的,而是需要考量其他因素的作用,这个需要进一步研究的证实。


    (三)成效值的影响因素分析

      最后,本文运用随机森林方法对学校社会与情感能力培养成效值的影响因素进行分析。在影响因素的选取上,本文参考《超越学科学习》官方报告(OECD,2021a),并结合SSES数据可得性,将自变量设定为师生关系(relteacher)、学校归属感(belong)、校园欺凌(bully)、考试焦虑(anxtest)、亲子关系(relpar)这五个。上述五个自变量都是OECD利用IRT方法在学生问卷中生成的连续变量(均值为50、标准差为10),本文在学校层面对上述变量进行汇总形成学校变量。通过随机森林分析可以得到上述五个变量的重要性,结果呈现在表7中。



      变量重要性是随机森林分析结果的主要呈现方式。因为随机森林方法基于多个回归树,无法像单个回归树那样进行直观解释,但是可以通过分裂准则函数的下降幅度来对各个自变量的重要性进行排序(陈强,2021)。分裂准则函数通常包括均方误差(Mean-square Error, MSE)和节点纯度(node purity)。前者主要指预测误差的增幅,在表7中是IncMSE,该值越大表明该自变量对成效值的影响越大;后者主要指残差平方和(Residual Sum of Squares, RSS)的减少,在表7中是IncNodePurity,该值越大也表明该自变量对成效值的影响越大。


      从表7的结果可知,在小学阶段,学校归属感的重要性最大,IncMSE值和IncNodePurity值分别为41.30和0.32,远高于其他自变量,这说明相比于其他因素,学校归属感对小学社会与情感能力培养成效的影响最大。类似地,在中学阶段也是学校归属感的重要性最大,IncMSE值和IncNodePurity值分别为26.18和0.08,明显高于其他自变量,但比小学要低。这说明,在中学阶段,学校归属感对社会与情感能力培养成效也具有很大影响,但是相比小学而言,程度有所降低。


      为了进一步刻画学校归属感对社会与情感能力培养成效值的影响,图5中呈现了影响效应的偏依赖图。传统的回归分析方法仅通过回归系数来表示在平均趋势(均值)上的自变量对因变量的影响,而随机森林则可以通过偏依赖图来细致展现自变量在不同水平上的变动对因变量所带来的影响。图5的左半部分和右半部分分别是小学和中学的结果,可以看出,无论是小学还是中学,随着学校归属感的提升,成效值也基本上呈上升趋势,肯定了学校归属感对培养成效的积极促进作用。当然,无论是小学阶段还是中学阶段,当学校归属感达到一定水平之后,对于培养成效值的促进作用有所减缓,也即通常所说的“天花板效应”。此种现象在小学更为明显。



六、启示与建议


      基于2021年SSES全球测评的数据,本文采用SBM模型对全球10个城市的1171所中小学的社会与情感能力培养成效进行评估。结果表明,各城市社会与情感能力培养成效普遍较高,小学阶段的均值在0.8以上,中学阶段的均值在0.9以上。但是,各城市之间的差异较为明显,均衡性较高的是苏州的小学和伊斯坦布尔的中学,而辛特拉的小学和中学均衡性都较低。值得注意的是,苏州虽然在小学阶段优势明显,均值在10个城市中位居第一,但是高绩效小学在绝对量和占比上并不特别突出。因此,对于苏州学校来说,当务之急是在注重均衡发展的同时,进一步提升社会与情感能力培养的质量。


      通过上述研究,本文认为着眼于我国中小学社会与情感能力的培养问题,可以提出如下四点政策建议。第一,加强国际合作和国际研究,将我国中小学的社会与情感能力培养放置于国际坐标系之中,为补齐发展短板提供标准参照和实证支持。比如,在高绩效学校最多的城市波哥大,从2004年开始就在哥伦比亚教育部的指导下对学生的社会与情感能力进行评价(OECD,2021c)。而对于我国而言,测评恰恰是短板,因此未来以测评手段加强学校社会与情感能力的培养有可能成为我国培养实践的可行路径。第二,总结苏州经验,将苏州在小学阶段的社会与情感能力培养的成功实践进行梳理,特别关注高绩效学校的典型案例,作为样板推动苏州乃至全国的中小学的社会与情感能力培养工作。第三,坚持优质均衡,将更高水平的均衡作为我国中小学社会与情感能力培养工作的重要目标,进一步提升扩大我国中小学在社会与情感能力培养上的优势地位。第四,学校归属感对于提升中小学社会与情感能力培养成效具有重要促进作用,在未来的实践中,可以尝试以此为抓手来促进我国中小学社会与情感能力培养。


      纵观国内外既有文献,本文是最早在国际比较的视野下进行社会与情感能力培养成效进行评估的实证研究,因此本文也不可避免地在数据和方法上存在研究局限。在数据上,由于不同城市之间校长问卷的填答数据差异较大,所以有部分城市的学校由于存在缺失值的缘故而没有进入分析,比如辛特拉的小学入样率仅为57.4%。在变量上,仅考虑投入和产出变量,而对学校教育的过程性变量的考虑不足。在方法上,DEA属于经济学中的效率分析方法,在教育学中虽然有很多应用,但是存在较大争议。一方面,DEA方法源自于对企业的效率分析,运用传统观点将企业的生产过程视为“黑箱”(black box),仅从投入和产出这两端来进行评估,缺乏对过程性因素的考量(Cook & Seifordb, 2009)。对于学校教育而言,将复杂的教育过程简单抽象为教育资源投入带来的学生能力变动也难免存在一定局限。另一方面,DEA方法的评估结果也高度依赖于投入指标的选取,不同的指标可能导致不同的评估结果。因此,在未来,还有更多研究值得开展,一方面是数据和方法的不断完善,另一方面是如何在成效评估的基础上,更好地识别影响学校培养成效的关键因素,并以此促进学校培养成效的进一步提升。


(唐一鹏工作邮箱:yptang@dedu.ecnu.edu.cn;本文通信作为黄忠敬:zjhuang@dedu.ecnu.edu.cn)


为适应微信排版已删除注释和参考文献,请见谅,如需阅读全文,请点击左下角“阅读原文”获取。




上期回顾

引论

袁振国 | 教育数字化转型:转什么,怎么转

理论与原则

祝智庭  戴岭 | 设计智慧驱动下教育数字化转型的目标向度、指导原则和实践路径

吴永和  许秋璇  王珠珠 | 教育数字化转型成熟度模型研究

蔡连玉  金明飞  周跃良 | 教育数字化转型的本质:从技术整合到人机融合

靳彤  李亚芬 | 理解数字化时代的学校公共空间——教育数字化转型的实践难题

江波  丁莹雯  魏雨昂 | 教育数字化转型的核心技术引擎:可信教育人工智能

路径与策略

余胜泉 | 教育数字化转型的关键路径

尚俊杰  李秀晗 | 教育数字化转型的困难和应对策略

杨晓哲  王若昕 | 困局与破局:教育数字化转型的下一步

田小红, 季益龙, 周跃良 | 教师能力结构再造:教育数字化转型的关键支撑

李锋  盛洁  黄炜 | 教育数字化转型的突破点:智能教材的设计与实现

李海伟  王龚  陆美晨 | 教育数字化转型的路径探索与上海实践

课程指南

中小学人工智能课程指南课题组 | 中小学人工智能课程指南


点击左下角【阅读原文】访问华东师范大学学报教育科学版官网,可下载本刊各期文章PDF全文,也可在线阅读本刊各期文章的XML格式全文。

我知道你在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存