魏易, 等|区域教研对学生学业成绩影响的实证研究——以北京市海淀区为例
本期 · 精彩
新刊速递 | 华东师范大学学报(教育科学版)2021年第5期目录
专刊 · 绪论
区域教研对学生学业成绩影响的实证研究
——以北京市海淀区为例
文 / 魏易, 罗滨, 林秀艳, 杨智君, 王梦
摘要:教师专业发展是提高学校教育质量和学生学业成绩的关键因素。随着各国对教师专业发展的重视和投入的增加,政策制定者越来越重视教师专业发展的有效性研究。本研究聚焦具有中国特色的区县基础教育教学研究体系,基于北京市海淀区2016—2019年高中阶段学生及其任课教师、所在学校相匹配的数据,采用增值模型、多层线性模型和结构方程模型,分析教师参与区级和校本教研活动对教师的教学实践、自我效能和学生学业成绩的影响。分析结果显示:(1)教师参与区级教研活动的程度对学生成绩有显著的正向影响,其中聚焦于学科课程内容的教研活动对学生成绩的增值作用尤其显著;(2)参与区级教研活动程度较高的教师具有更高的自我效能感,在其课堂教学过程中更倾向于组织探究性和以学生为中心的教学活动,以及采用更加多元的评价策略;(3)教师参与校本教研活动的程度对学生成绩同样具有显著的正向影响,教师之间的非正式交流的积极作用不容忽视;(4)对校本教研的中介作用的分析显示,区级教研通过提升教师校本教研的参与程度,间接影响教师教学实践。
关键词: 教师专业发展 ; 区域教研 ; 学业成绩 ; 增值评估
作者简介
魏易,密歇根州立大学教育学博士,北京大学中国教育财政科学研究所助理研究员。
罗滨,北京市海淀区教师进修学校校长,正高级教师,北京市化学特级教师,教育部基础教育课程教材专家委员会委员。
作者简介
一、研究背景
二、文献综述
三、数据和分析方法
四、区域教研活动与教师的教学实践和自我效能
五、区域教研活动与学生成绩
六、总结和讨论
一、研究背景
教师是提高学校教育质量和学生学业成绩的关键因素,为此,各国政府都致力于提高教师素质和教学水平,从而提高学校的教育质量和学生的学业成绩。世界银行2018年的全球发展报告指出,许多国家和地区存在一种学习危机:学生尽管在上学,但却没有进行有效的学习(World Bank,2018)。造成学习危机的主要原因包括:儿童早期教育和学前教育准备不足,学校教育资源投入不足、使用效率低,教师缺乏有效教学的知识、技能和动力等。尤其是在基础教育阶段,教师的人员支出占学校经费的四分之三左右,这是影响学生在校学习效果的关键因素。提高教师队伍质量,不仅需要吸引和留住有才能的人从事教学,还需要为在职教师提供专业发展的机会。教师专业发展活动是被广泛认可的提高教师知识技能、教学实践和学生学习成绩的关键途径,也是课程和教学改革得以落地和实现的基础(National Commission on Teaching and America’s Future,1996;Day and Sachs,2005;European Commission,2005;Darling-Hammond et al.,2009)。随着各国对教师专业发展的重视,政策制定者越来越重视教师专业发展的有效性,以促使有限的公共资源能够得到更好的分配和使用。教师专业发展的最终目的是改善和提高学生的学习,因此教师专业发展对有效提高教师教学水平和学生学习成绩至关重要。
自从1966年《科尔曼报告》分析了学生学业成绩的差异来源之后,教育实证研究一直致力于打开教育生产的黑箱,分析学校、家庭和社会环境对学生学业成就的影响(Glewwe et al.,2011)。教师作为其中最重要的一个因素,受到了高度的关注。早期的研究在分析教师对学生学业成就的影响时,主要聚焦于教师的个人和专业背景,例如教师的教龄、学历、资格、工资和职称等。随着人们对学校和教师效能的关注,以及对教师专业发展的重视,越来越多的研究逐渐聚焦到了教师专业发展对教师和学生的影响上(Desimone,2009;Hill et al.,2013)。另一方面,随着TIMSS和PISA等国际测试项目的开展,学生成绩名列前茅的中国、日本、韩国、新加坡等东亚国家受到了高度的关注。在研究了这些国家的教育体系和教学组织方式之后,学者们认为这些国家的学生之所以能够取得较好的成绩与教师专业发展的组织和制度安排密切相关。例如师徒带教、集体备课、相互听课、磨课以及教学研究小组等,使教师不仅在入职阶段可以得到融入专业共同体的机会,在入职之后也能够有组织地参与到持续的专业发展活动中(Darling-Hammond et al.,2017;World Bank,2018)。
在中国,省(自治区、直辖市)、市、县(区)教研室和学校教研组的四级教研体系自建立之初就与基础教育的建设和发展紧密相连,长期以来在保障教学秩序、支持课堂教学、组织教学研究、推进课程改革等方面起到了不可替代的作用,是极具中国特色的基础教育教学研究制度。在关键时期,教研组织承担了培训教师、提高教师专业水平的重要任务,保证了我国中小学教学的基本质量。随着我国基础教育改革和中小学课改的不断发展,教研体系越来越成为推进课程教学改革、提高教学质量和教师专业发展的核心力量(丛立新,2011;梁威等,2011)。在这一过程中,教师专业发展也经历了从单一化、学历补偿式培训模式向以教师为主动学习者的教师专业发展模式的转变。学者和实践者越来越倡导以学校为本,通过教学实践和教师反思性学习实现专业发展(卢乃桂,2006;宋萑,王恒,2019)。而另一方面,相对于国外的教师专业发展活动的实证研究,目前国内相关领域的研究,尤其是教师专业发展有效性的研究相对较少。现有研究对教师专业发展活动的各方面因素有所涉及(张文静等,2010;赵健等,2013;托马斯等,2015),但尚未有研究将区域教研活动作为一个整体,将包括区级和校级在内的各类教师专业发展活动与学生的学业成绩联系起来,探讨其对学生学业成绩影响。本文基于教师专业发展的实证研究框架,以北京市海淀区为例,采用增值模型、多层线性模型和结构方程模型,分析区级和校本教研活动对教师的教学实践、自我效能和学生学业成绩的影响。
二、文献综述
本节首先回顾了国外尤其是美国从20世纪80年代开始的教师专业发展的实证研究如何定义、衡量和评估高质量、有效的教师专业发展活动。目前国外教师专业发展活动的实证研究主要包括三类:一是通过更加“客观”的标准,例如学生成绩,来衡量教师专业发展活动的效果;二是收集和分析教师专业发展活动的某类“特征”及其效果;三是采取“随机实验”的方法评估专业发展的效果。其次,我们对国内教师专业发展活动的实证研究进行了梳理。目前国内对于教师专业发展活动的实证研究大致可分为三类:一是描述和分析教师专业发展活动现状,包括教师专业发展活动的供给、教师的需求以及专业发展活动的地区和城乡差异;二是探讨影响教师参与专业发展活动的个人层面和组织机构层面的因素,提出教师的自我意识、教师专业共同体、学校的组织因素以及教师专业培训和教研体系特征等对教师专业发展的影响;三是检验教师专业发展是否有效影响了教师自身的知识、态度、实践以及学生的学习结果。最后,在回顾国外和国内教师专业发展活动的实证研究的基础之上,形成本文的基本分析框架。
(一)国外教师专业发展的实证研究
早在20世纪20年代,就有学者对教师的教学活动和教师培训的要素进行研究(Charters & Waples,1929),但在如何描述教师的工作以及教师所需的知识和技能方面,并未达成共识,也未采用同一套概念进行对话。从20世纪70年代开始,评估教师专业发展活动有效性的实验研究开始出现(Carpenter et al.,1989)。随着对教师专业发展的重视,相关研究呈现出爆炸式的增长,但仍然只有部分研究关注教师专业发展活动对学生学习过程或结果的影响,其中采用较为严格的因果推断或者实验方法的研究则更少(Kennedy,2016)。直到1990年,对教师专业发展活动有效性的评估还主要依靠教师自我汇报的满意度、态度和观念等方面的变化,较少关注专业发展活动的结果以及产生结果的机制和关键因素(Desimone,2009;Hill et al.,2013)。一方面,观察、访谈等质性研究方法和教师的满意度调查仍旧是评价专业发展活动效果的重要工具,基于民族志和深度案例研究的方法能够全面深入地研究教师在专业发展活动中的经历和经验。另一方面,随着政府对教师专业发展的重视和公共财政投入的增加,以及政策制定者对可复制、可推广的教师专业发展活动的需求,推动了通过教师专业发展活动提高教师教学水平和学生学习效果的趋势性、相关性和有效性的研究。
发展到现在,有关国外教师专业发展活动的实证研究主要包括三类:第一类是通过更加“客观”的标准,例如学生成绩来衡量教师专业发展活动的效果。随着标准化考试被全球各国的教育系统采纳,越来越多的国家开始采用学生的考试成绩为教育政策的制定、学校的问责、教师的考核和日常行政管理工作提供数据支持(Lingard et al.,2013)。20世纪60年代就有国家和地区使用增值评估的方法来评价学校教育对学生学业的影响。随着西方国家教育问责制的普遍实施,教育增值模型从学术领域进入了政策实践领域,已经成为教育问责的重要工具。例如,2002年美国通过《不让一个孩子掉队》法案,要求各州测试学生阅读和数学成绩并对学校进行问责。于是,美国许多州开发了自己的教育增值模型,州政府采用模型评估结果对公办学校乃至教师实施问责。再例如经济合作与发展组织(OECD)主导的教育系统国际指标项目(Indicators of Education Systems)也将增值评估的方法纳入国际教育指标系统中。
第二类是收集和分析教师专业发展活动的“特征”及其效果。面对各类正式和非正式的教师专业发展活动,部分研究者主张聚焦于高质量的、有效的专业发展活动特征,进而收集相关的数据,对专业发展活动与教师教学和学生学习之间的趋势性、相关性和有效性进行描述和分析(Kennedy,1998;Garet et al.,2001;Penuel,2007;Yoon et al.,2007;Desimone,2009;Darling-Hammond et al.,2017)。尽管目前对高质量的、有效的专业发展活动的特征暂无明确统一的定义,但支持者认为根据以往的理论、质性和实证研究,已经能够总结出得到广泛认可的特征。其中,Kennedy(1998)根据专业发展活动的内容特征进行分类,分析了不同类型的专业发展活动对学生学习的影响①。此后,Yoon et al.(2007)回顾了1300多项教师专业发展活动对学生成绩影响的研究,采用了Kennedy对专业发展活动的分类,对其中9项符合有效教育策略资料库(What Works Clearinghouse)标准的实验研究的有效性进行了分析。此外,也有一部分研究对某个大型的教师专业发展活动的有效性进行评估(Garet et al.,2001;Penuel,2007)。例如,Garet et al.(2001)基于对高质量专业发展活动的共识,设计了一套问卷对全国1027名参加联邦艾森豪威尔专业发展项目(Eisenhower Professional Development Program)的教师进行调查,分析该专业发展活动的结构和核心特征的有效性②。在前期综述研究的基础上,Darling-Hammond et al. (2017)回顾了过去三十年聚焦于教师专业发展对学生学业成绩影响的实证研究,尤其是那些发现教师专业发展对学生学业有积极影响的研究,从中提炼出了七个被广泛认可的特征,包括聚焦课程内容、融入主动学习、支持协作、示范和模范、专家指导和支持、反馈和反思以及具有持续性③。
然而,此类研究存在一定的局限性。首先,由于专业发展活动的实施是有选择性的(例如,项目会选择更加积极和配合的学校和教师,或选择更加有需要的学校和教师),同时教师也会根据自身的基础和需求选择更加合适的项目,因此专业发展活动的实施效果因学校和教师本身的特质而有差异,最终的结果不完全是由专业发展活动所带来的。其次,大部分研究是基于教师自我汇报的结果,而非基于课堂观察、测试、活动日志等更加客观得出的结果,会对效果的估计造成偏差。因此,更加准确的估计就需要对同一项专业发展活动在不同学校、不同培训者和接受培训的群体之间进行比较。然而大多数有效的专业发展活动的研究项目规模不大,因此缺乏大规模推广的结果对比,也就可能导致对项目的评估结果截然不同。
第三类研究是为了解决第二类研究的局限性,采取“随机实验”的方法评估教师专业发展的效果。随机实验原本是医学研究监测药物效果的手段,其基本方法是将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。社会学领域的随机实验核心在于利用实验的操作技巧(如随机化被试、控制相关变量),来评估变量之间的因果效应,从而对现实世界所发生的事件之间的联系给出科学的检验(罗俊等,2015)。20世纪30年代,随机实验方法被用于农业生产领域。20世纪下半叶,一些国家的政府开始推动大规模的社会实验。最早的一项教师专业发展活动的随机实验是20世纪70年代末Good et al.(1983)对美国教育学会(National Institute for Education)支持的密苏里州有效数学教学项目的评估。随后,也有其他研究者开始采用随机实验的方法评估专业发展的效果(Carpenter et al.,1989)。这些研究通过实验的方法,部分证实了之前经验研究认为的有效的教师专业发展活动特征确实起到了积极的作用。2002年美国联邦政府通过的《不让一个孩子掉队》法案提出教育政策需要有符合科学标准的研究支持(scientifically based research),并强调优先考虑采用随机实验研究的成果。教育科学研究学会也在其教育研究基金的申请标准中加强了对教育实证研究和实验研究的导向(U.S. Department of Education,2002;IES,2012)④。受此影响,后来涌现出了一大批教师专业发展活动的研究,致力于采用随机实验的方法发现有效的、可推广的专业发展活动。
总的来说,教师专业发展有效性的实证研究方法在不断发展,研究者和实践者不满足于仅评估单个教师专业发展的效果和关键特征,还想要对项目的外部有效性以及不同项目之间的有效性进行比较。Borko(2004)在其具有较大影响的一篇文章中将教师专业发展有效性的研究分为三个阶段。第一阶段的研究主要关注单一地点实施的某一项教师专业发展活动,其主要目的是确认该专业发展活动是否具有可行性,是否有效提高教师的教学水平和学生的学习效果。第二阶段的研究主要关注多个地点同时实施的某一项专业发展活动,其主要目的是确认该项专业发展活动在不同的情境中由不同的培训者实施的时候是否能够保持有效性。第三阶段的研究关注的专业发展活动开始扩展到对多个地点实施的多个项目进行比较,其主要目标是对不同类型的专业发展活动的实施过程、效果以及所需要的资源进行比较,其结果为相关政策的制定和公共资源的配置提供支持。
为了对单项和多项教师专业发展活动进行评估和比较,需要对项目各要素和环节有更加清晰的定义,建立一个将项目各要素、过程和结果联系起来的逻辑框架。很多学者尝试构建教师专业发展如何影响教师知识、技能、观念和态度并最终影响学生学习效果的理论框架。Kennedy(1998)将专业发展活动的影响路径分为三类:第一类路径注重改变教师特定的教学行为,从而改变学生的学习;第二类路径注重改变教师的知识,从而改变教师特定的教学行为和学生的学习;与第二类路径相似,第三类路径也注重改变教师的知识和教学行为,但对教学行为不做过多详细要求。与Kennedy归纳的第一类专业发展活动的逻辑类似,Supovitz(2001)提出高质量的专业发展活动是通过改变教师的课堂教学行为,从而促进学生的学习。Guskey & Sparks(2002)认为有效的教师发展活动不仅改变教师的行为,也改变教师的知识。Yoon et al.(2007)的研究认为教师的专业发展分两步影响学生成绩,即教师的专业发展首先是提高教师相关的知识技能,然后是提高教师课堂教学实践,最后才能提高学生成绩。在回顾以往研究的基础之上,Desimone(2009)提出了一个教师专业发展有效性研究的概念框架,该框架概括了教师专业发展的关键特征、教师知识和理念、课堂实践与学生成绩之间的相互影响的关系(图1)⑤。
首先,教师参加专业发展活动;其次,专业发展活动增长了教师的知识和技能,改变其态度和理念;再次,教师用新知识和技能或转变了的态度和理念来改善教学内容或教学方法,或两者兼而有之;最后,教学改变促进了学生的学习。该框架可以从教师的转变(如专业发展改变教师知识、理念或实践)和教学改进(如改进教学实践影响学生成绩)两方面来检验专业发展的有效性,而这两个方面对理解专业发展如何产生影响均不可或缺。除了教师专业发展的关键特征、教师知识和理念、课堂实践与学生成绩以及这四部分要素之间的相互关系之外,框架中还包括一些个人、机构和环境因素:(1)学生的个人和学术特征;(2)教师的个人、专业背景特征,也包括教师的经验、知识、信念、态度等;(3)班级、学校、学区等环境因素;(4)各层级政府和相关政策环境。
尽管对什么是有效的教师专业发展没有统一的定义,大量关于教师专业发展如何影响教师自身和学生学习的实证研究也并没有使用完全一致的影响路径,图1的概念框架也没有囊括所有可能影响专业发展有效性的要素,例如教师专业认同、专业团体协作、校长领导力等要素在支持专业发展中的作用,但图1的框架仍旧提供了研究之间相互探讨的基础。首先,该框架基本上包含了教师专业发展活动有效性研究的基本要素,使得研究观察和测量的指标相对一致和稳定,并为相关的实证研究提供了讨论和对话的基础。其次,该框架为聚焦教师专业发展有效性研究的计划和时间线的制定提供了一定的指导,即从教师专业发展活动到活动对教师知识、信念、态度的影响和改变,进一步改变了教师的教学实践,从而影响了学生的学习和学业成就。最后,在共同的框架和研究基础之上总结的有效专业发展的要素、特征和影响机制能够为实践者提供更多的信息,可以帮助学校和教师设计更加有效的专业发展活动。
(二)国内教师专业发展的实证研究
目前国内对教师专业发展活动的实证研究大致可分为三类:一是描述和分析教师专业发展活动现状,包括教师对专业发展活动的需求和评价、专业发展活动的供给情况以及专业发展活动的城乡和地区差异;二是探讨影响教师参与专业发展活动个人层面和组织机构层面的因素,提出教师的自我意识、教师专业共同体、学校的组织因素以及教师专业培训和教研体系特征等,都会影响教师的专业发展活动;三是将教师专业发展活动与教师知识技能、课堂教学实践以及学生学业成绩的变化联系起来,检验教师专业发展是否有效影响了教师自身的知识、态度和实践以及学生的学习结果。
1. 教师专业发展活动的需求情况
(1)教师的类型
不同类型的教师对专业发展活动的需求程度不同,穆洪华(2018)基于2014年中国基础教育质量监测7个省市的数据,对公办小学教师培训情况进行分析后发现:从学历来看,学历越低的教师,其对专业发展活动的需求越高;从教龄来看,新教师对培训的需求更高;从学科来看,不同学科教师的需求度也不同,就主科(语文、数学、英语、科学)而言,科学教师的需求要远远高于其他三科教师;从城乡来看,我国乡村教师对教师专业发展迫切需求的比例要高于城镇,乡村教师更加需要专业发展活动(李琼等,2018)。
(2)培训内容
大量研究表明,教师最需要的培训内容是学科教学方法。越贴近教师实践的知识与技能,越被教师认为是最需要的。李琼等人(2018)的研究发现,城乡教师对学科教学法知识方面的培训需求更大。李琼等人(2013)对北京市教师的调查发现,学科教学法与学科前沿知识是教师最需要研修的内容。同样,赵明仁等人(2009)对北京市中小学教师专业发展活动的调查发现,超过半数的教师认为自己目前最需要进修的内容是学科教学方法。陈向明和王志明(2013)对全国9省中小学教师的调查发现,教师最希望从培训中所学到的内容是教学方法及策略。朱小虎和张民选(2017)对TALIS数据的分析也发现,上海教师最为需要的两个专业发展内容分别为个性化学习的教学方法和学科教学能力培训。
除了学科教学方法外,教师对学生发展相关内容培训的需求也十分强烈。陈向明和王志明(2013)的研究发现,教师对学生发展和心理健康培训的需求仅次于教学方法和策略。蔡金花和曾文婕(2018)对初中教师的调查也发现,教师对于深入了解学生发展特点的培训需求相对较强。柯政和洪志忠(2011)对中学教师的调查发现,教师参加培训意愿最高的是有关学生学习和发展的专业发展活动。
(3)培训形式
教师对培训形式也存在明确的需求指向性。教师更愿意接受通过团队研讨性的活动来提升专业发展水平,教师需求最强烈的培训形式是教学观摩研讨和同事间的交流。蔡金花和曾文婕(2018)的研究发现,观摩他人教学并在课后进行研讨、与同事分享经验以及讨论问题是初中教师认为最想参加的教研活动形式。李琼等人(2013)的研究也发现,从教师对日常教研活动形式的满意度与有效性来看,教师感到最有效的是跨校、跨区教学观摩研讨,其次是同事之间的随时交流。
需要注意的是,不同阶段教师对培训形式的需求可能存在差异。蔡金花和曾文婕(2018)发现5年以下教龄的教师对观摩他人教学、与同事分享和讨论的需求特别强烈。相比之下,5—10年教龄的教师对于专家讲座和课题研究的需求比其他教龄的教师要强烈。这与崔允漷(2011)的研究发现一致:中高职称教师对听专家报告和做课题研究这两项专业发展活动持有较高水平的认可。
2. 教师专业发展活动的供给情况
教师最需要的专业发展活动内容是学科教学方法和学生发展,最需要的专业发展活动形式是教学观摩和研讨。而在实际供给上,从培训内容来看,供给最多的也是学科知识和教学方面的相关培训。朱小虎和张民选(2017)对TALIS数据的分析发现,所教学科领域的知识和理解以及教学能力是上海教师专业发展活动中最为重要的内容。薛海平和陈向明(2012)通过全国范围的调查发现,教师认为自己接受最多的培训内容是教育教学理论、学科教学、教学方法及策略、班主任工作和学校及课堂教学管理。培训内容的供给基本上满足了教师需求。从培训形式来看,李琼等人(2018)的研究发现,城乡教师参与率最高的教研形式是“工作坊或日常备课和公开课研讨”。朱小虎和张民选(2017)对TALIS数据的分析发现,上海教师参与率最高的教研形式是课程工作坊、带教和相互观摩。薛海平和陈向明(2012)通过全国范围的调查发现,在被调查者接触的培训中,最常见的几种培训方法是集中讲授、听课评课与录像观摩。培训形式的供给也能够满足教师的需求。
限于调查数据所覆盖的范围,大部分针对教师培训和专业发展的差异分析仅局限在部分省市。例如李琼等人(2018)基于5个省的项目市县的乡村学校教师调查,采用TALIS中的教师专业发展工具,分析教师对专业发展的需求以及影响发展有效性的因素。穆洪华(2018)基于2014年中国基础教育质量监测7个省市的数据分析了这些地区教师专业发展活动是否具备有效教师专业发展的特征要素。薛海平和陈向明(2012)调查全国9省市中小学教师培训现状,采用多阶段分层随机抽样对中小学教师以及教师培训者进行了问卷调查。王艳玲和胡惠闵(2020)、谢晨和尹弘飚(2021)是少数基于全国各省的教研机构和教师调查的数据,对教研和教师专业发展活动的开展情况进行分析的研究。其中,Yin et al.(2020)基于全国范围内教研员的抽样调查,对作为教师专业发展活动的主要提供者教研员的工作特征和专业发展需求进行了分析。谢晨和尹弘飚(2021)基于全国30个省级行政区47620位中小学教师对本区县教研工作开展的评价,构建并计算了各省的教研工作质量指数和教研发展均衡指数,发现基于教师评价的教研和专业发展活动在地区之间存在较大差异,既有以上海、浙江、辽宁等为代表的高质量、高均衡省份,也有北京、天津、山东等高质量但均衡较低的省份,此外中西部地区还存在大量低水平、低位均衡的情况。
3. 影响教师参与专业发展活动的因素
教师参与专业发展活动面临着各类主客观因素的挑战,大致可分为教师个人因素和组织机构因素两类。例如,王双龙(2017)的研究发现,教师的自我意识会显著影响教师的专业发展水平,教师的自我意识程度越高,投入自身专业发展的积极性越高。李琼等人(2018)发现,“与工作时间冲突”是阻碍城乡教师参与专业发展活动的最重要的两个因素之一,而“项目或课程过于昂贵”是乡村教师参与专业发展活动的最大障碍。也有研究表明,个人所在的情境因素,例如学校支持氛围也会影响教师参与专业发展的意愿和程度(王双龙,2017)。谢晨和尹弘飚(2021)则从教研机构的设置、教研队伍、经费保障和工作方式等分析影响一个地区教研和专业发展活动的因素,发现教研员队伍的经验和规模以及更加专业化的领导对教研和专业发展的质量提升有显著的影响。
4. 教师专业发展活动有效性的实证研究
与国外的研究相似,针对教师专业发展活动效果的研究较多以教师本身的知识、技能、观念和自我效能为衡量效果,较少关注对学生学习效果的影响。目前,在专业发展活动有效性的研究中与本文较为相关的有三项:托马斯等人(2015)基于中国东西部三个地级市2009—2012年303345名普通高中毕业生、任课教师和校长的数据,检验了专业学习共同体和教师发展因素对学生学业成绩的增值影响。结果显示,教师专业发展因素和学生学习成绩之间具有正向相关性,尤其是“参加正式专业发展培训活动”“同事间非正式的改进教学的交流”“参加相关课题研究”和“参加主要教授科目教学策略和方法培训”。张文静等人(2010)以房山区42所小学的1238名四年级学生和42名数学教师为研究对象,考察教师的特征变量、教学方式和教师培训三个方面对小学四年级学生数学学业成绩增长的影响。教师培训包括是否参加过新课程培训、教师间是否经常讨论教学问题、教师共同准备材料或者备课、教师间相互听课/评课、教师参与教研活动的频繁程度。结果显示,与教师培训相关的变量和学生学业成绩的增长几乎没有显著关系。赵健等人(2013)基于对我国教师专业共同体导向的专业发展实践的关注,在5个城市的59所学校、119个班级、5066名学生的成绩和问卷数据以及581名教师问卷数据的基础上,考察教师专业发展实践特征及其与学生学业成绩的关系。基于“教师专业发展即参与学习共同体”的假设,作者主要关注备课、培训参与、听评课和教科研参与四个方面的教师专业发展实践⑥。研究通过描述性统计揭示了教师参与教科研的总体状况,但没有对教科研参与情况与学生成绩之间的关系作进一步分析。
除了以上三项研究之外,还有部分研究基于国际大型教育质量监测项目,例如国际学生评价项目(PISA)、国际数学与科学趋势比较研究(TIMSS)和教师教学国际调查(TALIS)对教师专业发展活动的有效性进行国际比较分析。例如谢敏等人(2008)采用TIMSS数据比较了日本、瑞典、美国、中国香港地区的教师资格和职业发展对学生成绩的影响;陈纯槿(2017)基于TALIS数据分析了教师参与专业发展的影响因素,发现影响教师专业发展有效性最主要的因素是教师的合作文化;李勉等人(2018)基于PISA、TIMSS和PIRLS数据,分析教师特征和专业发展与学生成绩的关系。但由于数据的限制,以上国际比较分析并没有涉及中国大陆地区。
综上,在目前国内有关教师专业发展活动有效性的研究中,尤其是检验教师专业发展活动对学生成绩的增值影响的研究中,对教师专业发展活动的各方面因素都有所涉及,但尚未有研究将区域教研作为一个整体,将包括区级和校本在内的各类教师专业发展活动与学生的学业成绩相互联系起来,探讨区域教研活动对学生学业成绩影响的实证研究。
(三)基本分析框架
本文尝试在Desimone(2009)研究总结的理论框架的基础上(图1),结合国际教师调查对教师专业发展活动的概念框架和指标,构建针对区域教研对教师和学生成绩影响的分析框架。目前全球通用的有关教师专业发展、教师效能、教师教学实践及课堂行为等相关数据的调查问卷主要包括:TIMSS、PIRLS、TEDS-M和TALIS等⑦。其中TALIS是经济合作与发展组织(OECD)研发的对教师专业发展、教学理念及实践和教师工作环境进行调研的国际项目。该项目力图通过问卷方式了解各国和地区教师的专业准备、入职培训、专业发展、教学信念与实践、教师评价、校长领导力、学校氛围与支持等方面的情况。上海是中国内地首个参加2013和2016年TALIS调查的地区。根据研究目的,本文主要采用了TALIS作为教师专业发展问卷的基本框架(表1)。
根据教师专业发展有效性研究的概念框架和TALIS调查问卷基本框架,图2构建了本文“投入—过程—产出”的概念框架。其中投入主要包括教师专业特征和教师专业发展两大主题。教师专业特征主要包括教师受教育背景、工作满意度和动机、自我效能。教师专业发展主要包括区级教研活动和校本教研活动。过程包括教师知识技能、教学实践以及相应的课堂环境和学校环境。在产出部分,本文主要关注的是学生学业成绩。区级和校本教研活动对学生学业成绩的影响路径如下:(1)在投入端,教师参与不同类型的区级和校本教研活动;(2)在过程端,教研活动提升了教师的知识技能,而知识技能的提升影响了教师课堂教学实践,提升了教师的自我效能,这一过程在相应的课堂和学校环境中发生;(3)在产出端,过程端的教师知识技能、教学实践的提升促进了教师自我效能与工作满意度的提升,也促进了学生学习和学业成绩的提升。
此外,各主题之间存在大量潜在的关系,这些关系可能是单向的,例如我们可以预期受教育背景会影响教师的教学实践,但教师入职之后的教学实践不大可能反向影响受教育背景。而另一些因素之间的关系则可能是双向的,例如教师参与教研活动会影响教师的实践,但这些实践也会影响对教研活动的需求、设计和实施。教师的课堂教学实践在课堂和学校环境中发生,同时也影响了课堂环境和学校氛围,学校环境既塑造教师专业实践,也由教师专业实践塑造。
表2为教师问卷的基本框架。问卷包括6个部分:(1)教师背景信息包括教师的年龄、性别等个人背景和学历、专业训练等教育背景;(2)工作情况包括职位、工作经历、教学及非教学时间安排;(3)教学情况包括课堂教学实践、与同事交流合作和与教学实践相关的自我效能;(4)教师专业发展包括教师参加的区级常规教研活动、区级专题教研活动和校本教研活动;(5)评价与反馈包括教师自身、同事、学校管理者和区教研员的评价,以及评价对教学实践和学生成绩的影响自评;(6)学校氛围和支持包括学校对教师发展的支持、对教研活动的支持,教师的职业认同感、学校归属感、工作压力和倦怠感。
三、数据和分析方法
(一)数据来源
本文使用的数据主要分为三个部分:一部分是2016—2019年参加高考的42127名高中学生成绩和选课数据。表3为样本学生的分布情况,每一届在10000人以上,其中文科为2500—2700人左右,理科为7700—8100人左右⑧。除了学生成绩和选课数据之外,本文使用的第二个数据为教师问卷数据。2019年2—3月课题组向参与教研活动的数学、语文、化学三科教师发放区域教研参与情况调查问卷。此次调查共有1974名教师提交了问卷,其中语文教师占47%,数学37%,化学16%。第三,本文基于学生选课信息将教师数据与学生数据进行匹配,建立了包含学生基线成绩、出口成绩和相应学科任课教师信息的数据。
(二)分析方法
基于学生成绩和教师问卷数据,本文主要关注三个方面的问题:首先,对数学、语文和化学三科教师参与教研活动,包括区级和校本教研活动的情况进行描述统计和回归分析,在此基础上采用结构方程模型对教师参与教研的作用进行分析;第二,采用增值评估的方法分析2016—2019届高三学生的成绩,估计学校和教师对学生成绩的增值作用;第三,基于学生成绩和教师问卷匹配数据,采用增值评估的方法,分析教师专业发展活动参与情况对学生成绩的影响。
增值估计是基于教育生产函数模型衍生出来的增值评价方法, 其理念是建立在一个前提假设的基础上,即学校和教师在能够在原有的基础之上增加学生的学业成绩,超出原本期望的部分即学校和教师的增值效应。目前在对学校和教师进行评价的时候,主要使用中考和高考升学率、上线率等指标。虽然中高考等高利害测验在筛选学生方面具有专业性,但仅使用中高考成绩评价学校质量和教师水平存在一些弊端。主要原因之一在于,中高考成绩是学生在初中和高中阶段学习的累积,如果不考虑学生入学时的学业水平,那么结果性评价就不能准确反映学校和教师的作用。增值估计则通过学生基线学业成绩,将学生开始成绩中学校无法作用的因素,如学生的遗传、性别、家庭背景等个人因素进行一定的控制,从而估计学校和教师对学生作出的“增值”影响。此外,增值评价可以在一定程度上分离学校、教师和学生自身因素对学业发展的影响,因此也有助于对学校和教师的影响进行更客观的评价。
具体来说,传统的教育生产函数为分析学生学业成绩产出提供了一个包含学生个人能力、家庭背景、学校和教师投入、同伴效应等各类因素在内的完整分析框架。在研究学校和教师的增值性效应时,我们在教育生产函数中加入了上一学期学生的学业成绩:
其中,
目前,教师增值估计模型被广泛用于中小学阶段教师对学生成绩的增值评估(Jacob & Lefgren,2008;Kane et al.,2008;Hanushek & Rivkin,2010)和教师培训项目和教师专业发展项目的有效性评估(Boyd,et al.,2009;Harris & Sass,2011;Goldhaber et al.,2013)。根据Meghir & Rivkin(2011)对教师增值研究的梳理,增值模型主要分为获得分数(gain-sacore)和滞后分数(lagged-score)两类。本文采用的是滞后分数,也就是将学生的出口成绩作为结果变量,学生的入口成绩则作为控制变量之一。本文的增值分析分为三个部分:第一部分基于学生成绩数据分析不同学校对学生成绩的增值影响,即学校的“打包”增值影响(模型一);第二部分基于学生和教师匹配数据分析教师的“打包”增值影响(模型二);第三部分基于学生成绩数据和教师数据,分析教师参与专业发展活动与学生成绩增值的关系(模型三)。本文的计量模型如下:
1. 学校增值估计
模型一为二层线性模型,层一是学生,层二是学校,采用的是学校随机效应模型。
2. 教师增值估计
模型二为三层线性模型,层一是学生,层二是教师,层三是学校,采用的是学校和教师随机效应模型。
学校的“打包”增值估计
3. 教师专业发展的增值估计
基于学生学业成绩的教师增值模型估计的是教师“打包”增值效果,提供的是教师相对水平信息,因此主要用于探索是否一些教师比另外一些教师有相对更多的进步,但无法进一步识别教师的哪些特征对增值的贡献更大。为了进一步分析教师参与专业发展活动对学生学业成绩的影响,本文采用考虑了学生滞后分数(lagged-score)以及学校固定效应的增值估计模型,此外还包括教师个人和专业背景特征,具体模型如下:
模型三中的
在实际分析中,由于数据的限制,增值估计往往携带有大量的干扰因素,理想的情况应该是分别控制学生的个体特征和学校的资源环境特征。学生的个体特征包括性别、年龄等个人特征,也包括父母受教育程度、职业、收入等反映家庭经济背景的因素,通常根据学生问卷获得相关数据。学校的特征包括学校规模、基础设施等投入和办学条件数据,也包括环境、氛围和管理等数据,通常根据校长问卷获得相关数据。在缺乏相应的数据时,研究常用的处理方法是采用学校固定效应,以控制学校层面不随时间变动的影响因素(Aaronson et al.,2007;Boyd et al.,2009)。在有多科成绩数据时一些研究还采用学生固定效应,以控制学生层面(例如成绩、家庭背景等)的影响因素(Clotfelter et al.,2010;Goldhaber et al.,2013)。在下面估计教师对学生成绩的增值影响时,我们先尝试采用学校随机模型,然后再采用学校固定模型。
(三)教师专业发展活动的衡量
基于本文所关注的区域教研体系下的教师专业发展活动与学生学业成绩的关系假设,我们重点采集区级教研活动和校本教研活动的相关数据。其中,区级教研活动又可分为区级常规教研活动、蕴含有效教师专业发展特征的教研活动和专题教研活动三类。
首先,根据活动的组织形式,区级常规教研活动包含8个子问题:教材教法、研究课、专家讲座、课题项目研讨、中心组活动、跨学科教研、学术会议、优秀经验和成果分享。根据活动的内容,区级常规教研活动包含9个子问题:学科课程的整合与开发、学科核心知识与思想方法的理解、学科教学关键问题的确定和解决、单元整体教学、深度学习活动的设计与实施、促进学习的持续性评价、中高考命题方向和命题思路、分析和使用学生评价数据、跨学科能力的教学(如STEAM、批判思维、问题解决等)。我们对每位教师参与区级教研活动的频率做平均值处理,得到每位教师区级常规教研活动的平均参与程度。其次,本文根据Darling-Hammond et al.(2017)总结的有效教师专业发展活动特征,将区级常规教研活动进行了归类,分为聚焦课程内容、融入主动学习、示范和模范、专家指导和支持四项蕴含有效专业发展特征的教研活动⑨。
表4为教龄5年以上的教师和教龄5年以下的教师在各区级常规教研活动组织形式上的参与情况。总体来看,教师参与率较高的包括教材教法分析、研究课、专家讲座、课题项目研讨及分享。教师参与率较低的包括中心组成员活动、跨学科教研、各级学术会议以及优秀经验分享。从教龄5年以上和教龄5年以下的教师对比来看,老教师在大部分教研活动形式的参与率上要高于新教师,其中在参加各级学术会议和优秀经验分享上的差距更加明显。这可能是因为老教师从教经验长,经验更加丰富,同时也有更好的资源参与学术会议。
表5为教龄5年以上的教师和教龄5年以下的教师在各区级常规教研活动内容上的参与情况。总体来看,教师参与频率较高的教研活动内容为单元整体教学、学科教学关键问题的确定和解决、学科核心知识与思想方法的理解。教师参与频率较低的教研活动内容为跨学科能力的教学、学科课程的整合与开发。对比来看,教龄5年以上的教师在大部分教研活动的参与率上要高于教龄5年以下的教师,其中在分析和使用学生评价数据、中高考命题这两项与评价相关的培训内容上差距尤为明显。
区级专题教研活动包括“基于学科能力表现的教学改进”“考试评价研讨”和“深度学习”三项专题教研项目。表6为区级专题教研活动参与情况。“基于学科能力表现的教学改进”项目是地区教师进修学校与师范大学合作开展的项目。该项目基于学科能力构成模型,开发出指向核心内容主题的学科能力发展水平诊断工具,对学生的学科能力发展水平现状进行诊断,聚焦问题、反思教学、开展教学改进实践研究。在参与调查的教师中共1118名教师参加过“基于学科能力表现的教学改进”项目,总体参与率为57%,教龄在5年以上的教师有62.4%参加过该项目,教龄在5年以下的教师仅34.6%参加过该项目。“考试评价研讨”专题教研活动基于评价数据的分析和反馈,帮助教师改进课堂教学,帮助学校改进教学管理,同时促进教研内容和方式的改进。在参与调查的教师中共866名教师参加过“考试评价研讨”项目,总体参与率为44.2%,老教师参与率显著高于新教师。“深度学习”则是教育部基础教育课程教材发展中心的教学改进项目。在参与调查的教师中共1105名教师参加过“深度学习”项目,总体参与率为56.4%。同样,老教师的参与率显著高于新教师。
校本教研包含7个子问题:校内听评课、集体备课、参与校本课程及其他教学辅助材料的开发、就教学中遇到的问题与同事进行研讨、与同事讨论某类学生的学业发展问题、与同事分享教学经验与资源、接受专家指导(包括教研员、大学教学专家等)。首先,本文对每位教师参与校本教研的频率做平均值处理,得到每位教师参与校本教研活动的平均参与程度。其次,根据以往的文献,以上校本教研活动又可分为正式和非正式校本教研两类。本文进一步将校内听评课、集体备课、参与校本课程及其他教学辅助材料的开发以及接受专家指导归为正式的校本教研,将就教学中遇到的问题与同事进行研讨、与同事讨论某类学生的学业发展问题、与同事分享教学经验与资源归为非正式的校本教研。
表7为教师校本教研活动的频率。总体来看,教师参与频率最高的正式教研活动为集体备课,有76.5%的教师经常参加(平均值未在表中显示),教龄5年以上的教师参与频率高于新教师。其次是校内听评课,有51%的教师经常参加,新老教师没有太大差异。相对来说,教师在学校接受专家指导的机会较少,19.8%的教师从不或较少接受专家指导,新教师接受专家指导的机会更少。此外,29%左右的教师从未或较少参与校本课程及其他教学教辅材料的开发,新教师的参与频率低于老教师。从教师与同事的非正式交流来看,频率最高的是与同事讨论教学中遇到的问题,77.7%的教师经常与同事讨论,其次是与同事分享经验和资源以及讨论某类学生的学业发展问题。
本节主要是从区域教研活动,包括区级常规教研、区级专题教研和校本教研对教师的课堂教学实践、教学评价策略的使用以及与教学相关的自我效能的影响来检验专业发展有效性,此外还探讨了区级教研与校本教研之间的关系。
(一)区级教研与教学实践的关系
基于上述完成调查问卷的教师,我们通过OLS回归,分析教师的区级教研活动参与情况和课堂教学实践之间的关系。具体模型如下:
评价行为包含4个子问题,分别是:“自行设计单元和学期测试并使用”“除了分数,我还给学生评语反馈”“让学生反思和评估自己的进步”“现场观察学生在特定任务上的表现并提供及时反馈”,内部一致性系数为0.72。
教学相关的自我效能包含11个子问题,分别是:“让学生相信他们能够学好”“让学生意识到学习的价值”“提出挑战性的问题”“注意培养学生的批判性思维”“激励学习积极性低的学生”“让学生遵守课堂纪律”“明确表达对学生行为的期望”“给学生思考、讨论和表达的机会”“使用多种教学策略”“使用多种评价策略”“使用信息技术辅助学生学习”,内部一致性系数为0.89。我们也对每位教师的评价行为使用频率和自我效能求平均值,值越高表明评价行为使用频率越高、越多样化,与教学相关的自我效能也相应越高。此外,我们也对各个具体的子项目分别进行回归分析。
模型中的
(参见 http://ciefr.pku.edu.cn/upload/Appendix_A1-A4.pdf)⑩
1. 区级教研活动参与程度和教师的课堂教学组织行为的关系
首先,教师区级教研活动的参与程度与整体课堂教学组织行为水平以及各项课堂教学组织行为之间存在较为显著的正向关系。整体来看,教研活动参与度高的教师,其开展各项课堂教学组织活动的频率也相对较高,尤其是在教学过程中更频繁地“组织需要学生深度参与的体验性、探究性的学习活动”和“布置学生做需要批判性思维的作业”等更加需要学生进行探究性、批判性思考和学习的活动。
其次,就蕴含有效专业发展特征的常规教研活动来看,四类教研活动与大部分教学组织行为都有显著的正向关系,尤其是对“组织学生深度参与的体验性、探究性学习活动”的教学实践的促进。具体而言,参与具备“聚焦课程内容”要素教研活动较多的教师在教学过程中更加频繁地“归纳、小结课堂学习内容”以及“明确学习目标”;参与“融入主动学习”较多的教师更倾向于“布置学生做需要批判性思维的作业”,更多地“结合日常生活问题或工作来说明新知识的用处”;参与“有效示范及模范”和“专家指导和支持”较多的教师在教学中则更多地对课堂学习内容进行归纳小结,并“结合日常生活工作来说明新知识的用处”;而参与“专家指导和支持”较多的教师对“归纳、小结课堂学习内容”和“结合日常生活问题或工作来说明新知识的用处”的影响较大。此外,教研员的个性化指导与接受教研员指导的教师课堂教学实践水平也存在正向关系,尤其是提升了受指导教师“组织学生参与体验性、探究性学习活动”的教学实践。
最后,三类专题教研活动与各项教学组织行为之间存在较为显著的正向关系。参与专题教研的教师更加倾向于组织学生进行探究性的学习活动以及布置学生做需要批判性思维的作业。
2. 区级教研活动参与程度和教师的评价策略使用的关系
分析结果显示,参与程度高的教师更加倾向于选择“让学生反思评估自己”和“现场评估并给予反馈”的评价方法。从区级常规教研活动的参与来看,参与程度较高的教师不仅更加倾向于给予现场反馈、让学生进行自我反思,同时也能够更好地通过传统的评价策略,如设计单元学期测验来对学生的学习效果进行评价。从蕴含有效教师专业发展特征的区级常规教研活动的参与来看,参与此类活动的教师也更加倾向于给予及时反馈,促进学生自我的反思和评估。
3. 区级教研活动参与程度和教师自我效能的关系
首先,就区级域教研的整体参与程度来看,参与程度较高的教师更倾向于认为自己在教学过程中能够向学生提出挑战性的问题、使用多种评价策略以及培养学生的批判性思维。而接受更多教研员个性化指导的教师则更倾向于认为自己能够使用多种教学策略。
其次,就蕴含有效专业发展特征的常规教研活动来看,四类教研活动参与水平与教师整体的自我效能之间存在较为显著的正向关系。参与水平较高的教师在使用多种评价和教学策略、提出挑战性问题、培养学生批判性思维方面具有较高的自我效能。
再次,针对三类专题教研活动分析结果显示,参与“学科能力”项目较多的教师更加倾向于在教学过程中使用多种教学策略以及使用信息技术辅助学生学习;参与“考试评价研讨”项目较多的教师认为自己能够更多地使用多种评价策略和教学策略;参与“深度学习”项目较多的教师则认为自己能够更多地提出挑战性问题,并且让学生意识到学习的价值,给学生更多思考、讨论和表达的机会。
4. 区级教研活动的影响路径分析
我们通过结构方程模型来构建教师参与区级教研活动的程度对教学组织行为、评价策略和自我效能的影响路径。图3构建的模型控制了教师年龄、性别、学历、职称、教龄等的影响,拟合良好(RMSEA=0.056,CFI=0.930,TLI=0.910)。模型对教学组织行为、评价策略、自我效能的解释率分别为27.6%、10.6%和22.1%。根据结构方程的分析结果,区级常规教研对教师教学实践有积极影响。基于活动组织形式衡量的区级常规教研活动对教学组织行为和自我效能的影响系数分别为0.333和0.324;而基于活动内容衡量的区级常规教研活动对教学组织行为和评价策略的影响系数分别为0.205和0.246。此外,也可以看出教师的教学组织行为、评价策略和自我效能之间存在着较强的相关性。
图4构建了蕴含有效专业发展特征的区级教研活动对教学实践影响的结构方程。在控制了上述教师背景特征后,模型拟合良好(RMSEA=0.047,CFI=0.962,TLI=0.949)。模型对教学组织行为、评价策略、自我效能的解释率为19.5%、9.6%和14.9%。结果显示,蕴含有效专业发展特征的区级常规教研活动对教学组织行为、评价策略和教师自我效能三个方面有显著的正向作用,分别为0.383、0.286和0.343。
图5为区级专题教研活动对教学实践影响的结构方程。控制了上述教师背景特征后,模型拟合良好(RMSEA=0.025,CFI=0.987,TLI=0.980)。模型对教学组织行为、评价策略、自我效能的解释率为16.5%、6.7%和8.4%。结果显示,“考试评价研讨”对教师的教学组织行为、评价策略、自我效能有显著影响,其标准化后的影响效应分别达到了0.293、0.191、0.184。可见,“考试评价研讨”相对其他两项活动,更能够积极影响教师进行各类教学组织行为、评价行为的频率,有助于提高教师的自我效能。
(二)不同类型教师参与区级教研活动的差异
根据调查问卷对教师专业发展活动参与情况的描述统计,不同类型的教师专业发展活动,例如区级常规教研、专题教研由于活动开展的目的和目标群体不同,参与的教师存在差异。本节基于教师问卷数据,分析教师的个人、学术和专业背景与区级教研活动参与情况之间的关系,建立模型如下:
模型中的
1. 区级常规教研(形式)
总体来看,学科带头人和获得市/国家教学设计、教学展示奖励的教师的参与度显著高于其他群体,而高级职称教师的参与度则显著低于其他群体。就不同年级的教师来看,参与度总体上不存在显著差异。就学科来看,语文和化学学科教师的平均参与度都高于数学教师。
具体而言,教师个人专业特征与各项教研活动参与频率之间的关系如下:(1)拥有硕士或博士学位的教师更多参与中心组活动、跨学科教研、学术会议和分享自己的教学经验和成果;(2)师范院校毕业的教师相对于非师范院校毕业的教师,非事业编制的教师相对于事业编制的教师,在其他个人和专业背景相似的情况下,在区域常规教研活动的参与上没有显著的差异;(3)与其他教师群体相比,资深教师更多参与教材教法研讨,而更少参与课题项目研讨和跨学科教研;(4)高级职称教师相对于其他群体教师较少参加区域教研,主要在研究课、课题项目讨论和跨学科教研等几个方面与其他教师群体相比显著偏少;(5)学科带头教师以及获得教学设计、教学展示奖励的教师则更多地参与到课题项目研讨、中心组活动、跨学科教研、学术会议及成果分享等区域教研活动中。
2. 区级常规教研(内容)
在参与的区级教研活动的主要内容方面,资深教师和获得市/国家教学设计、教学展示奖励的教师的参与度显著高于其他群体,而高级职称教师的参与度则略低于其他群体。各年级教师的参与度总体上不存在显著差异。就学科来看,语文教师的平均参与度高于数学教师,而化学教师则没有显著差异。
具体而言,教师个人专业特征与各项教研活动参与频率之间的关系如下:(1)在其他个人和专业背景相似的情况下,本科生或研究生、非师范生或师范生、非事业编或事业编教师在各类教研活动的参与程度没有显著的差异;(2)高级职称教师相对于其他群体教师较少参加教研活动,在单元整体教学、深度学习活动的设计实施、促进学习的持续性评价几类活动的参与度上显著低于其他教师;(3)与高级职称教师不同的是,在理解学科核心知识思想方法、确定与解决学科关键问题、单元整体教学以及中高考命题等几类活动的参与上,教龄长的教师参与度相应更高;(4)获得教学设计、教学展示奖励的教师在几乎所有类型的教研活动的参与度上都显著高于其他教师。
此外,在教师个人专业特征与蕴含有效专业发展特征的教研活动参与频率之间的关系上,与专题教研活动类似,最相关的教师个人专业特征是教龄和教师获奖情况。
3. 区级专题教研
除了常规性的区级教研活动,本文还针对“基于学科能力表现的教学改进”“考试评价研讨”和“深度学习”三项专题教研项目的参与情况进行分析。总体来看,与专题教研活动参与程度最相关的教师个人和专业特征是教龄和教师获奖情况。在其他个人和专业背景相似的前提下,教龄和专题教研活动的参与度之间呈现倒U型分布,教龄越大的教师参与度越高,但随着教龄逐渐增加,参与度重新回落。而获得市或国家研究课、教学设计、教学展示等奖励的教师在三项专题活动的参与频率上都显著高于其他教师群体。从教师的职务来看,除了学科带头教师更多地参与到考试评价的项目中外,骨干教师和学科带头人参与专题教研活动的程度与其他教师不存在显著的差异。而没有任何学校职务的教师较少参与到各类专题学科教研活动中,其中深度学习和学科能力两个专题项目的参与程度更是显著低于其他有学校职务的教师。此外,就学科来看,相对于数学教师而言,语文和化学教师参与三类专题教研活动的程度明显更高,而化学教师除了考试评价项目的参与度要低于语文教师外,在学科能力和深度学习方面的参与度都要显著更高。
除了常规性、专题性教研活动,我们还询问了教师接受教研员对课堂教学的个性化指导的频率。结果显示,教龄较长的教师、骨干教师和学科带头人接受个性化指导的频率显著更高,而没有担任学校职务的教师、非事业编教师获得区教研员个性化指导的机会和频率都显著少于其他教师群体。
根据本节的分析,在区级常规教研活动中参与度较高、较为活跃的几个群体包括拥有研究生学历的教师、资深教师、学科带头人以及教学设计、展示等获得市及以上奖励的教师,而骨干教师、高级职称教师相对于其余教师而言不存在太大的差异。在教师群体中,就研究生学历的教师而言,在常规教研活动中,具有研究生学历的教师更多地参与到需要参与、融入和研究性质的教研活动中。就教龄而言,在常规教研活动中,教龄相对较长的教师更多参与教材教法研讨,而更少参与课题项目研讨和跨学科教研;在专题教研活动中,教龄越大的教师参与度越高。就学科带头教师而言,在常规教研活动中,他们更多地参与到需要主动参与和研究性质相关的教研活动中。而获得教学设计、展示奖励的教师在几乎所有类型的教研活动的参与度都显著高于其他教师。
(三)区级专题教研效果的主观评价
根据参加过专题教研活动的教师对效果的评价,我们对“基于学科能力表现的教学改进”“考试评价研讨”“深度学习”对教师知识技能提升的效果进行了描述统计(见图6)。其中,参与了“基于学科能力表现的教学改进”项目的教师对该项目提升知识技能的效果评价较积极,超过80%的教师认为项目效果较好或非常好。但需要注意的是,有17.2%的教师认为项目对把握学生能力发展的进阶情况(年级、水平)的效果一般。
图7表明,参与了“考试评价研讨”项目的教师对该项目的知识技能提升效果的评价较积极,超过80%的教师认为项目效果较好或非常好。在这些评价标准中,项目对帮助教师命制较高质量的阶段测试试题的效果相对其他方面的评价更低一些,16.3%的教师认为效果一般。
图8显示,参与过“深度学习”项目的教师对项目提升知识技能效果的评价较积极。相对来说,“深度学习”项目对持续开展促进学生学习的评价和持续开展与学习活动融合的评价这两方面的效果较一般,分别有20.3%和20.5%的教师认为效果一般。
(四)区级教研与校本教研的关系
首先,本节基于教师问卷数据,分析教师的个人、学术和专业背景与校本教研活动参与情况之间的关系。其次,本节进一步分析了区级教研与校本教研活动参与情况之间的关系。最后,本节通过结构方程模型来构建校本教研在区级教研和教学实践、自我效能之间起的中介作用模型。
其中,
1. 校本教研参与情况
首先,我们将教师校本教研活动参与频率作为结果变量,分析教师的个人和专业背景特征与校本教研活动参与频率的关系。总体来看,非事业编教师相对于事业编教师、没有学校职务的教师相对于有一定职务的教师,其校本教研的平均参与程度显著更低。另一方面,学科带头人、获奖教师以及研究生学历的教师相对于其他教师群体,其平均参与程度显著更高。
具体到教师个人专业特征与各项校本教研活动参与频率之间的关系上,师范院校毕业的教师和学科带头人更多地参与到听评课活动中,而研究生学历教师、骨干教师和获奖教师更多地参与校本课程、教辅材料的开发。就与同事研讨教学问题、学生发展问题、分享经验和资源等非正式的专业交流活动来看,男教师和非事业编教师的参与度要低于女教师和事业编教师,教学经验更丰富的教师会更多与同事分享经验和资源,而学历、学校类型、职称、是否骨干教师或学科带头人等都没有显著差异。不过没有担任任何学校层面的职务(例如班主任、年级组长、备课组长、教研组长、主任、校长等)的教师在校本课程材料开发以及与同事交流方面都要低于担任职务的教师,这从侧面说明了校本教研活动不仅受到个人性别、受教育程度等影响,也受到学校组织安排的因素影响。
2. 区级教研与校本教研的关系
附表A4为区级教研活动和校本教研活动参与情况之间的关系(参见http://ciefr.pku.edu.cn/upload/Appendix_A1-A4.pdf)。结果显示,在区级教研活动与校本教研活动的参与程度之间存在着十分显著且稳定的正相关关系。这种关系不仅体现在校本教研的平均参与程度上,体现在听评课、集体备课、接受专家指导等各项正式的校本教研活动的参与程度方面,也体现在与同事研讨教学问题、学生问题、分享教学经验等各项非正式的交流活动中。尤其是在接受专家指导和参与校本课程、教辅材料开发这两项活动方面,与区级教研活动的关系尤为紧密。
3. 校本教研的中介作用
我们构建了校本教研在区级教研活动中对教师教学实践影响的中介模型。我们将区级教研活动分为区级常规教研、蕴含有效专业发展特征的教研和专题教研三类,将校本教研分为正式的校本教研和非正式的校本教研,根据分类对各子项进行平均值处理。图9构建了校本教研活动在区级常规教研和教学实践间的中介模型,模型拟合可以接受(模型拟合结果为RMSEA=0.060,CFI=0.912,TLI=0.888),模型对校本教研、教学组织行为、评价策略、自我效能的解释率为18.4%、52.3%、28.9%和49.3%。采用偏差校正的非参数百分位Bootstrap法抽样1000次计算校本教研在区级常规教研(形式)和教学实践间的中介效应,表8显示其95%的置信区间分别为[0.035, 0.313]、[0.032, 0.446]、[0.045, 0.435],表明校本教研在区级常规教研(形式)和教学实践间起中介作用,不同组织形式的区级常规教研活动参与率会首先影响校本教研,进而间接影响教师的教学组织行为、评价策略和自我效能。
图10为校本教研活动在蕴含有效专业发展特征的区级教研和教学实践间的中介作用(模型拟合结果为RMSEA=0.056,CFI=0.939,TLI=0.919),模型对校本教研、教学组织行为、评价策略、自我效能的解释率为9.0%、50.0%、29.0%和48.0%。采用偏差校正的Bootstrap法直接对校本教研在区级常规教研与教学实践间的中介效应进行检验,表9显示其95%的置信区间分别为[0.046, 0.111]、[0.039, 0.103]、[0.062, 0.140],校本教研在其中起着部分中介作用,即区级常规教研通过影响教师校本教研的参与程度,间接影响教师教学实践。其次,区级常规教研对教师教学实践和教师自我效能存在直接的正向的作用,区级常规教研对教学组织行为、评价策略、自我效能标准化后的直接影响效应达到了0.195、0.136和0.146。
图11为校本教研活动在区级专题教研和教学实践间的中介作用(模型拟合结果为RMSEA=0.048,CFI=0.949,TLI=0.922),模型对校本教研、教学组织行为、评价策略、自我效能的解释率为11.1%、49.8%、27.7%和45.9%。可以发现,校本教研在其中起着中介作用,“基于学科能力表现的教学改进”“考试评价研讨”“深度学习”三项区级专题教研活动,首先影响教师参与校本教研活动的频率,进而再影响教师的教学组织行为、评价行为以及教师的自我效能。采用偏差校正的Bootstrap法抽样1000次,以此来对校本教研在区级专题教研和教学实践间的中介效应进行直接检验,检验结果见表10。
五、区域教研活动与学生成绩
对学校和教师增值效能的分析分为三个部分:第一部分基于学生成绩数据分析不同学校对于学生成绩的增值影响(模型一);第二部分基于学生和教师匹配数据分析教师“打包”的增值影响(模型二);第三部分基于学生成绩数据和教师问卷数据分析教师专业发展活动与学生成绩增值之间的关系(模型三)。
(一)学校的增值评估
1. 学校增值的估计
在评估学校对学生增值成绩带来的影响时,我们使用的是模型一,选取2016—2019届高三学生数学、语文和化学三门课的模考成绩作为结果变量,并将各科模考成绩与相对应的2013—2016年的中考各科成绩进行链接,建立包含学生中考和模考成绩的数据库。其中,所有考试得分均经过标准化处理(平均分为0,标准差为1)。
首先,我们根据学生嵌套于学校的数据结构,建立学校和学生的两层零模型,将学生模考成绩的变异分离为学校之内的变异和学校之间的变异;其次,加入学生的中考成绩,看控制了学生的入口成绩之后,学校之间的变异情况。此时学校间的变异就是学校对于学生成绩的增值,这个增值可能为正,也可能为负。根据零模型,样本学生在语文、数学和化学的一模成绩差异有48%、57%和62%为校际间的差异,在考虑了学生的入口成绩之后,可以由学校之间的差异解释的部分降低17%—18%。语文、数学和化学的二模成绩差异有43%、55%和59%为校际间的差异,在考虑了学生的入口成绩之后可以由学校之间的差异解释的部分降低19%—21%。
图12—14按照各学校数学、语文、化学三科标准化后的学校平均分从低到高依次排列,以及根据模型一估计的学校增值的比较。不难发现,采用增值估计的方法与采用模考平均成绩的方法得出的结果存在一定的差异,尽管斯皮尔曼系数(Spearman correlation)显示两者之间存在高度而显著的相关。首先,各学校之间增值分数的差异要小于模考标准分的差异。增值估计的最大和最小值之间相差2.5个左右标准差,而模考标准分则相差3.2个左右标准差。即根据学校对学生增值成绩的影响来看,各学校之间的差异要小于根据一次性考试结果得出的评价。尤其是在高中阶段,在评估学校效能的时候,必须要考虑不同学校的生源差异和原本的教育积累。其次,一部分模考成绩在平均水平之下的学校,其对学生成绩增值带来的影响在平均水平之上。例如,根据数学学科的分析,一部分学校标准化后的平均成绩低于0,而相应的学校增值估计则要高于0。这一类学校为学生带来了比单纯的出口成绩排名更高的增值影响。
一般而言,学校的增值分和平均成绩之间存在显著的相关性,但不一定是十分一致的强正向相关。本文根据区域内学校的模考成绩得出了增值分数与最终成绩之间存在着十分强的正相关关系,模考平均分较高的学校给学生的增值成绩带来的正向影响也相对较高,这在一定程度上说明了相对优质的学校最终成绩较高不仅仅是因为这些学校能够筛选出入口(中考)成绩较高的学生,还因为在初始成绩的基础之上给学生带来了相对更大的增值影响。
表11和表12是四类学校的学校增值估计和标准化之后的平均成绩,第1—4列为增值估计,第5—8列为模考的标准分。一组学校历年数学、语文和化学一模总体成绩分别为0.76、0.67和0.67,总体的增值估计分别为0.88、0.82和0.99。二组学校历年一模总体成绩分别为0.21、0.20和0.21,总体的增值估计分别为0.48、0.46和0.62。三组学校历年一模总体成绩分别为−0.34、−0.32和−0.53,总体的增值估计分别为0.08、0.06和0.01。四组学校历年一模总体成绩分别为−1.30、−1.17和−1.52,总体的增值分别为−0.65、−0.61和−0.71。根据二模成绩计算的四类学校的学校增值估计和标准化的平均成绩的情况与一模类似。
图15和图16的趋势显示得更加清晰,可以看出三组学校尽管模考成绩低于平均水平,但学校对学生成绩的增值大于零。
2. 不同增值学校的教师参与教研的情况
根据2016—2019年学校对学生的平均增值情况,我们将学校分为两类:在相应学科上增值大于0的学校、在相应学科上增值小于0的学校。表13反映了来自增值大于0和增值小于0的学校的不同学科教师的区级教研(形式)参与情况。结果表明,对于语文老师来说,高增值学校的语文教师参与“分享自己的优秀经验及成果”的活动频率要显著高于低增值学校语文教师。对于化学和数学教师而言,他们在“中心组成员活动”上的参与率差异达到显著,高增值学校教师的参与率更高。
根据2016—2019年学校对学生的平均增值情况,我们将学校分为两类:在相应学科上增值大于0的学校、在相应学科上增值小于0的学校。表14反映了来自增值大于0和增值小于0的学校的不同学科教师的区级教研(内容)参与情况。可以发现,高增值学校和低增值学校的教师在各项活动的参与率上无显著差异。我们分析了不同组教师参与三类区级专题教研活动的差异,结果显示学校增值大于0和小于0的教师,在各项上的参与率和参与程度都没有显著差异(结果没有在正文中呈现)。
我们将校本教研分为两个部分,一部分为较为组织化、结构化的校本教研活动,包括校内听评课、集体备课、参与校本课程及其他教学辅助材料的开发以及接受专家指导(包括教研员、大学教学专家等);另一部分是非正式的教师个人交流,包括就教学中遇到的问题与同事进行研讨、与同事讨论某类学生的学业发展问题、与同事分享教学经验与资源。表15呈现的是来自增值大于0和增值小于0的学校的不同学科教师参与校本教研活动的情况。结果显示,若单独看校内听评课、集体备课等校本教研活动的参与情况,两类学校的教师没有显著差异。从正式和非正式两类校本教研活动的平均参与水平来看,增值大于0的学校的教师参与水平显著高于增值小于0的学校的教师。
(二)教师的增值评估
1. 教师增值的估计
在评估教师对学生增值成绩带来的影响时,我们使用的是模型 二。首先,我们根据学生嵌套于班级和学校的数据结构,建立学校、教师和学生的三层零模型。其次,加入学生的前测成绩、学生毕业年份、文理科等来看变化情况。表16为调整前零模型和调整后增值模型的ICC变化情况。根据零模型,样本学生数学和语文模考成绩差异有54.9%和47.2%可由校际间的差异来解释,有65.7%和55.2%可由包括学校差异在内的教师间的差异来解释,有10.9%和8.1%可由学校内部教师间的差异来解释。在加入了学生前测成绩等控制变量之后,可以由学校之间的差异解释的部分降低13.4%和15.5%,可以由包括学校差异在内的教师间差异解释的部分降低14.5%和15.1%,可以由学校内部教师间差异解释的部分降低20.3%和12.7%。
表17是四类学校的教师增值评价结果和标准化之后的平均成绩。第1、2列和4、5列为四组学校平均的教师增值分,第3、6列为模考的标准分。根据有效分析样本,一组学校2016—2019年平均数学一模成绩为0.771,根据学校随机效应模型估计的教师增值分为0.010,根据学校固定效应模型估计的教师增值分为0.056。二组学校历年数学一模总体成绩为0.206,学校随机和固定效应模型的教师增值分估计分别为0.006和−0.001。三组学校包括历年数学一模总体成绩为−0.274,学校随机和固定效应模型的教师增值分估计分别为0.002和−0.004。四组学校历年数学一模总体成绩为−1.225,学校随机和固定效应模型的教师增值分估计分别为−0.022和−0.011。
学校随机和固定效应模型估计存在一定的差异,其原因在于学校固定效应模型是基于学校内部同一门学科的教师所教学生增值成绩的差异来估计教师增值分。从图17和图18来看,两种模型估计的教师增值分趋势更加明显。根据学校随机效应模型分析的结果,三门学科趋势较为相似:前三组学校的平均教师增值为正,第四组为负。根据学校固定效应模型分析的结果,三门学科存在一定差异。就数学来看,第一组学校的平均教师增值为正,其他几组学校都小于零,且第一组学校校内的数学教师增值分差异较大,超过根据学校随机效应模型分析的同一组各学校平均的教师增值分。语文、化学学科存在着类似的情况:第一组学校和第三组学校内部语文教师增值分的差异要超过同一组各学校平均的教师增值分,而化学学科则出现在第三组。在第四组学校,根据学校随机效应模型估计的教师平均增值分与根据学校固定效应模型估计的教师平均增值分在−0.01到0.02上下,趋势较为接近,校内教师之间的差异要小于同一组的学校之间的差异。由于学校固定效应模型可以排除学校层面以及学生群体层面(例如平均成绩)的干扰因素,因此,在估计教师专业发展对学生成绩的增值作用时,我们最终选择了带学生前测成绩的学校固定效应模型。
2. 教师增值估计与专业特征之间的关系
首先,基于调查问卷中的教师个人和专业背景特征,我们分析了教师增值分数和教师个人、专业特征之间的关系。表18根据上文不同类型教师参与区级教研活动的差异分析结果,选择与教学实践和教研参与程度较为相关的一组教师个人和专业特征,分析这些教师个人和专业特征与教师增值估计之间的关系。结果显示,骨干教师、学科带头人,市/国家研究课、教学设计、教学展示获奖教师与教师增值分显著正相关,也即这几类教师给学生带来的增值影响高于其他教师群体。
3. 不同增值教师参与教研的情况
根据教师增值分数的高低,我们将教师分为增值分大于0和增值分小于0的两组,然后再根据不同学科和考试类型将教师增值分作五等分,进一步将教师分为最低20%组、中等60%组和最高20%组,分析不同组教师教研活动的参与程度。表19为不同增值组的教师参与区级常规教研活动的情况。
整体来看,按照增值分大于0和小于0分成的两组,两类教师群体参与度不存在统计上显著的差异。就两个群体教师区级常规教研活动的参与率来看,增值分高于0的教师在几乎所有活动类型上的参与率都要高于增值分低于0的教师。根据增值最低20%,中间60%和最高20%分为三组,三类教师在研究课、课题项目研讨、中心组成员活动、学术会议和分享经验及成果几类区级常规教研活动的参与率上具有显著的差异,高增值的教师组参与率高于中、低增值的教师组。在其余各类活动的参与率上,三组教师不存在显著差异。从参与率的数值来看,高增值的教师组在各类区级教研活动的参与率基本都高于中、低增值的教师组。
表20为不同增值组的教师参与专题教研活动的情况。结果显示,增值分高于0的教师在基于学科能力表现的教学改进和深度学习两类项目的参与率上显著高于增值分低于0的教师。尽管不显著,但增值高分于0的教师参与考试评价的程度也相对较高。在将教师分为三组后,结果显示中、低增值组教师的参与率较为相近,在考试评价和深度学习上中间组略低,而高增值组教师在三项活动中的参与率都高于中、低组教师。
表21呈现的是增值大于0和增值小于0的两类教师的参与校本教研活动的情况。由结果可知,不同增值的教师在各校本教研具体项目上的参与率没有显著差异。但从数值上看,在个别项目上大于0的教师要比小于0的教师略高,高增值的教师参与率也更高。
表22将校本教研分为正式和非正式的校本教研两类,结果显示,增值分大于0的教师在两项上的参与程度都要大于增值分小于0的教师,而高增值教师在参与度上略高于中、低增值教师,但不存在显著的差异。
(三)教研参与情况对学生成绩的影响
本节我们通过学生的选课信息将教师问卷数据与该教师所教授的学生的成绩数据进行匹配,建立了包含学生中考、模考成绩和任课教师信息的数据。根据这个数据,我们可以在考虑了教师个人和专业特征信息的情况下,探索教师专业发展活动参与情况与学生的成绩增值之间的关系。在“模型三”的基础之上,我们建立模型四如下:
其中,
表23中每一个系数都是回归分析结果中我们所关注的自变量(区级教研活动参与频率)与结果变量(学生成绩增值)的关系,括号中为标准差。每一个回归都控制了教师个人和专业特征,包括性别、学历、与学校的劳动关系、职称、教龄、学校职务、奖励和荣誉等。结果显示,区级常规教研、蕴含有效专业发展特征的区级常规教研、专题教研以及获得教研员个性化指导的频率与学生的成绩增值有显著的正向关系。其中,专题教研活动中的“基于学科能力表现的教学改进”和“考试评价研讨”项目与学生成绩的正向关系尤其显著。而蕴含有效专业发展活动的要素都不同程度地起到了积极的作用,尤以“聚焦课程内容”和“专家指导支持”最为稳定。表24是基于二模成绩为出口成绩的回归结果,其整体趋势与表23基于一模成绩为出口成绩的回归结果接近。
表25同样也显示了每一个回归分析结果中我们关注的区级常规教研活动参与程度和学生成绩增值之间的关系。分析采用的是学校固定效应模型,将一模考试、二模考试成绩作为结果变量,中考成绩作为前测成绩,控制变量不变,主要关注区级常规教研活动每一项活动与学生成绩增值之间的关系。总的来看,“学科课程整合开发”“学科核心知识和思想方法的理解”“学科关键问题的确定与解决”以及“单元整体教学”几项聚焦于学科内容的教研活动对学生成绩的增值作用尤其显著。
表26为校本教研参与程度与学生成绩之间关系的分析结果,同样只显示了每一个回归结果中专业发展活动参与频率的系数。第1、2列为OLS分析结果,第3、4列为学校固定效应模型分析结果。结果显示,校本教研活动的平均参与程度、教师之间正式和非正式的交流与学生的成绩增值有显著的正向关系。根据问卷中7项校本教研活动的结果来看,参与校本课程教辅材料开发和接受专家指导对学生成绩增值有积极作用。同时,非正式的交流也不容忽视。教师与同事研讨教学问题、学生发展问题、分享教学经验和资源等都对学生成绩的增值有显著且较为稳定的积极影响。
六、总结和讨论
本研究聚焦具有中国特色的区县基础教育教学研究体系,基于北京市海淀区2016—2019年高中阶段学生及其任课教师、所在学校相匹配的数据,通过建构教师专业发展对学生成绩影响的概念框架,采用增值模型、多层线性模型和结构方程模型,将区域教研活动分为组织、内容、有效性等多个维度,从教师个人特征、教学实践、自我效能、学生成绩等角度分析区域教研对教师和学生学业成绩的影响。研究结果显示,教研活动参与和教师的教学实践、自我效能、学生的成绩等存在多维度和多层面的关系,同时我们也可以发现,目前的教研活动对教师和学生的影响朝着探究性和以学生为中心的学习方式变革的方向转变。
(一)区级教研活动对教师的作用
首先,本文从教师专业发展活动对教师影响的角度出发,分析了教研活动的参与程度与课堂教学实践、学生评价策略的使用和教师自我效能评价的关系。总体上,区级教研活动参与度较高的教师,在其课堂教学过程中组织学生深度参与体验性、探究性学习活动的水平更高,更倾向于在教学过程中向学生提出具有挑战性的问题、培养学生的批判性思维以及给学生更多思考、讨论和表达的机会,在评价学生的时候更多地使用让学生反思评估自己和现场评估并给予反馈的评价策略。
其次,考虑到不同类型的教师专业发展活动所开展的目标群体有差异,因此参与不同类型教研活动的教师也存在差异,因此本文进一步分析了教师的个人、学术和专业背景与区级教研活动参与情况之间的关系。结果显示,整体上拥有研究生学历的教师、资深教师、学科带头人以及获得教学设计、展示等奖励的教师参与区级常规教研、专题教研和校本教研活动的程度较高。其中,获得教学设计、展示奖励的教师在几乎所有类型的教研活动的参与度上都显著高于其他教师。对教师特征与教师教学实践、自我效能和评价策略使用的分析结果显示,学科带头人和获得教学设计、展示奖励的教师在多种教学实践和学生评价策略的使用上显著高于其他教师群体。
再次,作为我国三级教研中的重要一级,校本教研是基层学校应用最为广泛的教师专业发展制度之一,因此区级教研与校本教研活动之间的关系也值得关注。本文的分析结果显示,区级教研活动与校本教研活动的参与程度之间存在着十分显著且稳定的正相关关系,尤其是在接受专家指导和参与校本课程、教辅材料开发这两项活动上。在与同事研讨教学问题、学生发展问题、分享教学经验与资源等非正式交流活动方面,则区级教研活动的参与程度相关性较低。
此外,对校本教研中介作用的分析显示,校本教研本身对教学实践有显著的正向作用,而且能够起到中介作用,即区级教研通过影响教师校本教研的参与程度,间接影响教师教学实践。值得注意的是,一些区级教研活动与教学实践之间的直接路径并不显著,但能够通过校本教研表现出中介效应(如学科能力、深度学习等)。对此,以往研究认为的可能解释:一是可能存在遮掩效应(suppressing effects),即间接效应的方向和直接效应的方向相反,使得总效应被遮掩;二是可能存在另外的中介路径,其间接效应大小与校本教研的间接效应接近但方向不同,从而造成总效应不显著(MacKinnon,Krull,& Lockwood,2000;Zhao et al.,2010)。由于数据限制,我们无法对更多可能的中介变量进行考察,进一步的原因有待今后研究进一步厘清。
(二)区域教研对学生成绩增值的作用
根据学生成绩与学校、教师的匹配数据,我们分别估计了学校和教师对学生成绩的增值作用,在此基础上根据学校和教师增值估计结果进行分组,分析不同组别教师教研活动的参与程度。首先,基于学校增值估计结果分为在相应学科上增值大于0的学校、在相应学科上增值小于0的学校,分析不同组别教师的教研活动参与程度差异。结果显示,高、低增值组学校的教师在大部分区级常规教研、专题教研和校本教研活动的参与程度上均较高。其中,高增值学校教师在中心组成员活动、各类学术会议等研究性活动以及分享经验成果方面的参与度较高,同时高增值学校教师参与正式和非正式两类校本教研活动的程度较高。
其次,基于教师增值估计结果分为增值最低的20%、中间的60%和最高的20%三组教师,分析不同组别教师的教研活动参与程度的差异。结果显示,高增值组的教师在以下活动的参与程度上高于中、低增值组教师:研究课、课题项目研讨、中心组成员活动、学术会议和分享经验及成果等区级常规教研活动;学科能力和深度学习两类区级专题教研活动;正式和非正式校本教研活动。
再次,从学生成绩增值估计的结果来看,聚焦于学科内容的教研活动对学生成绩的增值作用尤其显著。就常规教研活动来看,学科课程整合开发、学科核心知识和思想方法的理解、学科关键问题的确定与解决以及单元整体教学等聚焦于学科内容的教研活动对学生成绩的增值作用尤其显著。就蕴含有效专业发展特征的活动来看,四类教研活动都不同程度地起到了积极的作用,尤以聚焦课程内容、专家指导支持这两项最为稳定。就区级专题教研活动来看,学科能力和考试评价项目与学生成绩的正向关系尤其显著。就校本教研活动来看,校本教研活动的平均参与程度,尤其是参与校本课程及教辅材料开发和接受专家指导对学生成绩增值有积极作用。同时,教师之间非正式的交流也不容忽视,教师与同事研讨教学问题、学生发展问题、分享教学经验和资源都对学生成绩的增值有显著且较为稳定的积极影响。
(三)教师问卷分析的启示
调查问卷中关于教师问卷的分析结果给予我们如下的启示:一是教师所参与的教研活动主要集中在传统的教学及学科领域,相对而言教师对信息技术和跨学科能力等方面内容的职前准备和职后培训需求较弱,这可能与学校目前的需求和考评方式相关。在教研方面预先规划相关内容有助于推动信息技术背景下分层、跨学科、多元和个性化教育教学的推进。二是随着越来越多高学历非师范专业的人才进入教师行业,如何充分利用高学历人才优势,在夯实教学技能基础的同时发展研究型教学力量,这是教研当前面临的现实挑战。三是教师问卷数据显示,学校层面在资金补偿、根据教研活动适当减少工作量这些方面支持不足。此外,多数教师认为学校的考核、评价、晋升、职业规划等方面未能很好地衔接教师专业发展。OECD国家教师专业发展的相关分析显示,大部分OECD国家的教师专业发展均与教师职称晋升、薪酬等激励挂钩或相关,许多欧洲国家打通了教育相关部门、社会福利部门及服务机构、慈善机构及协会、地方政府及学校等渠道,全流程为教师专业发展提供特定的如人际关系、心理健康等方面的支持。这为我国教研系统的发展提供了参考。
(四)反思和讨论
1. 研究方法的反思
由于本文的核心数据是学生成绩、选课等行政管理数据和教师问卷数据,因此只能够采用事后回溯的方式,对教师专业发展活动进行影响评价,最终形成的分析数据除了以学生中考成绩为前测数据外,其余衡量教师知识技能、价值态度、教学实践策略的变量皆为横截面数据,即同一个时间点采集的数据。因此,本文虽然能够估计学校和教师对学生的增值影响,但只能够基于横截面数据分析教研活动参与度、课堂教学行为、教师自我效能与学生成绩之间的相关关系,而不是因果机制。如果条件允许,最佳的方式是从项目开始时就进行跟踪评价,采集项目开始前的基线数据、项目开始之后的过程数据以及项目的结果数据。为了能够准确评估教师专业发展活动对学生学习和学业成绩的影响并揭示其机制和影响路径,未来的研究可考虑以教师专业发展活动的实验研究为设计框架,由学科教师、教研员、学科教学专家以及项目评估专家共同参与,对项目进行基线、过程以及结果全程跟踪,尝试收集多维度的教师数据(例如教研活动的日志、课堂录像、课例分析记录等),结合学生和教师基线和结果测评数据,更好地探索教师专业发展活动是如何影响学生学习和学业成绩的问题。
如果按照Borko(2004)的三阶段分类,本文还处于第一阶段,并尝试向第二阶段过渡。第一阶段的研究聚焦于项目本身和作为学习者的教师之间的关系,主要目的是确认项目专业发展活动是否有效。从第二阶段开始,研究主要目的是确认同样的专业发展活动在不同的情景下由不同的培训者实施的时候是否能够保持有效性。这一阶段可以加入随机实验设计的元素:(1)为了能够更加客观地评价某一类教师专业发展活动给学生带来的影响,最佳的方式是采用实验组和对照组的方式,也就是控制实验的方式,将参与此类专业发展活动的教师与不参与的教师自身的情况及其授课学生的情况进行比较,以得出专业发展活动的真正效果;(2)为了能够评估不同的组织方式的有效性,可以保持专业发展活动的一部分要素不变(例如项目内容),在不同的学校和教师群体采用不同的培训方式(例如线上和线下),以测试不同的学习组织方式的有效性。
2. 分析框架的反思
Desimone(2009)在回顾以往研究的基础上梳理总结的“教师专业发展通过影响和改变教师知识、技能、观念和态度,最终影响学生学习”的分析框架能够帮助研究者更加清晰地定义有效专业发展活动的要素,并基于该定义进行数据收集,以便进一步分析和比较不同专业发展活动的有效性。该分析框架被广泛接受的原因之一是,20世纪90年代末到21世纪初开始的学校问责制度改革以及对符合科学标准的研究(scientifically based research)的重视,使得20世纪八九十年代更加强调情境、背景和体系的教师专业发展研究转向了更加强调影响和因果分析的实证研究。然而,教师的角色是多样的,教师的工作是多方面的,并且受到相互冲突的理想和观念的驱动,因此某一项专业发展活动往往只能解决其中一个方面的问题,并没有一个单一或统一的教师教学和学习理论能够全方位解释专业发展活动的影响机制。
有许多研究者认为,依据“过程—产出”的逻辑建立起来的框架过于线性,无法充分反应专业发展活动如何促进和实现教师学习和变化的复杂性。Opfer et al. (2011)认为,基于该框架的专业发展有效性研究仅简单地将可见、可测的专业发展活动要素(例如活动的组织形式、结构、内容、强度等)直接与可测量的教师和学生的变化联系在一起,并没有真正解释其因果。作者认为专业发展活动研究应该围绕“教师专业学习”(teacher professional learning)来展开。教师学习是一个同时发生在教师个人层面、教师群体层面和年级、学校机构层面的复杂的、系统的过程,而不是一次性的事件。因此,研究不仅需要关注什么样的专业发展活动是有效的,也需要关注教师个人的知识、信念、实践和经历对专业发展活动有效性的影响,以及从教师参与专业发展活动到其信念、知识、实践的转变这一过程并非线性发生的,而是相互作用和影响的。
Kennedy (2016)则认为,“行动理论”(theory of action)能够更好地分析和解释专业发展活动的影响机制。作者回顾了从1975年至2015年的教师专业发展有效性研究,发现一些被广泛认可的专业发展活动特征并不一定始终有效,有时候过度强调某一个方面反而会产生消极的影响。专业发展活动是否有效还取决于其他维度。基于行动理论,作者将专业发展活动按照要解决的教学实践问题和通过什么策略促使教师去改变这两个方面进行了重新归类,并将行动目的和策略这两个维度与项目特征相结合,发现能够更好地解释专业发展活动如何影响教师的学习,进而改变其教学实践。尽管基于不同的理论,但是强调专业发展需要围绕“教师专业学习”和围绕“行动理论”的两派研究者都强调教师的动机和对专业发展抱持的态度,对最终的效果有关键的影响。就目前的教师专业发展有效性的实证研究框架来看,大部分研究着重于专业发展活动本身的设计和实施对教师教学和学生学习的影响,而并未考虑教师个人的动机和意愿、专业共同体的观念和行为对专业发展有效性的影响。
无论是基于“过程—产出”的有效性分析,还是围绕“教师专业学习”或“行动理论”解释其作用机制,目前教师专业发展的实证研究更加关注学生和作为学习者的教师是如何学习的,以及如何支持和实现学习,但却很少关注教师培训者。国内关于教师培训者包括教研员和教研体系在内的研究已有一定积累,能够为其他国家在这一方面的研究提供经验和借鉴。而另一方面,有学者在回顾我国教研制度的相关研究之后指出,我国教研制度所发挥的实际功能与对它的理论解释比照悬殊,关于教研组织的“本体论”研究稀缺(丛立新,2011)。也有学者指出,尽管建国以来我国基础教育发展的研究文献积累丰富,但缺乏对教研制度的关注。为数不多的教研专题研究更加偏向于对教研工作中存在的问题和如何发挥作用进行阐述,缺乏对教研制度发展和特点的全面系统的研究(梁威等,2011)。随着我国基础教育改革和中小学课改的不断发展,教研体系越来越成为推进课程教学改革、提高教学质量和教师专业发展的核心力量,对教研制度的专业化、规范化和科学化的需求在不断加强,而这也将促进对教研支持教师专业发展的实证研究,推进与国际教师专业发展研究的接轨。
(本文的研究团队成员包括:海淀区教师进修学校罗滨、林秀艳、姚守梅、王梦、张荣慧、王帅鸣、王思南、杨智君;北京大学中国教育财政科学研究所黄晓婷、魏易、黄珍;温州市教育评估院刘舒畅。在此感谢所有团队成员所作的努力和贡献。)
注释
①为了对比分析不同的教师专业发展活动的有效性,我们根据专业发展互动内容的不同侧重点,将其分为四类: 一是聚焦于普适性的教学法的专业发展活动(generic teaching practices);二是聚焦于学科教学法的专业发展活动(subject-specific teaching practices);三是在对学生学习的理解基础上的学科教学法的专业发展活动(curriculum and pedagogy);四是聚焦于对学生学习和测评的理解(how students learn),但不提供学科教学方法的专业发展活动。我们发现那些聚焦于理解学生如何学习学科知识,并在此基础上提高教师的学科教学方法的专业发展活动能够更好地促进学生的学习。由于收集相关数据的研究不足,我们对其他一些特征,包括专业发展活动的时间安排、针对人群、组织方式等的有效性进行了评估。
②结构特征包括专业发展活动的组织形式(讲座、培训课、研讨课、学术会议等)、活动时间安排(包括频率和时长等)以及集体参与程度(多个学校或者同一个学校、部门、年级等);核心特征包括内容聚焦、强调教师的积极参与,以及专业发展活动与实践的一致性。专业发展活动的结果变量为教师自我回报的知识、技能和教学实践活动的变化。
③聚焦课程内容(content focus):侧重于与特定学科课程内容相关的教学策略,通常与教师的日常教学紧密结合,例如以具体的学科知识点为基础分析学生的学习过程和教学方法。融入主动学习(active learning):区别于传统的讲座式培训,通过创造真实的环境、交互式活动和其他策略,建立教师与课堂教学实践的直接联系。具备主动学习特征的专业活动涵盖范围很广,经常吸纳合作、辅导、反馈和反思等其他要素。支持协作(collaboration):侧重于为教师创造空间以便他们在学习中分享想法和协作,包括一对一、小组活动、校内和校际合作。通过协作,教师可以创建社区,积极改变整个年级、部门、学校和/或学区的文化和教学。示范及模范(use of models and modeling):为教师提供视频或书面教学案例、公开课/示范课、同伴教师听评课以及教案、学生作业样本等书面材料,帮助教师直观认识何为好的教学实践。专家指导和支持(coaching and expert support):由教学专家和教师分享教学专业知识,通常采取一对一指导的形式。反馈和反思(feedback and reflection):提供反馈和反思的机会,让教师思考、接受反馈以及调整其教学实践,以帮助教师加深对模仿和学习的教学实践的理解。具有持续性(sustained duration):短暂的、一次性的工作坊很难真正提高教师的专业知识、改变教学实践。具有持续性的专业发展活动为教师提供充足的时间和多次机会来学习新的知识,尝试和反思新的教学实践以促进其教学。
④主要包括四点:一是探索性,基于实证数据建立理论和研究假设;二是发展和创新,通过试点研究发现对学生学习有积极影响的干预措施;三是效果和可复制性,在多个地点推广有积极影响的试点项目,以评估其效果;四是有效性,试点研究在推广之后是否还持续有效。
⑤此外,Ke,Yin,Huang(2019)将 Desimone 提出的框架运用到中国中小学校本教研的情境中,聚焦于教师参加校本教研的成效。
⑥备课包括个人单独备课、教研组和年级组集体备课、有专家指导的备课。培训参与包括学科知识培训、学科教学法培训、课程与教学通用培训、计算机与教育技术培训以及青少年心理发展培训这五种培训。听评课包括校本同行和兄弟学校听评课。教科研参与指的是教师围绕课程设计的内容知识、教学技术、教学方法或学生发展等开展的研究实践。
⑦TIMSS(Trends in International Mathematics and Science Study)是国际教育成就评价协会(IEA)从 1995 年开始实施的一个大型国际比较研究项目,主要通过测试和问卷,测量国际上学生数学和科学成绩的状况,了解影响成绩的不同因素,其中包括对教师教学设计、教学和课堂实践相关的问题。PIRLS(The Progress in International Reading Literacy Study)是 IEA 的研究项目之一,将 9 岁左右的学生确定为测试对象,对“阅读素养”进行了界定,并构建了相应的阅读评价体系,其中包括阅读测试和调查问卷两部分。TEDS-M(Teacher Education and Development Study in Mathematics) 是由 IEA 主办的主要针对各国中小学数学职前教师进行的跨国比较研究,主要聚焦于师资培育的政策、教学的实践历程及教师专业表现的调查,以供所有参与国家彼此了解及相互学习。
⑧海淀区基础教育阶段在校生 33 万,占北京市总量的五分之一。2016—2019 年高考考生占北京市考生总人数比例的 18%—22% 左右。
⑨(1)聚焦课程内容(content focus):关注教师教授的学科内容,强调嵌入教师课堂及学校和社区环境,而非无针对性的通用性专业发展。此类专业发展为教师提供了解学生,与学生一起体验新课程,在学科内容领域尝试新的教学方法和学习方法的机会。我们调查问卷中的第 21 题 a 选项“学科课程的整合与开发”所强调的课程开发中的内容的选择、学校社区环境、理念对课程整合与开发的影响等体现了聚焦课程内容这一特征;问卷中第 21 题 b 选项“对学科核心知识、思想方法的理解”体现了这一专业发展特征中对于内容、教学和学习方法的关注。(2)融入主动学习(active learning):问卷中 f 选项“促进学习的持续性评价”所需要的积极和持续的指导与激发以及强调跟课堂和学生建立直接联系等特征体现了融入积极学习的专业发展特征。(3)示范及模范(use of models and modeling):问卷中 d 选项所指的“单元整体教学”,以及选项 f 所涉及的“分析和使用学生评价数据”体现了有效的专业发展中有效的示范及模范特征。(4)专家指导和支持(coaching and expert support):问卷中 c 选项里所涉及的“学科教学关键问题的确定
和解决”所需要的专家基于实证有效的教学经验和实践提供指导和支持,以及问卷 e 选项所涉及的“深度学习活动的设计与实施”所需的对于个性需求的关注、对有效实践以及活动组织的经验体现了有效专业发展特征中提供专家指导和支持这一特征。
⑩附表 A1 呈现了区级教研活动整体参与水平、蕴含有效专业发展要素的教研、专题教研活动参与水平和教师的课堂教学组织行为之间的关系。附表为 A2 区级教研活动参与水平和教师评价策略的使用水平之间的关系。由于篇幅原因,详细的分析结果未在文中展示,附表 A3 为区级教研活动参与水平和教师自我效能之间的关系。附表 A4 为区级教研活动和校本教研活动参与情况之间的关系。附表 A1-A4 的在线链接:http://ciefr.pku.edu.cn/upload/Appendix_A1-A4.pdf.
参考文献
蔡金花, 曾文婕. (2018). 初中教师专业素养与发展需求研究—基于深圳市的调查. 上海教育科研,(7),61—66.
陈纯槿. (2017). 国际视域下的教师专业发展及其影响因素—基于 TALIS 数据的实证研究. 比较教育研究,39(6),84—92.
崔允漷. (2011). 关于我国当前中小学教师专业发展活动的调查研究. 全球教育展望,40(9),25—31.
陈向明, 王志明. (2013). 义务教育阶段教师培训调查: 现状、问题与建议. 开放教育研究,(4),11—19.
丛立新. (2011). 沉默的权威: 中国基础教育教研组织. 北京: 北京师范大学出版社.
柯政, 洪志忠. (2011). 教师专业发展的本土理解—基于对 132 位中学高级教师的调查. 教育发展研究,(18),48—56.
李勉, 张平平, 罗良.(2018). 教师因素对学生发展的影响:国际大型教育质量监测项目的数据结果与启示 . 中国考试, (11), 53-61.
李琼, 张倩, 樊世奇. (2018). 国际视野中的我国乡村教师专业发展: 与 PISA 高绩效东亚四国 TALIS 数据的比较. 外国中小学教育,(11),55—63.
李琼, 朱旭东, 赵萍. (2013). 北京农村教师参与专业发展活动的满意度与需求调查研究. 教师教育研究,25(1),35—40.
梁威, 卢立涛, 黄冬芳. (2011). 撬动中国基础教育的支点: 中国特色教研制度发展研究. 北京: 教育科学出版社.
卢乃桂. (2006). 国际视野中的教师专业发展. 比较教育研究,(2),71—76.
罗俊, 汪丁丁, 叶航, 陈叶烽. (2015). 走向真实世界的实验经济学—田野实验研究综述. 经济学 (季刊),14(3),853—844.
穆洪华. (2018). 我国公办小学教师培训存在的问题及对策—基于中国基础教育质量监测数据的研究分析. 教师发展研究,2(1),38—47.
宋萑, 王恒. (2019). 教师校本培训转化促进机制研究—有调节的中介模型. 华东师范大学学报 (教育科学版),(2),108—115.
托马斯, 彭文蓉, 李建忠. (2015). 学校增值表现与教师专业发展关联性探析. 教育研究,(7),64—72.
王双龙. (2017). 教师自我意识与学校支持氛围对教师专业发展的影响研究. 教育科学研究,(11),74—78.
王艳玲, 胡惠闵. (2020). 我国教研机构的类型与职能: 基于全国抽样调查的分析. 教育发展研究,40(Z2),23—31.
谢晨,尹弘飚.(2021).教师视角下教研工作质量与发展均衡程度的省际比较研究. 华东师范大学学报(教育科学版),39(5),55—67.
谢敏, 辛涛, 李大伟.(2008).教师资格和职业发展因素对学生数学成绩的影响:一个跨文化比较 . 心理与行为研究, 6(2), 124—129.
薛海平, 陈向明. (2012). 我国中小学教师培训质量调查研究. 教育科学,28(6),53—57.
赵明仁, 周钧, 朱旭东. (2009). 北京市中小学教师参与专业发展活动现状与需求的调查研究. 教师教育研究,21(1),62—67.
赵健, 裴新宁, 冯锐, 程佳铭, 金莺莲. (2013). 我国教师的专业发展实践及其对学生成绩的影响: 基于五城市调研的分析. 全球教育展望,42(2),22—33.
张文静, 辛涛, 康春花. (2010). 教师变量对小学四年级数学成绩的影响: 一个增值性研究. 教育学报,06(2),69—76.
朱小虎, 张民选. (2017). 教师专业发展的可能路径—基于 TALIS2013 上海和芬兰的比较分析. 中国教育学刊,(9),1—8.
Aaronson, D., Barrow, L., & Sander, W. (2007). Teachers and student achievement in the Chicago public high schools. Journal of Labor Economics, 25(1), 95—135.
Borko, H. (2004). Professional development and teacher learning: Mapping the terrain. Educational Researcher, 33(8), 3—15.
Boyd, D. J., Grossman, P. L., Lankford, H., Loeb, S., & Wyckoff, J. (2009). Teacher preparation and student achievement. Educational Evaluation and Policy Analysis, 31(4), 416—440.
Carpenter, T. P., Fennema, E., Peterson, P. L., Chiang, C. P., & Loef, M. (1989). Using knowledge of children’s mathematics thinking in classroom teaching: An experimental study. American Educational Research Journal, 26(4), 499—531.
Charters, W. W., & Waples, D. (1929). Commonwealth teacher training study. Chicago, IL: University of Chicago Press.
Chetty, R., Friedman, J. N., & Rockoff, J. E. (2014). Measuring the impacts of teachers I: Evaluating bias in teacher value-added estimates. American Economic Review, 104(9), 2593—2632.
Clotfelter, C. T., Ladd, H. F., & Vigdor, J. L. (2010). Teacher credentials and student achievement in high school a cross-subject analysis with student fixed effects. Journal of Human Resources, 45(3), 655—681.
Day, C. & J. Sachs. (2005). International handbook on the continuing professional development of teachers. Open University Press, McGrawHill, Maidenhead, Berkshire.
Darling-Hammond, L., Hyler, M. E., & Gardner, M. (2017). Effective teacher professional development. Palo Alto: Learning Policy Institute.
Darling-Hammond, L. et al. (2009). Professional learning in the learning profession: A status report on teacher development in the United States and abroad. National Staff Development Council and the School Redesign Network at Stanford University.
Desimone, L. M. (2009). Improving impact studies of teachers’ professional development: Toward better conceptualizations and measures. Educational Researcher, 38(3), 181—199.
European Commission, Directorate-General for Education and Culture. (2005). CPD for teachers and trainers, report of a Peer Learning Activity, held in Dublin, 26-29 September, 2005.
Garet, M. S., Porter, A. C., Desimone, L., Birman, B. F., & Yoon, K. S. (2001). What makes professional development effective? Results from a national sample of teachers. American Educational Research Journal, 38(4), 915—945.
Glewwe, P. W., Hanushek, E. A., Humpage, S. D., & Ravina, R. (2011). School resources and educational outcomes in developing countries: A review of the literature from 1990 to 2010. Cambridge, MA: National Bureau of Economic Research, 4—13.
Goldhaber, D., Liddle, S., & Theobald, R. (2013b). The gateway to the profession: Assessing teacher preparation programs based on student achievement. Economics of Education Review, 34, 29—44.
Good, T., Grouws, D., & Ebmeier, H. (1983). Active mathematics teaching. New York: Longman.Guskey, T. R., & Sparks, D. (2002). Linking professional development to improvements in student learning. Paper presented at the annual meeting of the American Educational Research Association, New Orleans.
Hanushek E A. (1997). Assessing the effects of school resources on student performance: An update. Educational Evaluation and Policy Analysis, 19(2), 141—164.
Hanushek E A. (2003). The failure of input-based schooling policies. The Economic Journal, 113(485), F64—F98.
Hanushek, E., & Rivkin, S. (2010). Constrained job matching: Does teacher job search harm disadvantaged urban schools?. NBER working paper, 15816.
Harris, D. N., & Sass, T. R. (2011). Teacher training, teacher quality and student achievement. Journal of Public Economics, 95(7), 798—812.
Hill, H. C., Beisiegel, M., & Jacob, R. (2013). Professional development research. Educational Researcher, 42(9), 476—487.
Institute for Educational Sciences. (2012). Request for applications, education research grants (CFDA Number: 84.305A). Washington, DC: Author.
Jacob, B. A., & Lefgren, L. (2008). Can principals identify effective teachers? Evidence on subjective performance evaluation in education. Journal of Labor Economics, 26(1), 101—136.
Kane, T. J., Rockoff, J. E., & Staiger, D. O. (2008). What does certification tell us about teacher effectiveness? Evidence from New York City. Economics of Education Review, 27(6), 615—631.
Ke, Z., Yin, H., & Huang, S. (2019). Teacher participation in school-based professional development in China: Does it matter for their self-efficacy and teaching strategies?. Teachers and Teaching, 25(7), 821—836.
Kennedy, M. (2016). How does professional development improve teaching?. Review of Educational Research, 86(4), 945—980.
Kennedy, M. (1998). Form and substance in in-service teacher education (Research Monograph No. 13). Arlington, VA: National Science Foundation.
Lingard, B., Martino, W., & Rezai-Rashti, G. (2013). Testing regimes, accountabilities and education policy: commensurate global and national developments. Journal of Education Policy, 28(5), 539—556.
MacKinnon, D. P., Krull, J. L., & Lockwood, C. M. (2000). Equivalence of the mediation, confounding and suppression effect. Prevention Science, 1(4), 173—181.
Meghir, C., & Rivkin, S. (2011). Chapter 1 - Econometric methods for research in education. In E. A. Hanushek, S. Machin, & L. Woessmann (Eds.), Handbook of the Economics of Education (Vol. 3, pp. 1-87): Elsevier.
National Commission on Teaching & America’s Future (1996), What matters most: Teaching for America’s future, National Commission on Teaching & America’s Future, New York, NY.
Opfer, V. D., Pedder, D. G., & Lavicza, Z. (2011). The role of teachers’ orientation to learning in professional development and change: A national study of teachers in England. Teaching and Teacher Education, 27(2), 443—453.
Penuel, W. R., Fishman, B. J., Yamaguchi, R., & Gallagher, L. P. (2007). What makes professional development effective? Strategies that foster curriculum implementation. American Educational Research Journal, 44, 921—958.
Supovitz, J. A. (2001). Translating teaching practice into improved student performance. In S. Fuhrman (Ed.), From the capitol to the classroom: Standards-based reform in the states (pp. 81-98). Chicago, IL: University of Chicago Press.
U.S. Department of Education. (2002). U.S. Department of Education strategic plan, 2002-2007. Retrieved June 15, 2012, from
http://www.ed.gov/pubs/stratplan2002-07/index.html
World Bank. (2018). World development report 2018: Learning to realize education’s promise. Washington, DC: World Bank. doi: 10.1596/978-1-4648-1096-1.License:CreativeCommonsAttributionCCBY3.0IGO.
Yin, H., Xie, C., Hu, H., & Wang, M. (2020). Demystifying and sustaining the resilience of teacher educators in China: The perspectives of teaching research officers. Asia Pacific Education Review, 21(2), 311—323.
Yoon, K. S., Duncan, T., Lee, S. W.-Y., Scarloss, B., & Shapley, K. (2007). Reviewing the evidence on how teacher professional development affects student achievement (Issues & Answers Report, REL 2007–No.033). Washington, DC: U.S. Department of Education, Institute of Education Sciences, National Center for Education Evaluation and Regional Assistance, Regional Educational Laboratory Southwest.
Zhao, X., Lynch Jr, J. G., & Chen, Q. (2010). Reconsidering Baron and Kenny: Myths and truths about mediation analysis. Journal of Consumer Research, 37(2), 197—206.
上期回顾
特稿特稿|赵勇:教育评价的几大问题及发展方向教育评价李刚, 辛涛|基础教育质量的内涵与监测评价理论模型张佳慧, 李峰, 辛涛|基础教育质量指数构建的模式与途径
陈慧娟, 辛涛|我国基础教育质量监测与评价体系的演进与未来走向
高等教育
胡艳婷, 蒋承|专业匹配对高校毕业生工资起薪的影响——基于倾向得分匹配法的实证研究
王金龙, 邬志辉|“双一流”政策对高校本科生源质量的影响研究
教师队伍建设
魏叶美, 范国睿|教师参与学校治理意愿影响因素的实证研究——计划行为理论框架下的分析
李国强, 李志远|城乡教师跨校交流中的匹配策略——基于“个人−组织匹配”的调查研究农村教育
朱永新, 罗晶|教育助力乡村振兴——世界银行消除“学习贫困”项目及对中国的启示
职业教育
本刊声明
一、本刊对所有来稿不收取任何费用,也未委托任何机构或个人代为组稿。
二、本刊严禁一稿多投,如因作者一稿多投给本刊造成损失的,本刊保留追究作者法律责任的权利。
三、作者投稿请登陆华东师范大学学报期刊社官方网站(www.xb.ecnu.edu.cn)。
四、本刊联系电话:021-62233761;021-62232305。
华东师范大学学报期刊社
华东师范大学学报期刊社微信矩阵
点击「阅读原文」访问华东师范大学学报教育科学版官网,可下载本刊各期PDF全文,也可在线阅读本刊各期XML格式全文。
我知道你在看哟