查看原文
其他

专家视点 | 林敦来:英语教师课堂测评素养及提升方法

林敦来 外研测评 2022-04-24

摘要:本文以为什么评、评什么和怎么评为框架,结合国际上教师评价能力标准,论述了英语教师课堂测评素养包含的内容。在此基础上,本文重点介绍了提升语言测评素养的资源, 并讨论了教师提升测评素养的方法,包括个人研修、小组学习和工作坊。


关键词:测评素养;英语教师;提升方法

 引 言 

英语教师在日常工作中会以不同的目的和角色参与设计、实施、解读、使用和汇报语言测评数据,其背后的知识基础被学界概念化为测评素养(Assessment Literacy)。测评素养这个术语首先出现于普通教育学领域(Stiggins, 1991)。Inbar-Lourie(2013)认为语言测评素养不仅包括熟悉测评学生语言能力的工具和程序,还包括其他成份,尤其是能够为学生提供恰当的反馈以帮助他们达到预期的学习目标的成份。除外,教师还要考虑到测评过程的伦理问题,以及基于测评所做出的决策可能带来的后果,即Messick(1989)提出的后效效度。笔者认为,归结起来,英语教师的测评素养就是要回答好语言测评中的三个重要问题,即why(为什么评)、what(评什么)和how(如何评)。本文拟从这三个方面,结合文献中关于教师测评能力的标准,讨论英语教师课堂测评素养包含的内容及其提升方法。


 课堂测评素养包含的内容 

传统上,教师往往更加关注如何评的问题。原因可能是教师自己在求学过程中面对的是各种题海,在教学中难以完全摒弃自己的求学经历,同时试题对于教师的测评活动也是最直观的,但其背后的构念与设计理念往往没有被充分领会。测评对学生乃至社会是有重要影响的(Shohamy, 2001; McNamara & Roever, 2006)。Shohamy(2008)指出,语言测试研究者非常关注测试的使用:为什么测试?谁受益?谁受损?测试绝不是没有价值倾向的,而是能够在个人、教育和社会中起到核心作用的工具。因此教师要特别关注为什么评的问题。

 1.为什么评

《学生教育评价中的教师能力标准》(AFT, NCME & NEA, 1990)( 以下简称“1990 标准”)指出,教师应该能够熟练地辨别不合伦理、不合法和不合适的评价方法以及对评价信息的滥用。Brookhart(2011)也包含了类似的条目。McMillan(2000)指出,好的评价应该是公平与合乎伦理的。Popham(2009)指出,教师应该知道如何辨识和排除评价偏颇,以排除因种族、性别和社会经济地位等个体特征而带来的冒犯或不公平的惩罚;知道如何决定问责考试在评价教学质量中的适切度。Chappuis和Stiggins(2017)的高质量课堂评价中也明确了“为何评价”的问题。他们认为评价过程和结果要服务于清晰和恰当的评价目的。美国教育标准联合委员会(Joint Committee on Standards for Educational Evaluation, JCSEE)于2015 年推出美国《幼儿园到高中教师的课堂评价标准》,(后文简称为2015 标准),其中明确指出,课堂评价实践要有清晰的目的,最终服务于学生的学习(JCSEE, 2015)。


Davies(2008)用“原则”来说明为什么评的问题,它指的是“语言测试的合理运用,公平性和影响,包括伦理和专业素养问题”。Taylor(2013)在语言测评素养框架中包含了社会文化价值。Bachman和Palmer(2010)则认为语言评价的设计要首先考虑有益的后效。


归结起来,关于为什么评,教师要能够辨认测评是否合乎伦理、测评能否带来良好的反拨作用、测评是否是公平的、测评是否有清晰的目的、测评结果的使用是否合理、测评是否有利于促进学生学习等问题。

2.评什么

1990标准中包含了教师对学生表现的清晰描述,但远未能达到今天世界范围内所流行的基于标准的教学与测评的要求。Brookhart(2011)中用三条标准来阐述评什么:教师应该充分理解他们所教授的内容;应该能够清晰地陈述学习目标,学习目标要与课程标准中暗含的内容和思维深度相匹配,并且学习目标必须是学生能够达到,可以测量的;应该能够向学生传达学习目标最终实现后学生的表现该如何。Chappuis和Stiggins(2017)把清晰的学习目标作为高质量课堂评价的要素之一。2015标准也将学习目标作为评价的基础。为了获得良好的决策,教师要理解学生学习的机制,并将学习目标细化成学生可以达到的目标。


就语言测评来说, 教师应该首先理解什么是语言、语言学习的机制,才能奠定语言测评的基础。回顾历史,Spolsky (1976,引自Fulcher,2000) 将语言测试分为三个阶段:科学前时代、心理测量和结构主义时代以及心理语言学和社会语言学时代。Morrow(1979)将这三个阶段形象地概括为“伊甸园”“泪之谷”与“希望之乡”。Brown(2005)在此基础上增加了一个语言测试发展动向,即交际时代,并指出了各个阶段的语言学基础,如表1所示。

显然,交际时代动向是当下语言测评的主流,但其他几个动向也还在影响许多教师的测评行为。Taylor(2013)在教师语言测评素养框架中对语言教学法做了最高的要求,Inbar-Lourie(2013)也认为语言测评素养包含了解当下的语言教育方法和应用语言学。当语言教学转向更加注重语言使用和意义表达的时代,如果教师课堂语言测评未能反映此趋势,问题自然就产生了。语言教师应该对语言交际能力有深刻的认识。自从Hymes(1972)提出交际能力后,Canale 和Swain(1980),Canale(1983),Bachman(1990),Celce-Murcia 及同事(1995),Bachman和Palmer(1996,2010)均对语言能力做了详细论述(见表2)。

Celce-Murcia及同事(1995)的语言能力框架见图1。其中的行动能力例如人际交往中(如见面打招呼)相关的言语行为知识。虽然该框架只针对听力和口语,但是它主要应用于教学情境,并且包含英语中特有的成分(如特殊结构、平行结构),对英语教师具有非常重要的启示。

随着我国外语等级能力量表的构建,基于标准的教学与评价将进一步深化。面向使用的语言能力量表将有助于教师更加深刻理解语言能力,帮助他们更加清晰地描述语言能力,阐述教学目标,并将之转换成可测量的目标。

 3.如何评

1990 标准中有四条标准涉及如何评:(1)教师应该能够熟练地选择恰当的评价方法用于教学决策;(2)能够熟练地编写恰当的评价方法用于教学决策;(3)能够熟练地就外来测试和自己编写的试题进行施考、评判和分数解释;(4)能够熟练地编写有效的评分标准用于学生评价。Brookhart(2011)也是四条:(1)教师应该理解评价方法的目的和使用,并能够熟练地运用它们;(2)能够分析课堂问题、测试题和表现性评价任务,来确保学生运用特定的知识和思维技能来完成任务;(3)能够设计评分标准来量化学生课堂评价的表现,形成对学生、课堂、学校和学区有用的决策信息,这些决策应该能够促进学生学习、成长和进步;(4)能够为外部评价进行施测,解读成绩,帮助学生、班级、学校和学区做出决定。2015标准指出,课堂评价的类型和方法要能清晰地允许学生表现他们所学内容。Chappuis和Stiggins(2017)中也突出了良好的设计。


Bachman(1990)中的测试方法侧面理论(Test Method Facet)为探讨语言测试的不同方法提供了理论框架。除了测试方法,形成性评价因其促学作用(Black & Wiliam, 1998)应成为教师课堂评价的主要方法。图2展示了评价范式从学习段评价(assessment of learning) 到学习性评价(assessment for learning) 乃至学习化评价(assessment as learning) 的转变。教师的课堂测评工具箱中必须准备档案袋评价、小组会谈、日志等其他评价方法(alternative assessment)。


  课堂测评素养提升方法  

笔者(2016)的调查显示,34.5%的中学英语教师未修读过语言测试课程,31.4%的老师在职期间参加过语言测试培训或听过语言测试相关的讲座。Jin(2010)的调查显示,语言测试课程过于关注测试学方面的知识,而课堂评价未得到应有的重视。语言测评是实践性非常强的学科,外语教师职前培训由于师资、时间等方面因素,不可能为师范生提供足够的职业准备,因此在职培训依然是提升语言测评素养的重要阵地。方法主要有个人学习、小组学习和工作坊。Stiggins(1999)认为65%的时间需教师自己学习,25%的时间参与小组学习,10%的时间参与工作坊。本节首先介绍个人或小组学习的资源,然后讨论活动模式。

 1.拓宽课堂测评素养相关的基础知识

(1)运用专著或教科书来提升测评素养

专著或教科书因其方便获得的特性,成为教师提升测评素养的最佳工具之一。虽然有些专著或教科书有较强的测量倾向,但是随着近年来课堂测评受到关注,一批以一线教师为目标读者的专著或教材也涌现出来,它们提出了许多课堂中切实可行的测评方案。Bachman和Palmer(1996, 2010)两版著作的题目就显示了从测试到评价的转变,也越来越强调对现实世界中评价的使用。Alderson和Bachman主持的系列图书从词汇、语法、听力、阅读、口语、写作和儿童语言学习评价方面为教师提供了从理论到实践到实例的全面指导。O’Malley和Valdez Pierce(1996)在语言测评教材中标新立异,将理论和实践以通俗的语言呈现,其中的量表、清单和自评表等可以稍作调整用于不同的课堂。Genesee和Upshur(1996)中对课堂观察、档案袋和学生会谈、日志、问卷和访谈等非测试评价手段做了详细的介绍。Davidson和Lynch(2002)向教师们呈现了如何建构完善的考试说明,展示了测试开发过程中的小组合作问题并辅以实例。Stoynoff和Chapelle(2005)综述了常见的英语测试,聚焦测试选择中情境的重要性,为教师提供了恰当选择和使用测试的实用技能。Coombe及同事(2007)不仅以通俗的语言讲解语言测评,而且利用实际场景引导教师反思。Brown(2013)提供了丰富的另类评价例子,每个例子建议了学习者语言水平、目标、课堂用时、准备时长和所需材料,供教师选择使用。Bailey和Curtis (2015)以框架、教师的声音、探索和工具四种栏目开展了权威教师与课堂教师之间的测评对话,促使教师思考课堂中的语言测评问题。Cheng和Fox(2017)从why, what, how, who, when 等角度论述了语言课堂中教师如何使用评价来促进学生学习。形成性评价的著作也不断涌现,例如Andrade和Heritage(2017)讨论了如何使用形成性评价来促进学习,提高学生成就并实现自我调控。


(2)运用期刊论文来提升测评素养

目前语言测试国际核心期刊主要有Language Testing, Language Assessment QuarterlyAssessing Writing. 虽然期刊论文通常让一线教师望而却步,但是期刊的更新速度以及当前对课堂评价的关注,值得教师花费精力来了解。教师可以忽略复杂的研究过程和数据分析而聚焦与他们的教学情境相关的研究结果。部分概念性的论文和新书评介也是教师提升测评素养的窗口。例如Haladyna及同事(2002)关于选择题编写规则的研究成果可以做成清单用于指导教师编写选择题。


(3)运用电子或网络资源来提升测评素养

澳大利亚2015年启动了TEAL项目(http://teal.global2.vic.edu.au/),旨在提升小学和初中教授英语为第二语言的教师的测评素养。该网站提供了大量专业学习资料,引导读者逐步建构对语言评价的理解,并辅以大量的学生评价实例,既适合教研活动一起研修,也适合教师独立思考并在相应年级学生中进行尝试。


Glenn Fulcher的语言测试资源网站(http://languagetesting.info/)提供了目前为止语言测试领域最全面、更新最及时的信息。截至目前,Fulcher已经邀请21位国际权威专家就他们的专长领域做了论述并录制视频。结合Language Testing期刊,Fulcher每年两次主持播客,针对语言测试最新热点问题邀请国际顶级专家发表看法。此外,网站中的文章和专题内容以及书籍信息对语言教师提升语言测评素养都有重要的帮助。


1992年,Rick Stiggins建立评价培训学院(http://downloads.pearsonassessments.com/ati/index.html),致力于提升教师的评价素养。评价培训学院现已成为培生集团的一个部分。该团队开发了大量课堂评价培训著作和多媒体资料,定期开展测评培训,并提供了丰富的网络资源供读者免费阅读。


欧洲委员会在其《欧洲语言共同参考框架》网站(https://www.coe.int/en/web/common-european-frameworkreference-languages/home)上提供了极其丰富的测评材料,不论是语言能力等级描述、国际知名考试、语言能力等级之间的关联,抑或学习档案袋的制作或学生的自评量表,都可以从该网站上找到有用信息。

2.提升课堂测评素养的活动模式

(1)传帮带模式

此种模式通过发挥高校专家优势,与一线教师协作,提升教师的测评素养。例如,英国兰卡斯特大学的研究者与卢森堡公国中学教师的合作开展的测评素养提升项目包含了课程与测试开发指导,课程采用面授与平台自主学习两种方式进行,在测试开发的关键阶段进行关于题目修改和标准设定的面对面工作坊。而国内类似的项目有外研社的优诊学项目,该项目聘请国内外专家为指导,由国内语言测试者与一线教研员和教师共同参与,一道开发诊断性英语测试。项目以一些中学和大学为试点,运用诊断测试结果指导教学。在参与项目的过程中,一线教师的语言测评素养得以提升。


(2)学习共同体

Arter(2001)提出建构学习小组是提升课堂测评素养有效途径。学习小组不是一组人阶段性见面简单讨论课堂发生的事情,而是一组教师协同尝试新观点,定期见面就特定的目标分享特定的专业成长经历。Arter和Busick (2001) 将这种组会定义为“不仅仅是分享书本所学知识,更是分享课堂所学经验的场所。组会上可以分享成功和讨论策略,以促进学生学习,也可以分享困难、困难背后的原因和解决方案。总之,组会为学习、规划、尝试和反思新想法提供了场所”。Arter (2001) 还提出建立测评素养学习小组需主要考虑的问题:第一是资源建构,上文提到的资源可以作为资源建构的开端,教师应结合教学情境再制定细化的资源并适时调整;第二,学习小组的最佳人数在六名;第三,学习小组成员组构应主要考虑教师兴趣;第四,每次组会会前准备约2—4 小时,会议时长1—2小时,2—4 周一次为宜,地点由成员协商决定;第五,需建立小组行为规则,长期坚持;第六,要记录学习过程,并定期反思。


 结 语 

应该指出,测评素养的发展要与教师的工作环境紧密结合,要得到国家、地方和学校的重视,如此方能取得成效。测评素养的发展也不能一刀切,要采用区别化的方法,根据问题的紧迫程度逐步展开。对于教师个体来说,开展反思性的测评实践是专业发展的重要途径。

本文作者

林敦来,北京师范大学外国语言文学学院副教授、博士生导师,现任外文学院公外部主任。研究方向为语言测试与评价,特别关注语言教师的评价素养。现主持国家社会科学基金项目1项,参与多项省部级科研项目。

本文选自《英语学习》2018年第2期,因篇幅所限,已省略参考文献。文章版权归《英语学习》所有,欢迎分享本文到朋友圈,如需转载请在后台联系小编。

距离第四届英语教学与测评学术研讨会征稿

截止时间12月29日还有最后10天!!

期待您的投稿!

 往期精华 


专家视点 

专家视点 | Chris Davison: 教师测评素养:我们如何了解需要提高什么?

专家视点 | 陈新忠等:利用诊断性评价改进高中英语教学

专家视点 | 吴岩:新使命 大格局 新文科 大外语

专家视点 | 姜钢、何莲珍:构建系统连贯的考试体系,促进英语教育教学和评价方式改革

专家视点 | 金艳:外语教师评价素养发展:理论框架和路径探索

专家视点 | 武尊民:基于标准的学业质量测评:连接中国英语能力等级量表与内容标准


重磅干货

重磅干货 | Chris Davison:教师测评素养:我们如何了解需要提高什么?

重磅干货 | 罗少茜:素养教育背景下的语言测评:变与不变

重磅干货 | 刘建达:基于中国英语能力等级量表的外语教师测评素养发展

重磅干货 | 案例论坛:基于诊断性测评提升高中英语写作教学的案例研究

重磅干货 | 案例论坛:诊断性测评背景下思维导图运用于高中英语阅读教学实践

重磅干货 | 案例论坛:有效利用过程性评价, 以评促学

重磅干货 | 案例论坛:高中英语词汇教学中的测试任务设计

重磅干货 | 专题研讨: 基于核心素养的北京市初中英语学业标准的开发与应用


来读书 

“来”读书 | 第一期:混合方法研究在语言评价领域的运用

“来”读书 | 第二期:少儿英语学习者的语言能力评价

“来”读书 | 第三期:设计听力测试的实用方法

“来”读书 | 第四期:高等教育与核心能力培养

“来”读书 | 第五期:评价意义 (Assessing Meaning)

“来”读书 | 第六期:计算机辅助语言测试的发展、成就、现状与展望


测评加油站 

测评加油站 | 英语听力测试与评价

测评加油站 | 英语阅读课堂评价类型与方式

测评加油站 | 测评知识小科普

测评加油站 | 好书助力教学实践与研究

测评加油站 |《剑桥英语教师丛书》

【更多精华内容请点击公众号后台“学术交流”菜单栏获取!】

学习·分享·成长

长按关注外研测评

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存