查看原文
其他

热点聚焦 | 外语教学评价:理论与实践

iResearch 外研社外语学术科研
2024-09-09

引言

教育测评历来是教育体系中不可或缺的一环,既有助于教师获取教学信息、改善教学方法、保证教学质量,也可以帮助学生改善学习方法和策略、提升学习能力(顾永琦、李加义 2020)。我国目前的语言测试包括多种高风险外语考试,涉及入学、毕业、就业等目的,以及各种校本考试和课堂评价(金艳 2018)。


语言评价素养(language assessment literacy)是指语言教师需要掌握的评价知识和技能。在大学英语教学改革不断深入的背景下,作为重要的教学和评价主体,教师是否具备足够的评价素养,进而开发和实施学业测试和课堂评价至关重要。基于此背景,本期“热点聚焦”栏目聚焦“外语教学评价”,从理论和实践两个层面探讨外语教师如何通过有效的评价活动提高教学质量、促进学生学习成效。


在理论层面,金艳(2018)介绍了语言评价素养的拓展定义,并结合我国外语教育领域的评价实践,提出了一个对外语教师评价素养的要求的模型;顾永琦、李加义(2020)阐述了已逐步成为研究热点的“形成性评估”的目标、标准和效度。在实践层面,孙曙光(2017)基于“师生合作评价”课堂反思性实践,总结了评价焦点的原则和“以评促学”的主要手段;耿峰、于书林(2021)基于某全国性大学英语教学比赛中教学团队参赛教案的文本分析,探讨教师如何策划和实施课堂评价活动以及教师评价素养存在的问题。


相关推荐

研修通知 | 外语课堂教学评价:理论与实践(5月14—15日,线上直播)


外语教师评价素养发展:理论框架和路径探索

金艳,上海交通大学外国语学院语言学与应用语言学方向教授、博士生导师,兼任全国大学英语四、六级考试委员会主任、全国大学外语教学指导委员会副主任。主要研究方向为语言测试的理论研究和实践,尤其是大规模标准化语言测试的研究。其他学术兼职有:亚洲语言测试协会副主席,Language Testing in Asia主编,Language Testing、Classroom DiscourseInternational Journal of Computer-Assisted Language Learning and Teaching、《当代外语研究》、《外语界》、《外语学刊》、《中国外语》、《外语测试与教学》、《外语教育研究前沿》等编委。


语言评价素养的拓展定义

Fulcher(2012)构建了一个立体三维的语言评价素养扩展定义(见图1)。该定义的底层是语言评价的实践能力,即开发、实施和使用语言评价的知识、技能和能力;中间层是评价过程、原则和理念,即评价者需熟悉考试过程,了解指导考试实践的原则和理念,包括道德规范和行为准则;顶层是环境因素,即评价者需要在更广泛的历史、社会、政治和哲学背景下开展评价,以更好地理解评价的机制及其对社会、机构和个人的影响。扩展后的定义涵盖了语言评价活动的各个方面,包括评价的环境、评价工具的开发和使用及其产生的后果。不仅如此,该定义把“原则”作为一个独立的层面,凸显了理论基础、行为准则和道德规范对语言评价的重要性。


对外语教师的评价素养要求

尽管外语教师的评价素养发展仍缺乏指导性的理论框架,但是20世纪70年代末以来我国外语教育领域快速发展,使我们得以在外语评价实践的摸索过程中获得许多经验。因此,参考Fulcher(2012)的拓展定义和Taylor(2013)针对不同群体提出的语言评价素养图,同时结合我国外语教育领域的主要评价实践活动分类,本文提出一个对外语教师评价素养要求的模型(见图4)。


首先,如图4左侧所示,评价素养主要包含三个层面:评价环境(A),评价过程、原则和理念(B),以及评价知识、技能和能力(C)。如果我们把对教师的评价素养要求从低到高进行描述,并用李克特五点量表表示为1至5,那么对外语教师评价素养的要求就可以根据各类评价任务的特点,用类似评分时采用的量表进行更为细致的描述。其次,如图4右则所示,我国外语教学中采用了多种类型的评价,主要包括以下三大类:大规模考试(如高考、大学英语四、六级考试),校本的学业测试(如分班考试、期中或期末考试),以及丰富多样的课堂评价。不同类型的评价目的不同,方法和内容不同,教师和学生的参与度不同,所需的评价素养也不同。


具体来看,外语教师经常开展的是课堂评价活动,包括设计评价任务、实施课堂评价、记录评价结果、反馈评价信息等。这些评价活动对教师在实践层面的评价素养要求最高(C=5),其次是过程、原则和理念层面的评价素养(B=4),而环境层面的要求则相对可以低一些(A=3)。外语教师有时需要参加校本学业测试的开发和实施,包括确定考试目的、制定考核目标、设计和命制试题和评分标准、实施考试和评分、报告考试结果。这些评价活动对各个层面的评价素养要求都较高(A=4,B=4,C=4)。大部分外语教师并不直接参加大规模考试设计,但他们需要了解考试的目的,理解考试的目标,熟悉考试的内容、题型和评分标准,理解分数含义,并且合理使用考试结果。与课堂评价不同,大规模考试方面的评价素养要求以环境层面为最高(A=5),实践层面为最低(C=3)。当然,如前文所述,这些对外语教师的评价素养要求是作者依据实践经验提出的假设,有待将来在实证研究中得到进一步论证。


节选自:金艳,2018,外语教师评价素养发展:理论框架和路径探索,《外语教育研究前沿》1(2):65-72。

形成性评估的效度

顾永琦,新西兰惠灵顿维多利亚大学高级讲师,在中国、新加坡及新西兰有丰富的教学及教师培训经验,研究兴趣主要为:learner autonomy, learning strategies, vocabulary acquisition 及 testing and assessment。出版的专著包括Vocabulary Learning Strategies in the Chinese EFL Context (Marshall Cavendish Academic, 2005)、Focus on vocabulary (与Paul Nation合作,NCELTR, Macquarie University,2007)。


李加义,新西兰惠灵顿维多利亚大学语言学与应用语言研究学院博士研究生。主要研究领域:语言测评、外语教学。


Gu(2020)将形成性评估的概念具体化为两种形式:理想的形成性评估和基本的形成性评估。前者由明确评估目的、完成评估实践和实现评估效果三部分组成(见图1),后者则需包含完成至少一个循环的形成性评估实践。在现实课堂教学中,理想的形成性评估很难找到。形成性评估实践是由收集证据(elicitation)、解释证据(interpretation)、提供反馈(feedback)和后续行动(action)四个步骤组成的循环,只有构成完整的循环,才有可能使学生更靠近学习目标。形成性评估往往要经过多次完整的螺旋式循环才能帮助学生实现学习目的。


在课堂教学中,教师需要明确教学目标,了解学生现有水平与目标水平的差距,并提出缩小差距的有效方法(文秋芳 2011)。从本质上说,形成性评估首先探究学习者现有水平与目标水平的差距。因此,首要任务就是确定目标,然后才能向目标靠近。在形成性评估中,明确的教学目标和学习目标发挥重要的导向作用,同时为确认教学成功与否提供了参照依据。任何有用的学习目标必须是一个明确的目标。目标决定了收集、解读和使用信息的方式(Cowie & Bell 1999)。教师对于目标任务和任务达成标准的认识将决定评估工具的选择、设计和使用方式。


除明确教学目标和学习目标之外,教师还应明确成功达成学习目标的标准。通过课堂语言评估,教师对课程标准、语言能力概念以及教和学的认识将指导其设计和选择工具,以提高学生的语言能力。评估什么、如何评估、如何解释评估结果、向学生提供什么样的反馈、是否及如何采取后续行动都取决于评估者对评估目标和成功标准的理解。在课堂形成性评估中,教师的评估目标主要来源于课程标准和语言能力的理论构念。教师对标准的理解和解释构成了学科教学知识(pedagogical content knowledge,简称PCK)的重要组成部分。


形成性评估的效度来自多次反复评估,如对不同任务和不同信息来源的评估,以及给予被评估者的详细反馈和多次改进机会。


节选自:顾永琦、李加义,2020,形成性评估的效度,《外语教育研究前沿》3(3):34-41。

“师生合作评价”课堂反思性实践研究

孙曙光,北京体育大学外国语学院副教授,北京外国语大学中国外语与教育研究中心博士,北京2022冬奥会和冬残奥会组织委员会对外联络部项目专家,国家体育总局“优秀中青年专业技术人才百人计划”首批培养对象。主要研究兴趣为语言教学、课堂评价。公开出版专著、译著、教材等近20部,发表期刊论文20余篇,主持和参加各级科研课题10余项。


评价焦点的原则

教师每次评价不可能“胡子眉毛一把抓”,做到面面俱到,而是要有选择地关注主要问题和主要问题的主要方面。经过4轮的师生合作评价,我总结出确定评价焦点的“三原则”。需要特别强调的是,这三条原则不是实践之前预先设定,而是在实践与反思基础上逐渐形成。


1)典型性原则评价焦点的典型性是指问题覆盖面广(至少50%以上的样本中都存在的问题),同时又是影响有效性的主要问题。

2)循序渐进原则评价焦点的安排需由易到难,由简到繁,逐步深化。

3)可教性原则:评价的问题须在可控、可教范围之内,即不能过大或者过小,教师需要在预定的学时内完成对所选择的评价焦点的评、讲、改、练。


这三条原则缺一不可,其中典型性和循序渐进原则是TSCA有效性的前提和基础,可教性原则是TSCA 有效性的重要保障。三条原则在具体应用时相互作用,相互制约。


“以评促学”的3个主要手段

“以评促学”是POA新增假设,主张在教师专业引领下,学生边评边学、边学边评,打破“学”与“评”的界限(文秋芳2017)。在TSCA的课内实施阶段,我遇到的另一个挑战是如何“以评促学”。在进行4轮反思性实践之后,我总结出三个主要手段,帮助学生“过眼”后“入心”。


1)制定清晰可及的评价目标

实现“以评促学”的前提是学生了解学习目标(Hattie & Timperley 2007)。只有当学生明确了学习目标,才有可能积极参与学习过程(Hawe & Parr 2014;李雪莲2016)。在反思实践的过程中,我根据评价焦点制定评价目标。


2)引导学生发现问题、解决问题

教师采用启发式教学,引导学生去“做”。学生在“做”的过程中容易对所学内容形成较为深刻的印象,内化所学的知识。正所谓“告之,则恐遗忘;示之,铭记于心;行之,学以致用”(Tell me, and I ll forget. Show me, and I ll remember.Involve me, and I ll learn.)。教师以提问方式引领学生提出修改意见,再展示事先准备好的学生样本优秀范例。这种引导收到了很好的效果:在修改稿中,所有学生的题目问题均得到解决。


3)“评”、“讲”结合

在采用TSCA对学生作文进行评价时,教师将“评”与“讲”相结合。“评”是指评价并提出修改意见,重点在“如何改”;“讲”是指针对评价焦点的讲授,重点在“如何写”、“为什么”。“评”、“讲”结合使学生在课内就同一内容进行了多次有意义的学习,提高了学习有效性。


节选自:孙曙光,2017,“师生合作评价”课堂反思性实践研究,《现代外语》40(3):397-406。

外语教师课堂评价素养与实践

耿峰,中国民航大学外国语学院教师,澳门大学教育学院博士生。研究方向为第二语言写作、外语课堂教学评价、外语教师教育。近年来在外语类和教育类SSCI和CSSCI期刊发表论文数篇,主要期刊包括Journal of Second Language WritingScandinavian Journal of Educational Research、《外语教学与研究》、《外语界》、《外语电化教学》。


于书林,澳门大学教育学院副教授,博士生导师。研究方向:第二语言写作、课堂反馈与评估、外语写作教师教育。


本研究运用社会文化理论视角下的教师评价素养框架,基于某全国性大学英语教学比赛56 支教学团队参赛教案的文本分析,探讨教师如何策划和实施课堂评价活动以及教师评价素养存在的问题。研究发现:



研究问题1):参赛教师的教案中包括哪些评价内容?

从文本中发现,教案的评价内容涵盖课程性质、学生背景、教学目标、评价理念及方式。教案开头部分集中反映了课程性质和学生背景两项内容。评价内容的另一要素是教学目标。56 份教案主要从7 个维度描述了教学目标,但侧重点各不相同。根据比赛要求,教案中还应说明课程的评价理念和方式,且能有效检验单元目标以及课程成效是否达成。经分析,各教学团队均采用了多元评价方式(包括以教师为主导的师生合作评价、学生评价、网络评价和学生自评等)、多途径收集信息、形成性评价与终结性评价相结合的评价理念。


研究问题2):参赛教师如何在教学过程中实施评价方案?

在教师主导的评价模式下,教学评价实践主要表现为“教评合一”活动。参赛教师根据“成效导向”的课程设计理念和多元评价概念(文秋芳2016),普遍把“教评合一”活动分为课前、课中和课后三个环节。


教案在课前环节设计了多元化的教学活动,目的是驱动学生的语言输出(见表3)


课中环节以教师讲解和学生小组学习为主,目的是促成学生的语言学习(见表4)。


课后教学活动主要表现为学生完成教师布置的语言产出任务,并完成语言评价(见表6)。


研究问题3):评价内容和实施过程反映出来的教师评价素养的问题是什么?

首先,尽管教师普遍采用了“师生共同评价”,但对评价对象的认知还存在盲区,评价方式的选择表现出一定的随意性。其次,课中教学环节没有介绍学生评价活动的实施方法,评价量表使用不足,评价缺乏理据性和公平性。再次,部分教案的课中评价是多种评价活动的简单叠加,教师没有注意到多元评价方式的复杂性。最后,评价活动集中在课前和课中环节,课后评价活动较少且缺乏设计。


节选自:耿峰、于书林,2021,外语教师课堂评价素养与实践:基于大学英语教学比赛参赛教案的文本分析中,《外语教学与研究》53(2):238-250。

相关阅读

前沿要览 | 外语课堂教学评价:理论与实践

研修通知 | 外语课堂教学评价:理论与实践(5月14—15日,线上直播)


点击阅读原文,查看更多“热点聚焦”话题

继续滑动看下一个
外研社外语学术科研
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存