查看原文
其他

期刊好文|诊断性语言测评在教学中的应用:评教互动研究框架(文/金艳、余国兴)

金艳、余国兴 外研社外语学术科研
2024-09-09

提 要:诊断性语言测评的宗旨是通过诊断、反馈和补救性教学,提高学生的语言运用能力。因此,诊断测评的效度研究需要重点关注测评与教学之间的互动。本文基于诊断测评效度论证框架,结合学习导向型评价理念,构建适合我国外语教育环境的基于诊断性语言测评的评教互动研究框架。基于该框架,本文以服务我国大学英语教育的优诊学(高校版)为案例,探讨评教互动研究所面临的挑战,并提出评教互动研究的发展方向。


关键词:诊断性语言测评;补救性教学;评教互动;学习导向型评价


DOI:10.20083/j.cnki.fleic.2023.01.037


1 引言

考试与教学是既对立又统一的关系(杨学为 2001)。一方面,选拔性考试或水平考试的目的是客观评价学生所具备的知识和能力,为高风险决策提供依据。此类考试属于终结性评价,一般由独立的考试机构实施。另一方面,考试与教学同处于一个教育系统中,考核目标与教学要求应保持一致,考试的目的是促进学生进步。此类考试属于形成性评价,一般由教师或学生在教学过程中开展。诊断测评属于形成性评价,其宗旨是通过诊断和反馈来改进教学(Alderson et al. 2015;Lee 2015)。因此,诊断测评的效度研究需要重点关注教学与测评的互动关系及其对教学和学习产生的影响(金艳、余国兴 2019)。优诊学(高校版)是针对我国大学英语教育的在线英语诊断测评系统。在研发过程中,外语教学与研究出版社(以下简称“外研社”)研发中心组织开展了全面的效度研究和教学应用研究,采集了多方面的效度证据,进行了教学实践探索。本文旨在构建适合我国外语教育的诊断测评与教学互动研究框架,并通过优诊学(高校版)的案例分析,探索评教融合共进的路径,推动评教互动理论与实践的发展。


2 诊断性语言测评在教学中的应用研究

2.1 诊断性语言测评的后效研究

根据Messick(1989)的整体效度理论,语言测试后效(或后果)是效度的有机组成部分,是语言教学与考试关系的最直接表达,更是考试的教育价值和社会价值的重要体现。自考试后效被纳入效度研究范畴以来,语言测试效度论证框架都把后效研究作为一项重要任务(如Bachman & Palmer 2010;Chalhoub-Deville & O’Sullivan 2020;Weir 2005)。


Chapelle et al.(2015)提出基于论证的诊断性语言测评效度论证框架,指导研究者全面、系统地采集和整合效度证据。其中,诊断测评后效研究关注“使用”(utilization)和“后果”(ramification/impact)两个推论。“使用”推论的理据是“该系统所提供的学术写作质量的诊断有助于学习者改进自己的写作”。该推论提出4项假设,论证反馈信息意义的清晰程度、学生使用系统的意愿、反馈信息的运用等。“后果”推论的理据是“该系统的使用有益于学生的学习”。该推论提出7项假设,论证学生对系统的评价和反馈信息的各种用途(如弥补教师评价的不足、提供学习机会、了解自己的强项和弱项、培养自主学习能力)。为探索诊断测评在教学中的应用和产生的后效,本文将从“使用”和“后果”两个维度,构建基于诊断性语言测评的评教互动研究框架。


2.2 诊断性语言测评的促学机制

诊断测评是典型的促学评价,诊断测评的促学功能是其最重要的后效证据。近年来,测评领域积极探索和倡导学习导向型评价(learning-oriented assessment, LOA)。Jones & Saville(2016)从大规模考试与课堂评价互补的视角提出多种测评方式的有机融合;Gebril(2021)从理论和实践两个方面探讨了LOA的理念、挑战和发展方向。Turner & Purpura(2016)提出一个LOA工作框架,系统地阐述了LOA涉及的一系列互相关联的因素。


根据LOA工作框架,诸多因素与促学评价密切相关,它们相互作用,共同发挥评价的促学功能。这七大类因素是:1)环境因素,包括社会、政治等宏观环境因素和教师的教学经验或策略等微观环境因素;2)测试方式,包括课堂内有计划或即兴的测评活动和课外的各类考试;3)二语能力理论,是促学评价的重要理论基石,决定了测评目标、测评结果的解释和反馈;4)学习因素,如学习和认知理论、反馈和自我管理等;5)教学因素,如教师的二语知识、教学模式或方法等;6)课堂互动,指教师与学生或学生与学生之间在课堂上的各种互动性活动;7)情感因素,如观点、态度、信念、动机等,这些因素影响教师和学生的评价活动参与度和促学效果。


Chapelle et al.(2015)的效度论证框架关注诊断测评对教学产生的后效,对“使用”和“后果”这两个推论作了细致的解析,提出了诸多需要论证的假设。但是,这些假设都是针对特定的诊断测评系统(如该研究所论证的学术写作诊断测评系统)提出的具体研究问题,而且这些假设之间缺乏逻辑关联。为了更系统地分析影响诊断测评后效的主要因素,更好地理解诊断测评的促学机制,指导诊断测评的应用研究,我们觉得有必要参考LOA工作框架,聚焦促学评价的七大类影响因素,构建诊断测评在教学中的应用研究框架。


2.3 基于诊断性语言测评的评教互动研究框架

诊断测评在教学中的应用研究涉及测评和教学两个子系统,诊断测评的考核目标和设计需要与教学保持高度一致,测评的实施应有机地融入教学过程,与教学形成互动关系,这样才能确保诊断测评发挥促学作用。测评系统重点关注促学评价的各方面影响因素,教学系统的关注点是补救性教学和学生自主学习。诊断测评应用研究的主体是教师、学生和教学管理者,他们的测评素养和参与度等直接影响测评的应用效果。基于诊断性语言测评的评教互动研究框架如图1所示。


在图1中,整个框架表示由测评子系统和教学子系统组成的评教互动研究系统,左栏表示测评子系统,右栏是教学子系统。诊断测评应用研究的问题是诊断测评是否有助于师生作出改进教学的决策(“使用”推论)以及这些决策是否产生了有益的后果(“后果”推论)。具体来看,诊断测评的应用研究需要从环境因素、二语能力理论、测试方式、学习因素、教学因素、课堂互动、情感因素等方面探索测评与教学之间的互动,从而全面理解诊断测评的促学作用。我们以下面的15个问题为例,进一步阐释基于诊断性语言测评的评教互动研究框架。



1)诊断测评的测试目标与语言教学目标是否一致?

2)诊断测评能否有机地融入现有的语言课程体系?

3)诊断测评的应用是否有助于推动学习共同体的构建?

4)诊断测评的应用需要参加者具有什么样的测评素养?

5)诊断测评的构念界定是否基于二语能力理论?

6)诊断测评的任务设计是否有助于学生展示其二语能力?

7)诊断测评的反馈信息能否弥补教师评价的不足?

8)诊断测评的应用是否有助于提高学生的自主学习能力?

9)诊断测评的应用是否有助于教师开展有效的补救性教学?

10)补救性教学能否有效提升教学效果和学生的学习成绩?

11)基于诊断测评的课堂互动是否有助于促进学习?

12)教师和学生是否具有使用诊断测评来改进教学的意愿?

13)诊断测评的应用是否有助于提升教师的教学自信心?

14)诊断测评的应用过程中教师和学生的参与度如何?

15)诊断测评是否有助于提升学生对测评的信任感?


问题1至4从教学目标、课程体系、学习共同体、测评素养等方面探索环境因素对诊断测评促学作用的影响。当然,环境因素丰富多样,如教学管理者对诊断测评的态度、课时和课型安排、教学资源等,这些都需要在诊断测评应用研究中予以考虑。问题5从二语能力理论的角度看诊断测评的构念定义;问题6探索测试方式对测评效果的影响;问题7和8从反馈信息和自主学习能力分析诊断测评的促学作用;问题9和10探索补救性教学的设计和实施;问题11从课堂互动看诊断测评的促学作用;问题12至15列举了与评教互动相关的情感因素,如测评意愿、教学自信心、测评参与度和信任感等。


需要强调的是,这些研究问题仅仅是举例,而且为使研究框架具有普适性,这些问题是宽泛的,在进行研究设计时,研究者应根据诊断测评的具体目的、测评工具的设计和教学环境等,提出更有针对性的具体问题。例如,在采集诊断测评反馈信息的相关证据时,需要了解诊断系统所提供的各方面反馈信息的使用情况(如听、说、读、写等不同技能的反馈和文字或图表等不同方式的反馈)。此外,评教互动研究还需考虑这些因素对教学和学习产生的交互影响,从教学环境、测试方式、教师和学生参与度等多维视角,全面、细致地分析基于诊断测评的评教互动过程和促学效果。


3 案例分析:以优诊学(高校版)为例

3.1 教学应用概况

优诊学(高校版)是在我国高等教育环境下开发的大学生英语能力诊断系统。相较于其他诊断性语言测评(如Dialang)或自动评分和反馈系统(如Criterion®),优诊学有以下几个方面的特点。第一,该诊断系统的使用者不仅仅是学生,还包括运用诊断测评改进教学的教师;第二,该系统提供的诊断报告既有针对学习者个体的反馈,也包括对整个班级群体的反馈,为教师的教学决策提供指导;第三,该系统既可用于课堂评价,也可以为课后的学生自主学习提供诊断;第四,该系统在诊断反馈的基础上推荐多样化的学习或教学资源,使教师和学生在开展补救性教学时有更多的选择。


截止到2022年9月,共有30个省、市、自治区中273所高校的逾10万名学生和500位教师在教学过程中使用了优诊学(高校版)诊断系统。外研社研发中心于2020年5月至12月开展了用户反馈调查,向试用院校发放调查问卷,收到有效教师问卷68份和学生问卷594份。调查结果表明,教师对系统的整体满意度为8.57(总分为10),学生为7.35;96%的教师愿意继续使用该系统,73%的学生愿意把优诊学推荐给其他同学;74%的教师认为诊断结果与自己对学生的了解一致;67%的学生认为诊断测评反映了自己的真实水平;85%的教师和83%的学生表示会利用诊断结果规划自己的英语教学或学习;74%的教师表示还会在科研中运用该诊断系统。在调查问卷的开放题中,教师表示希望能得到诊断测评用于教学和科研方面的更多支持,如课题申请、课例分享、专家讲座;学生则最希望在针对性练习和微技能讲解、学习策略指导方面得到后续支持。


3.2 教学应用研究

诊断测评应用研究的重点是测评与教学之间的互动关系。外研社研发中心通过课题形式招募了研究团队,开展诊断测评在教学中的应用研究。根据研发中心提供的数据,按照本文提出的基于诊断性语言测评的评教互动研究框架(见图1),我们对已完成或立项的课题进行了汇总(见表1)。



表1对研究主题的归类依据每项研究申请报告中最核心的研究问题。有些研究涉及不同的主题,因此归类不一定精准。从汇总的数据可以看出,优诊学教学应用研究内容丰富,涵盖了诊断测评对测评素养提升的作用、诊断反馈的设计和有效性、诊断测评对自主学习能力培养的影响以及基于诊断测评的听、说、读、写、语法和词汇等补救性教学模式探索。但是,以下几个方面的评教互动研究仍相对匮乏:环境因素对评教互动的影响(如基于诊断测评的学习共同体构建)、基于诊断测评的课堂互动所发挥的促学作用、情感因素(如教师和学生的评价参与意愿和信任度)对评教互动的影响。


3.3 研究案例分析

为更好地阐释基于诊断测评的评教互动研究,我们选取两项已发表的研究作为案例进行分析。案例1主要围绕互动框架中的课堂互动维度,聚焦优诊学阅读测试的反馈信息,通过两个阶段的研究,采用有声思维(8名学生)、学生问卷(n=487)、师生访谈(5位教师;12名学生)和追踪实验(2位教师;8名学生)等方法(见图2),探索了诊断测评对改进教学的有用性(孙杭 2020)。研究发现,师生普遍认为优诊学阅读测试的反馈清晰、准确且相关,并愿意根据反馈报告调整教学和学习计划。学生在课外阅读时,有意识地关注自己阅读能力薄弱的方面,并尝试使用诊断报告中的建议来提升阅读能力。这表明诊断测评可以在及时性、个性化方面对教师课堂评价形成补充。研究还发现,教师认为诊断反馈对其教学决策和教学实施都有指导作用。教师会在课堂讲解和课后作业中针对学生的阅读能力弱项进行强化训练,如利用思维导图引导学生掌握语篇逻辑,在课堂教学中增加快速阅读的教学内容,通过概要写作加强学生归纳主旨大意的能力等。这些结果说明诊断测评为教师教学重点的调整、教学内容的安排、教学活动的设计等提供了依据。



案例2主要体现互动框架中的环境因素、教学因素以及两者之间的相互作用。该研究从三个方面探索了补救性教学中的评教互动关系(Fan et al. 2021)。第一,如何将基于诊断测评的补救性教学融入现有的课程体系?第二,学生对于补救性教学的理解和看法是什么?第三,补救性教学能否提高学生的阅读能力?研究对象是某高校在校研究生(n=83)。研究分为能力诊断、沟通反馈、教学补救和效果检验四个步骤(见图3)。首先,确定诊断测评工具。教师通过对课程要求、学生水平和现有阅读诊断测评等环境因素的分析,确定采用优诊学阅读测试。其次,沟通反馈报告和研究计划。教师指导学生读懂诊断反馈报告,使他们了解自己的阅读强项和弱项;同时向学生详细介绍基于诊断测评的阅读教学计划,使学生有准备地参与实验。再次,实施为期三个月的补救性教学。教师基于诊断结果,将学生分为三个小组,采用小组合作方式开展课堂阅读教学并为各组分配不同的学习任务,课下分别以个人自学、合作学习和教师指导下的学习三种方式安排学习。最后,教师和学生对诊断测评的适用性和补救性教学的效果进行反思。研究发现,在教师的引导下,基于优诊学阅读测试的补救性教学能够有机地融入现有的课程体系。教师通过诊断测评和测评报告的解读,帮助学生提高对诊断测评和补救性教学的认识,也提升了小组合作式的补救性阅读教学的效果。该研究展示了环境因素(如教师测评素养、课程要求、学生水平)和教学因素(补救性教学设计和实施)对诊断测评促学效果的影响,体现了测评、反馈和教学之间的相互作用,为诊断测评的教学应用提供了范例。



总之,优诊学的教学应用研究应结合我国大学英语课程设置、教师测评素养等环境因素,分析诊断工具的适用性,探索基于反馈信息的补救性教学在学习者个体和群体层面的促学作用。教学应用研究需要特别关注诊断测评与补救性教学方案设计和实施之间的互动关系,跟踪互动的每个环节和整个过程,并分析教师和学生的态度、观点、信念等情感因素对评教互动产生的影响。


4 思考与讨论

4.1 评教互动面临的挑战

从评教互动研究框架可以看出,发挥诊断测评的促学作用需要兼顾诸多因素以及它们之间的交互作用,颇具挑战。

 

第一,从环境因素来看,教师和学生如果缺乏必要的测评素养则无法有效运用诊断测评。而且,教师和学生在诊断测评中角色不同,所需的测评素养也不同。教师是测评实施者和教学指导者,需要运用诊断反馈改进教学,同时帮助学生利用诊断反馈改进学习;学生是学习的主体,需要正确认识诊断测评的作用,准确解读诊断反馈报告,并在教师的指导下积极参与补救性教学。

 

第二,对二语能力理论的理解和运用是评教互动的关键,也是难点所在。由于诊断性语言测评较多停留在外显且可观测的语言微技能,因此,诊断结果并不能直接反映造成学生某方面能力薄弱的深层次原因。例如,学生在“理解语篇的逻辑关系”这一阅读微技能上表现较差,原因可能是缺乏必要的阅读策略,也可能是缺乏相关的背景知识或语法和词汇知识。因此,补救性教学需要解决的问题并非显而易见,简单地重复训练也并非真正的补救性教学。

 

第三,从测评设计来看,诊断测评对语言能力的解析容易导致教学中只见树木不见森林。为了提供细致的反馈信息,诊断测评把语言能力尽可能地细化和分解,但是语言交际的本质是综合运用各种知识、技能和策略,那么如何避免过于离散的技能训练或知识学习给学生语言综合运用能力带来的负面影响?因此,评教互动研究需要关注语言综合运用能力与语言分技能或微技能的关系。

 

第四,从学习和教学的相关影响因素来看,评教互动研究的重点和难点是设计和实施基于诊断测评的补救性教学,并跟踪调查补救性教学对学习过程和学习效果产生的影响。教师需根据诊断提供的反馈信息,结合二语能力发展理论和教学环境因素,分析造成学生某方面能力欠缺的根本原因,设计有针对性的、有意义的补救性教学任务,通过有效的课堂互动,实现诊断测评的促学功能。


第五,情感因素对评教互动的影响往往被忽略。语言学习是一个高度个性化的认知过程,学习者个体因素如参与诊断测评的意愿、对测评的信任感等会影响其对反馈信息的运用和补救性教学的有效性(Huhta 2008;Yin et al. 2012)。因此,诊断测评的教学应用研究要关注学习者个体,不能仅用群体性数据作为教学有效性的证据,而是要开展学习者个案分析和动态的追踪研究(Doe 2015)。

 

4.2 评教互动研究的发展方向

为应对评教互动面临的挑战,研究者应不断改进诊断测评工具,通过诊断任务设计和评价报告,为教学提供更有价值的反馈信息;同时,评教互动研究应致力于补救性教学理论和实践的探索,这是实现诊断测评促学目标的最根本保障。

 

在教育领域,认知诊断理论被用于描述学习进程(learning progression)和学习轨迹(learning path),并已取得丰硕的成果(如Leighton & Gierl 2007;Wu et al. 2021)。认知诊断重视测试内在的知识结构和学生答题的认知过程,更有利于探测学生的强项和弱项,提高测试的内容效度和反馈信息的质量。语言测试领域也在不断探索认知诊断测评的应用(Lee & Sawaki 2009),但较多研究从非诊断性语言测试中提取认知诊断信息,提供的反馈信息价值有限。因此,语言测试研究应更全面地定义语言能力的认知属性,开发真正意义上的认知诊断测评,描述学习进程和发展轨迹,为教学提供更深层、细致且丰富的反馈。优诊学及其教学应用研究在以上方面已进行了一定探索,但还需从学习者的认知策略运用等方面继续深入研究,更全面地描述学生的语言学习进程和语言能力发展轨迹。

 

从学习角度来看,随着大数据分析和挖掘技术的发展,学习分析(Learning Analytics)成为一个新兴的交叉学科领域。该领域专注于各种数据分析方法和教育大数据挖掘,并将其应用于不同的教育环境,为个性化学习提供了更广阔的前景(Scheffel et al. 2021;Shum 2012)。测评只是诊断数据采集的一种方法。采集学习者在各种环境下的语言学习和使用信息能为我们提供更丰富的、潜在的诊断数据。多样化的大数据分析为我们描述学习者的语言能力、诊断学习者的困难和预测学习者的发展轨迹提供了更有力的手段。从教学角度来看,补救性教学研究需要探索如何设计更有针对性的教学方案,并根据学习者的语言学习进程和语言能力发展轨迹,不断调整教学计划、设计教学任务、开发教学资源,选择合适的时机和节奏实施补救性教学。另外,补救性教学的有效性研究主要采用质性研究方法,如访谈、观察法、内省法、反思日志等,以及量化研究方法,如问卷调查,数据分析和阐释带有一定主观性,所以应尽可能采集多维度、多种类的证据以实现交叉验证。

 

随着教育技术在我国外语教学中的推广和应用,诊断测评的应用研究还可尝试与在线教学更紧密结合的评教互动新模式。近年来诊断测评领域一个重要的发展方向是计算机自适应性的认知诊断测评(McGlohen & Chang 2008)。随着人工智能技术的飞速发展,人工智能驱动的自适应认知诊断测评将进一步提升测评的效度和效率,更有力地推动诊断测评在外语教学中的应用。


5 结语

戴家干(2009:177)指出,“传统的考试制度过于强调甄别与选拔功能,而忽视了改进与激励功能;注重学习成绩而忽视了学生的全面发展;注重整齐划一而忽视了个体差异;关注教学结果而忽视了教育过程”。优诊学(高校版)是基于认知诊断理论开发的语言测评系统,研究者在系统开发阶段已经关注了测评系统的评价功能,但是要真正发挥诊断测评的促学作用,还需要进一步探索诊断测评在教学中的应用及产生的后效。本文提出了我国外语教育环境下基于诊断测评的评教互动研究框架,并通过优诊学(高校版)的应用与研究案例分析,进一步阐释了诊断测评作为促学性评价的独特性、影响因素和关键问题。评教互动框架以测评和教学两个子系统的互动与对接为出发点,从后效研究和促学机制两方面进行梳理,既为诊断测评的后效研究真正融于教学提供了新的视角,也有益于教学人员恰当理解和运用促学评价开展相关研究。我们期待诊断测评的应用研究能够在评教互动框架指导下产出更丰硕的成果,更充分地发挥诊断测评的促学作用。


本文发表于《外语教育研究前沿》2023年第1期第37—44页。由于篇幅等因素所限,注释和参考文献部分已省略。



作者简介


金艳,上海交通大学外国语学院教授、博士生导师。主要研究领域:外语测评。

余国兴,英国布里斯托大学教育学院教授。主要研究领域:语言教育与测评。



【提示】在线阅读与下载


1)在期刊官网

(http://www.celea.org.cn/class/25)阅读本期刊讯;

2)在CNKI下载论文全文:https://kns.cnki.net/kcms2/article/abstract?v=T45yAwLMHzgGAUbjHG-y8RI_JArjBaO8Jtw1YzwyFZZiHidRWw1bZp5z751HDSKRqXpXAAao1qNXYYdhVNf8l1Kb9MKBYZ-MqJQONwRHd53IKdzeFBdQRw==&uniplatform=NZKPT



相关阅读


期刊好文 | 外语课堂教学创新研究的分类与论文撰写(文/文秋芳)

期刊好文 | 外语课堂教学创新研究:从教学研究到论文的转化(文/邱琳)

期刊好文 | 外语课堂教学创新研究评析:以英语演讲为例(文/孙旻)

期刊好文 | 外语学科的国别与区域研究:概念、内涵、定位与内容(文/郭英剑)

期刊好文 | 高校日语与区域国别的学科融合发展路径思考(文/武萌、周异夫)

《外语教育研究前沿》2022—2023年重点选题方向

刊讯 | 《外语教育研究前沿》2023年第1期目录及提要

刊讯 | 《外语教育研究前沿》2022年总目次

《外语教育研究前沿》2022年度期刊好文汇总

《外语教育研究前沿》诚征投稿


【声明】感谢《外语教育研究前沿》编辑部授权iResearch发布此文。本文版权归《外语教育研究前沿》编辑部及作者所有。其他任何学术平台若有转载需要,可致电010-88819493或发送邮件至research@fltrp.com,我们将帮您协商授权事宜,请勿擅自转载。


点击“阅读原文”在知网下载全文~

继续滑动看下一个
外研社外语学术科研
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存