韩宝成 梁海英:我国基础教育外语考试存在的问题
欢迎关注我们,一站式分享海量语言学术资源
来源编辑:外语与外语教学公众号
敬请星标应用语言学研习,喜欢请点赞,分享请转发⭐
新文推送
大连外国语大学校园实景
摄影:王 玮
我国基础教育外语考试存在的问题
文献引用格式:
韩宝成 & 梁海英.(2021).我国基础教育外语考试存在的问题. 外语与外语教学(01),38-45+145-146. doi:10.13458/j.cnki.flatt.004742.
作者简介:
韩宝成,教授,博士,博士生导师,研究方向:语言测试,外语教育;
梁海英,副教授,博士,硕士生导师,研究方向:功能语言学,语篇分析,外语教育。通讯作者邮箱:lhy8313@163.com;
摘 要:
本文基于9份中考和6份高考英语试卷的结构特征,依据Bachman和Palmer的语言测试有用性框架,分析了这两项试卷存在的问题。研究发现:中、高考英语考试的设计依然属于传统测试模式,将语言能力等同于语言知识加语言技能,测量目标侧重低阶思维能力,考试任务设计不尽合理。建议从语言实际运用的特点出发,进一步完善中高考英语考试设计,采用测试使用论证框架对这两项考试的开发和使用进行严格论证,以保证考试的科学性。同时,从外语教育学的视角,我们应提升外语教师和考试开发者的测评素养。
1.引言
根据《2019年全国教育事业发展统计公报》,我国小学在校生10561.24万人,初中在校生4827.14万人,高中在校生3994.90万人,普通高校在学总规模4002万人。基础教育阶段在校学生规模是高等教育人数的五倍。在中小学和大学阶段,外语均为必修课程,从外语学习与发展的规律、时间投入以及教育经济学的角度来讲,基础教育阶段外语教育的重要性无疑高于高等外语教育。但是,纵观我国的学术期刊,有关基础外语教育教学的研究成果远远少于高等外语教育教学。造成这种现象的原因可能主要来自三个方面:一是从事外语教育研究的人员主要集中在高校,对高校外语教育教学的情况更加关心和了解,收集数据和资料更为便利;二是高校外语教师的研究水平远远高于中小学教师,中小学教师以教学为主,开展研究相对困难,在高水平学术期刊上发表成果更加困难;三是大多数研究者看不到我国外语教育教学中的问题,多在追随国际二语习得及外语教学研究前沿动态和热点,而国外外语教学及二语习得研究的对象多为已成年的国际学生和移民,主要解决其融入当地学习环境和社会的问题,其面向中小学的外语教育与我们的外语教育在教育目标、课程设置等方面也存在一定差异。
从外语教育的学科体系来看(王文斌李民,2017;李民王文斌,2018),基础教育阶段的外语教育研究是我国整体外语教育研究的有机组成部分,涉及外语课程的性质与定位、课程目标、教材编写、教学方法、测试与评价、教师发展等多个方面,对每个方面开展研究十分必要和重要。但是,从现实情况来看,我国基础教育阶段的外语教学存在十分严重的应试现象,教学围绕考试转,“谁也阻拦不了”(王初明,2015:27),直接影响了外语教育教学的质量。可以说这个阶段的两大考试———中考和高考外语考试左右了我国的基础外语教育。这里既有制度和文化层面的原因,也有“技术”层面的原因。为此,本文选择从中考和高考英语考试设计入手,从语言测试理论及外语教育学视角对其存在的问题进行分析,并就如何完善这两项“大考”提出初步的建议。
2.中考和高考英语试卷结构
中考英语是初中英语学业水平考试的简称,考试结果既是衡量学生能否达到初中毕业标准的主要依据,也是高中阶段学校招生的重要依据之一。考试内容与要求主要依据《义务教育英语课程标准(2011版)》五级目标要求,注重考查学生的英语基础知识和基本技能。有的省份中考实行统一考试,绝大部分省份由考生所在市单独命题。
高考英语是全国普通高等学校招生统一考试(英语)的简称,考试结果用于高等学校人才选拔。《普通高等学校招生全国统一考试大纲》(英语)(以下简称英语《考试大纲》)规定了考试内容与形式,是高考命题的规范性文件和标准。英语《考试大纲》依据普通高等学校对新生思想道德素质、科学文化素质的要求及《普通高中英语课程标准》制定。2019年英语《考试大纲》规定的考核目标与要求涵盖两大部分:一、语言知识,包括语音、词汇、语法基础知识以及所学功能意念和话题;二、语言运用,包括听力、阅读、写作和口语。高考英语为全国统一考试,除全国卷之外,部分省市自主命题。
要客观分析当前我国中高考英语考试存在的问题,首先要了解中高考英语考试的设计。以2018年某省9市中考英语试卷结构为例(见表1):
表1显示,该省9市的中考英语试卷由I卷选择题和II卷非选择题构成,题型分别有7-11种,题目数量分别为71-111,总分分别为100-150。I卷选择题的数量普遍高于II卷非选择题的数量,近一半I卷选择题的数量高于II卷非选择题数量的一倍。I卷选择题分值平均占比57.1%,II卷非选择题平均占比42.9%。
从该省9市的中考英语试卷结构来看,其考核内容为语言知识和语言技能。其中语言知识平均占比32.1%(含单项选择、完形填空、单词拼写、动词填空、词形转换、综合填空、改写句子、完成句子、翻译句子)。在语言技能中领会性技能平均占比49.2%,包括听力理解平均占比16.9%、阅读理解平均占比32.3%(含阅读表达、补全对话);产出性技能主要为书面表达,平均占比13.6%,口语表达仅F、I市进行了考查,主要为短文朗读,平均占其试卷3.7%。在字词句层面对语言知识进行考查的题目平均占6市中考英语试卷的15.3%。
再来看高考英语考试的试卷结构。以2019年全国及各省市自主命题的高考英语试卷结构为例(见表2,以A-F卷代指全国及自主命题省市试卷):
表2显示,2019年高考英语全国及自主命题省市试卷也是由I卷选择题和II卷非选择题构成,题型分别有6-8种,题目数量分别为67-81,总分分别为120-150分。I卷平均占比65.1%,II卷平均占比34.9%。
表2表明,高考英语试卷的结构遵从英语《考试大纲》规定的考核目标与要求,对语言知识和语言技能进行测量。其中,语言知识占比31.2%(含单项选择、完形填空、综合填空、语法填空、短文改错、翻译句子)。在语言技能中领会性技能平均占比43.3%,其中听力理解平均占比17.2%,阅读理解平均占比26.1%(含阅读表达)。产出性技能主要为书面表达,平均占比21.2%,仅D卷考查了口语表达,占该试卷的6.7%。B、F卷在字词句层面对语言知识的考查平均占比11.3%。
从考试总体结构来看,中考和高考英语考试的第I卷均为选择题,第II卷均为非选择题,这种编排显然是为了考试机构方便阅卷,而非从考生和考试构念本身出发,合理测试学生的英语水平,尤其是在第I卷和第II卷中,分属语言水平不同维度的题目被笼统地排列在一起,缺乏科学性。总体来看,中考和高考英语的考试设计均采用语言知识+语言技能的模式,题型设计和测量目标直接具化了这两项考试大纲中的考核目标和要求,即按照语言知识和技能分别设计相应题型进行测量。在这两项考试中,中考英语的题型数量和题目数量均高于高考英语;考查语言知识的题型多于语言技能的题型,其分值均占总分30%以上。
3.中考和高考英语考试存在的问题
中高考英语考试均为高利害选拔性考试,对教学有着很强的“反拨”作用,已成为中学英语教学的“指挥棒”。教师为考而教,学生为考而学,投入时间长,但学习绩效偏低,不合理的考试设计难辞其咎(王初明,2015)。中高考英语考试存在哪些问题,需要采用合理的框架对其进行分析与评判。Bachman和Palmer(1996)提出的语言测试有用性(Test Usefulness)框架,用来指导语言测试的开发与使用,是评价考试质量最有影响的框架之一。它由六个质量属性构成:信度、构念效度、真实性、互动性、影响力和可行性。Bachman和Palmer(1996)认为这六个属性共同构成测试的有用性,提出评估一项测试时要认识到各质量属性之间的互补性,从中求得平衡,而非牺牲某些质量属性追求某一特定属性,也可根据不同情况有所侧重,以达到该测试整体上的有用性。本文以该框架为基础,结合中考和高考英语试卷的结构特征,分析其存在的问题。
问题1:以牺牲测试其他质量属性来保证信度。信度是指测试结果的稳定性和一致性,即测试结果不因考试形式、阅卷教师、时间等因素的变化而变化。中高考英语考试属于“标准化”考试,主要特点是大量使用选择性客观试题,中考英语试卷的选择题数目从40到90不等,占试卷比例的57.1%(见表1),高考英语试卷的选择题数目从50到70不等,占比达到了65.1%(见表2),还包括大量非选择类客观题。由于整份试卷包含选择题在内的客观试题足够多,加之命题人员主要为一线英语教师,熟悉考生群体及其英语学习特点,对试题难易度和区分度把握比较到位,容易满足考试的信度要求。但需要指出的是,选择题,尤其是在各类商业性考试中普遍采用的多项选择题自上世纪80年代引进我国后,广泛应用于各类外语教育考试。其优势在于可机器阅卷,效率高,成本低,其最大弊端是无法直接考查学生实际运用英语的能力。大量使用选择题某种程度上保证了测试结果的稳定性,却牺牲了效度、真实性等其他质量属性,也影响到交互性。为了有针对性地进行考试训练,提高成绩,学生花大量时间去做选择题,而非通过真实的运用学习英语,这不仅造成高分低能现象,也影响了学生学习英语的兴趣。
问题2:测试构念依然属于传统语言能力模型,构念效度低。构念效度是指在多大程度上对测试分数的解释是有意义的、恰当的。评价一项外语考试的构念效度关键看其如何界定语言能力。语言测试的发展大致经历了四个阶段,包括前科学时期、心理测量-结构主义时期、心理语言学-社会语言学时期和交际语言测试时期。后三个阶段分别形成了三种语言测试模式:心理测量-结构主义模式、心理语言学-社会语言学模式和交际语言测试模式,这三种模式对语言能力的界定有所不同(Heaton,1991:15-20)。中考和高考英语考试大纲基于相应的英语课程标准,但大纲本身并未明确界定考试的构念,即英语语言能力。仔细研究其测量目标、试卷结构以及题型会发现,这两项考试的设计属于第二代心理测量—结构主义语言测试模式,把语言能力等同于语言知识+语言技能的组合,对语言知识和技能分别测量,而非考查真实情境下考生运用语言理解和表达意义的能力。中高考英语考试试卷结构显示,30%以上的题目都是直接考查语言知识(形式),题型包括单项选择、完形填空、语法填空、单词拼写、完成句子等。对语言技能的考查中领会性技能占比平均为49.2%和43.3%,包括听力理解和阅读理解;产出性技能占比较小,其中书面表达分别占比为13.6%和21.2%,即使有口语表达考试项目,占比均不到10%,一般通过短文朗读、看图说话或听对话回答问题的方式进行考查。这些题型没有体现语言运用的实际特征,即使作为练习活动也远远落后于现代语言教学理念的发展。因此,基于考试分数很难准确恰当地推断出考生在非测试环境下实际运用英语的能力,导致考试构念效度不高。
问题3:测试任务真实性差。真实性是指语言测试任务特征在多大程度上与目标语言使用任务特征相吻合,即测试任务和材料与实际语言使用任务的一致性。Bachman和Palmer(1996:23-24)认为,真实性会影响测试的构念效度,测试任务的真实性不够,就很难基于考试分数对考生在非测试环境下实际运用语言的能力做出正确推断。虽然中高考英语考试中的某些题型也标识为语言运用,但并非真正意义上的语言运用。Bachman和Palmer(2010:34-35)指出,语言运用是个体在具体情境中对话语意义的理解与表达,或在某一特定情境中两人或多人对意义的动态协商,前者为非往复型(non-reciprocal)语言运用(如看书、听讲座),后者为往复型(reciprocal)语言运用(如交谈、辩论)。传统上人们往往把听说读写四项技能视为语言运用。Bachman和Palmer(2010:57)认为这种观点忽视了语言运用的多样性,尤其忽视了语言运用总会涉及具体的交际对象、目的和情境等因素,建议把听说读写视为具体情境中的语言运用活动。其实,除了单独的听、说、读、写活动之外,还有综合性的口头或书面活动,如听说结合、听读结合、读写结合、听读写结合以及听读说结合的综合性活动。中高考英语考试,尤其是中考英语考试的大多数题型多属于分离式测试任务,每题只测一个语言知识点或一项语言技能,与真实的语言使用相去甚远,真实性很差。
问题4:测试任务与考生的互动性低。这里的互动性不是指人际间的交互关系,而是指测试任务在多大程度上激发了考生的个体特质,包括考生的语言能力(语言知识和策略能力)、话题知识、认知能力、情感图式等。互动性主要涉及测试任务与考生之间的关系,测试任务的设计应在最大程度上调动学生拥有的各类知识、不同层次的认知策略和技能等以完成任务。从这个角度来讲,综合性测试任务的互动性高于非综合性测试任务,产出性测试任务的互动性高于理解性测试任务,脱离语篇、缺乏语境的碎片式测试题目的互动性更弱。由于中高考英语考试存在大量分离式、缺乏语境的题目,导致整个考试的互动性很低。单就完成某项任务所涉及到的认知能力而言,依据Anderson等(2001),认知能力从低到高分为记忆、理解、运用、分析、评价和创造六个水平。设计测试任务时应尽可能调动学生不同层级的认知能力,尤其是分析、评价和创造等高阶认知能力。现有考试考查记忆、理解等低阶思维能力的题目偏多,而考查分析、评价和创造等高阶思维能力的题目偏少(程晓堂,2017),许多题目仍停留在考查学生对语言知识的记忆和理解,很难考查学生运用语言分析问题和解决问题的能力,不利于学生思维能力的发展。就书面表达能力的题目而言,大部分题目为根据要点提示撰写80-100词短文,有些中考题目或过于简单(E市:“My Best Friend and I”),或规定性太强(A市:“走进新时代,争做合格中学生”),或看图写作的语类指令不明。高考英语书面表达除了篇幅稍长外(60-150词),亦存在类似问题。程晓堂(2017:11)指出,“当前高考英语书面表达试题限制太多,或者已经提供所写内容,考生只需将所给内容翻译成英语或用英语来描述已经给出的内容。这些作文题目的设计都不能很好地体现学生真实的语言表达能力。”同时,将书面表达的篇幅限制在100词左右根本无法发挥学生的创造力、想象力和语言表达能力,人为降低了考试的效度(王初明,2015),也削弱了考试的互动性。
问题5:对教学产生不利的影响。影响力是指考试宏观上对社会、教育制度产生的影响,微观上对个人,包括考生和教师的影响,或者说它对教学产生的反拨效应。中高考英语考试已然成为基础外语教学的指挥棒,由于其测试构念观仍停留在传统模式基础上,考试任务缺乏真实性、互动性低,给中小学英语教学带来了负面影响。在这个指挥棒的影响下,教师很难依据实际的语言使用开展教学活动,更多地是以提高考试分数为主开展各类碎片式的语言知识讲解活动(亓鲁霞,2007)。练习活动多与中高考英语考试题型挂钩,单项选择、语法填空、综合填空、完形填空、翻译句子等题型主要聚焦语言知识,且多为选择题、客观题,学生将大量时间投入到此类题型的训练中,而非直接开展整体性的听说读写活动,无法提升实际的语言运用能力。这种不够科学的考试设计在应试大潮的裹挟下,给基础教育阶段的外语教学带来了不利影响。
问题6:测试资源尚未得到很好的开发利用,可行性程度有待提高。可行性是指在测试设计、开发和使用过程中所需的资源和可用资源的关系。中高考英语考试属于我国教育制度的有机组成部分,由政府部门下属的事业单位组织实施,在物力、财力等资源方面能够得到充分保障。但在设计和开发过程中因其人力资源的专业能力所限,无法设计和开发更为科学的考试。考试改革往往更多的是从考务管理和考试形式出发,而非真正触及考试设计本身,尤其是对考试题型(任务)的完善。人们常说中高考英语考试属于大规模考试,大量采用选择题、客观题主要考虑的是阅卷效率和可靠性,主观题真实性和互动性强,可以很好地测量学生实际运用英语的能力,但对阅卷员水平要求高,不易做到。对于中高考英语考试而言,做到信度和效度的平衡确实不易。如何提高考试的正向反拨效用,消除应试教学的不良影响需要在改善考试设计上下功夫。外语教学的主要目标是培养学生运用外语理解和表达意义的能力。因此,中高考英语考试完全可以从听说读写作为单独的语言活动或听说读写相结合的综合语言活动出发考查学生的英语理解能力和表达能力(参见韩宝成张允,2015),合理确定语言理解能力和表达能力所占比例,在保留听力和阅读部分信度高的“客观题”的前提下,加大口语和写作分数权重,尤其加大写作的篇幅。这也符合中共中央、国务院印发《深化新时代教育评价改革总体方案》(2020)提出的“增强试题开放性,减少死记硬背和‘机械刷题’现象”的要求。一项重在考查语言运用能力的外语考试必将真正推动整个中小学外语水平的提高。这就把学生打钩画圈、挖空填词的功夫用到了听说读写上,教师把讲解语言知识点的功夫用到研究如何指导和科学评价学生的书面表达和口语表达上来,使学生通过运用掌握语言知识。教师队伍的素质提高了,口语和写作阅卷的困难也就迎刃而解了,考试的可行性也就提高了。
4.余论
以上我们采用Bachman和Palmer(1996)的语言测试有用性框架分析了中考和高考英语考试存在的问题。对于如何解决这些问题,考试机构,尤其是相关开发人员需要更新理念,并采用科学的方法开展研究,确保考试的有用性。Bachman(2003)及Bachman和Palmer(2010)提出的“测试使用论证”框架(Assessment Use Argument,简称AUA)是一个新的用于评价测试开发与使用全过程的逻辑机制和理论框架,它不仅为测试开发者提供了新视角,更为传统意义上的效度论证提供了可付诸实践的理论模式(韩宝成罗凯洲,2013),可用来指导中高考英语考试的改进与完善。AUA由后果、决策、解释、测评记录和考生作答表现五个紧密相连的环节组成,包括自上而下的测试开发和自下而上的测试使用两个视角。
从语言测试开发的视角看,AUA始于对测试“后果”的考量。首先考虑一项测试能为测试相关人员带来何种有益结果,即测试结果应对考生、教师等相关人员产生积极的反拨作用,能促进教学实践和语言学习;为了实现测试预期的有益后果,需做出相应的决策,主要涉及做出决策时应考虑国家现有的教育政策法规、社会价值观等,决策的做出是基于划界分数和决策规则,而非其他因素;然后需依据这些决策对语言能力进行界定和解释。对语言能力的解释应从某一语言理论或教学大纲来看是有意义的,对所有考生群体是不失偏颇的,是能够推广到测试以外的目标使用域的,对所做决策都是相关的、充分的;之后再确定从考试中获得何种信息,即测试记录(如得分、语言能力描述等);最后再决定从考生处获得何种测试作答表现来代表其目标语言能力。
从语言测试使用的视角看,首先看考生完成语言测试任务的作答表现,基于此获得相应的测试记录,这些记录能够反映对考生语言能力的解释。之后依据这些解释做出相应的决策,最后确定这些决策为测试相关人员带来了何种后果。
测试的开发和使用是一个持续不断的效度论证迭代过程,需对各个环节进行严密论证。高利害英语考试改革牵一发而动全身,会对整个外语教学乃至社会产生很大影响。正因如此,中高考英语考试改革可依据AUA框架进行严格论证,以保证和改善测试的科学性。
宏观而言,要解决中高考英语考试存在的问题,应鼓励测试研究者与考试机构、教研部门相互合作,形成专业化团队。从外语教育学科发展来讲,应注重提高一线外语教师的测评素养。教师语言测评素养提高了,才能科学开发和运用合适的评价方法,识别不恰当的测评方式,合理运用评价结果做出各种决策,促进外语教学质量的提高。
期刊介绍
《外语与外语教学》是大连外国语大学学报,南大“中文社会科学引文索引(CSSCI)”来源期刊、北大“中文核心期刊”、社科院“中国人文社会科学核心期刊”、全国高校百强社科期刊、人大“复印报刊资料”重要转载来源期刊。
根据期刊定位,常设栏目有:“专题”“语言研究”“外语教学研究”“二语习得及应用”“翻译研究”。其中“专题”栏目是编辑部组织并策划的具有学术前瞻性、引领性、突出中国本土问题研究的主题栏目。
《外语与外语教学》坚持内容质量为唯一标准,秉承科学、准确、实事求是的严谨态度,从不以作者单位、职称、地位、是否有高级别资助项目作为录用稿件的标准,刊发有学术水准、从国际前沿研究和本土需要和问题出发的有思想、有情怀、有品质的学术精品。
投稿网址:
wyywyjx.dlufl.edu.cn
-END-
综合编辑:应用语言学研习
微信公众平台审核:梁国杰
毛浩然教授:全程、全景、全心——高级别社科项目申请书的推敲修订10例
文献延伸阅读(研习人指引)
本平台友情整理相关文献索引链接
欢迎感兴趣的朋友按需选购
友情推荐
点击左下方阅读原文,发现更多语言学好书!
出版社直供包邮,扫码查看详情
扫码关注↑↑↑ 即可获取最新入群二维码!
目前已有 5.5 万语言文学、区域国别与
跨文化传播学研习者关注本公号
欢迎加入交流群,分享学习,共同进步!
亲爱的研习人,
一起来点赞、在看、分享三连吧!