专论 | 美国粤语水平考试评介
美国粤语口语水平考试评介
林柏松
提要:本文系统地介绍了目前美国国内所通行的粤语口语水平考试并对其特色和局限性加以评论。全文分四个部分:第一部分阐述了研究美国粤语口语水平考试的必要性;第二部分介绍了美国政府部门语言圆桌委员会和全美外国语教师协会关于语言水平的分级及分级标准;第三部分介绍了美国粤语水平考试的内容、形式及程序。第四部分对美国的粤语水平考试在理论和实践方面的一些问题提出了作者的看法。
关键词:粤语 语言测试 口语水平考试
(一) 导论
粤语有广义和狭义两个意义。广义的粤语,指的是汉语的一大方言,包括广府话,四邑话,广西南宁话等多种次方言。狭义的粤语,指的是粤语区所通行的粤语共同语。本文所说的粤语,指的是后一种,指的是以广州话和香港话为代表的粤语共同语。由于同时以广州话和香港话为代表,在发音方面,阴平调采用53或55两个调值,在词汇方面则接受广州和香港两地的不同说法。本文所谓的口语水平考试(Oral proficiency test),指的是以测定说话人的口语水平为目的的考试,它既不同于听力或阅读考试,同时也有别于以测定学员对某一课程的掌握程度为目的的课程考试(Achievement test),例如广州话会话课程期中考试或期末考试。
如何通过科学的考试方法来测定说话人的粤语口语水平?对于这个问题似乎至今尚未看到系统的研究报告,也没看到在美国以外的任何机构举办粤语口语水平考试。在中国国内,尽管普通话水平测试站遍及全国,中国至今尚没有专门进行粤语水平考试的机构。目前中国国内研究粤语的总趋势是对粤语本体的研究较多而对粤语应用方面的研究较少。一般的粤语研究者往往只把粤语看作是一种方言而注重于对粤语本体(语音、词汇、语法)的研究。其实,粤语除了本身是一种方言以外,同时还是一种习得语言(a learned language)。近数十年来,粤语凭借着港澳地区的政治影响以及粤语地区的经济实力而成为一种强势方言,海内外学习粤语的人为数不少。以美国而言,美国国内的大学开设粤语课程有着悠久的历史,著名的大学如耶鲁大学、哈佛大学和斯坦福大学均设有粤语课程。美国国防语言学院在上世纪七十年代曾设立粤语系,美国外交学院至今仍设置高级粤语课程。近数十年来,来自粤语区的移民数量急剧增加,美国很多华人社区都出现了一些以教授华裔子弟为目的的周末粤语中文学校。笔者所居住的旧金山湾区,不但有全日制大学和中学开设粤语课程,连政府资助的一些成人学校也开设粤语课程。粤语既然是一种习得语言,便存在着考核和评估的问题。即使是对于以粤语为母语的人,衡量其口语水平的高低也需要一个客观的尺度。因此,如何评估一个人的粤语口语水平是一个值得探讨的问题。在这一方面,美国反而比中国处于领先地位。特别是2011年“九一一”恐怖袭击事件发生以后,美国政府突然认识到外语教学与研究对国防的重要意义,大幅度增加了对外语教学的资助。随着对外语人才需求量的大量增加以及“汉语热”的进一步升温,美国国内参加粤语口语水平考试的人数也越来越多。我本人从2000年起成为美国联邦政府认可的粤语口语水平考试测试员,同时也是全美外语教师协会考试办公室认可的粤语口语水平考试测试员。根据我自己多年来作为粤语口语水平考试测试员的经验,我觉得粤语口语水平考试与粤语本体的研究有着密切的关系。如何根据粤语的特点设计粤语口语考试的题目,这是建立一个科学的粤语口语考试体系的关键。而对于粤语口语考试理论和实践的研究,也将加深对粤语本体特点的认识。“他山之石,可以攻玉。” 希望本文关于美国粤语口语水平考试的评介,对开发中国国内粤语水平考试的领域,促进普通话水平考试的研究和推广起到积极的作用。
(二) 粤语水平的分级
要讨论粤语口语水平考试,首先必须解决语言水平的分级问题。我们知道,口语水平考试不同于以测定学员对某一课程的掌握程度为目的的课程考试,不能简单地用一个分数来表示学习者的语言水平。那么,我们应该根据什么标准来评定一个人的口语水平呢?
说到口语水平的分级标准,人们很自然首先想到发音。发音是否准确,说话是否流利,当然是判定一个人口语水平的重要标准。在日常生活的一些场合,有时候我们可以听到一些外省人或外国人用蹩脚的发音来说粤语,我们很难听懂他们在说什么,他们的错误发音直接影响了语言的交际。另一方面,我们在日常生活中,也常常可以听到一些外省人或外国人,尽管他们的粤语发音并不地道,可是并不影响我们与他们之间的交际。反过来说,我们在美国也常常碰到一些母语为粤语的中国人,他们很小就从粤方言区移民来美国,其粤语发音尽管很标准,可是粤语词汇相当缺乏,满口英文,他们甚至无法与不懂英文的粤语区人民交际。由此可见,我们应该把发音放在语言交际这个框架来考察。这就是在口语水平考试中我们必须遵循的交际性(Communicative)原则。它不但适用于粤语口语水平考试,也适用于普通话口语水平考试,那种孤立地靠朗读一篇文章而判定其普通话口语水平的做法是不可取的。
说到口语水平的分级及分级标准,不能不提到美国两个权威的机构,一个是美国政府部门语言圆桌委员会(Interagency Language Roundtable, or ILR),另一个是全美外国语教师协会(American Council on the Teaching of Foreign Languages, or ACTFL)。这两个机构所制定的语言水平分级及分级标准大同小异,他们对全美以至全世界的语言水平考试都有重大影响。其中,美国政府部门语言圆桌委员会成立的历史最长,理论最为完备。其制定的从0+ 到5的六级语言标准,可以作为评定汉语水平分级的基础。这个六级语言标准,从语言交际功能出发,同时考虑发音、词汇、语法、语段、文化理解等因素,对说话人的语言交际能力作一个综合的评定。以下是美国政府部门语言圆桌委员会(ILR)对语言水平分级的简要描述 ( Language Skill Descriptions):
• Level 0: 毫无语言水平(No Proficiency)
• Level 0+: 死记硬背的语言水平(Memorized Proficiency)
• Level 1:初级的语言水平(Elementary Proficiency)
• Level 2:有限的工作水平(Limited Proficiency)
• Level 3:一般的专业工作水平(General Professional Proficiency)
• Level 4:高级的专业工作水平(Advanced Professional Proficiency)
• Level 5:相当于本族人水平(Functionally Native Proficiency)
上面从1到4这4个等级中,美国政府部门语言圆桌委员会还增加了一个“加等”(Plus Level)。例如,语言水平明显超过1级,比较接近2级但又未能达到2级的,就把它定为1+。这样,美国政府部门语言圆桌委员会就设定了10个等级:0+, 1, 1+, 2, 2+, 3, 3+, 4, 4+, 5。它们包括了任何一种语言的全部水平分级,包括口语、听力、阅读和写作水平的分级。
在语言水平等级的设定方面,全美外国语教师协会所采用的语言水平分级,与美国政府部门语言圆桌委员会的分级大同小异。由于全美外国语教师协会的服务对象主要是学习外语的美国人,因此其语言水平等级的设定在低等方面分得很细,在高等方面则分得较粗。而美国政府部门所采用的语言水平分级,其语言包括一切语言,考试对象既包括学习外语的美国人,也包括操母语的本族人(Native speakers),因此,其语言水平等级的设定不论是高、低等都是一致的。以下是这两种语言水平等级的对应关系:
全美外国语教师协会(ACTFL) | 美国政府部门语言圆桌委员会(ILR) |
初级(下)(Novice Low) |
0+ |
初级(中)(Novice Mid) | |
初级(上)(Novice High) | |
中级(下)(Intermediate Low) |
1 |
中级(中)(Intermediate Mid) | |
中级(上)(Intermediate High) | 1+ |
高级(下)(Advanced Low) | 2 |
高级(中)(Advanced Mid) | |
高级(上)(Advanced High) | 2+ |
超级(Superior) | 3, 3+ |
特级(Distinguished) | 4, 4+, 5 |
从理论上说,美国政府部门语言圆桌委员会的语言分级标准可以评定任何一种语言说话人的口语水平。可是,由于这个分级标准是以英语(含美语)为基础而制定的,一些标准很明显与汉语的实际情况不符合。例如,由于英语的虚拟语气必须用复杂的语法结构来表达,所以,六级语言标准把是否能熟练地运用假设作为三级语言水平的一个标志。可是汉语并不存在英语的动词形态变化,所以,能否熟练地运用假设显然不能作为汉语三级语言水平的一个标准。另一方面,助词在汉语中是表达语法意义的重要手段,可是在英语中并不存在,因此六级语言标准对此毫无提及。由此可见,必须把美国政府部门语言圆桌委员会的六级语言标准与某种语言的具体实际相结合,才能制定出某种语言的一套科学的口语水平考试标准。下面是我根据这个六级语言分级并结合粤语的实际而拟定的粤语口语水平分级,谨以此就教于各位研究粤语的专家学者。
粤语说话人的口语水平,与其它语言一样,同样可以分为从0+到5的六个基本等级,其标准拟规定如下:
0+级:这种水平的说话人实际上没有粤语交际能力,他们只能用粤语说片言只字。他们能用外地人的口音模仿说一些最简单的日常用语,包括日常问候语,时间用语,以及数字等,例如“早晨”,“你好”,“再见”,“唔该”,“多谢”,“恭喜发财”,“食饭未呀” ,“我识讲少少啦”,等等。
1级:这种水平的说话人只具有非常有限的粤语交际能力。他们所掌握的词汇量很小,只能用粤语进行简单的日常生活对话,能完成简单的语言交际任务,例如简单地介绍自己,在市场买东西,在餐馆点菜,向本地人问路,等等。他们能费力地说一些简单的句子,可是不能流利地说一大段连贯的话。他们的发音带有明显的外地人的口音。对外省人来说,他们发音的错误往往出在粤语的韵尾-p, -t, -k,-m和声母ng-上。对外国人来说,粤语的9个声调则是一个难点,因此他们说话带有明显的洋腔洋调。他们发音和语法上的错误常常造成与本地人沟通上的困难。由于词汇量小,他们亦往往无法听懂本地人所说的话。
2级:这种水平的说话人已经具有一般的粤语交际能力。他们能应付日常生活一般场合的对话,能说出一大段连贯的话,例如叙述过去发生的一件事,描述一个人的外表,告诉别人如何做一件事情,等等。发音方面虽然明显带有外地人的口音,可是已经不影响日常交际的进行。他们对粤语中丰富的语气词往往不能正确地使用,对粤语中的词汇、语法变调往往不能正确掌握。典型的例子是对“老陈”的称呼,不会使用变调,发成“老尘”,甚至“老趁”,让本地人觉得不舒服。对粤语词汇的掌握往往局限于日常生活中出现的具体词语,而缺乏抽象性的词语。对粤方言区人民的文化习俗缺乏深入的了解,以致有时不自觉地说出一些令本地人不快的话语。
3级:这种水平的说话人已经具备了相当于受过教育的本地人所具有的粤语交际能力。他们能流利地与本地人进行会话,而且能大段大段地发言。他们所掌握的粤语词汇已经使他们不但能应付日常生活各种场合的对话,而且能讨论他们感兴趣的抽象的题目,例如政治、经济、教育、文化等方面的话题。尽管他们仍然带有外地人的口音,可是与本地人交际已经没有什么障碍。他们能正确地运用粤语常用的各种语气词和词汇、语法变调,在发音、用词和语法结构方面不会发生大的错误。他们对粤语区的文化风俗已经有相当的理解,一般不会说出令本地人不快的话语来。
4级:这种水平的说话人具备了相当于受过良好教育的本地人所具有的粤语交际能力。他们可以与专业人士讨论高度抽象性的题目,并以大段大段的话语支持自己的观点。他们能根据听众的不同而选择适当的用词,对不同的人说不同的话,在不同的场合说不同的话。他们能在正式的场合下作冠冕堂皇的即席发言,又能与老朋友在聚会中作轻松的调侃。他们对粤语区的文化风俗有着深刻的理解,对粤语区流行的俗语,例如“上得山多遇着虎”,“鸡食放光虫-心知肚明”,“未学行先学走” ,“口水多过茶”等能理解并熟练地运用。如果不是在粤语区长大、受教育和长期在粤语区生活,很难达到这样高的口语水平。
5级:这种水平的说话人代表了最高级的粤语口语水平,相当于受过高等教育而又能言善辩的本族人的水平。他们发音标准,用词准确,不但能根据听众的不同而选择适当的用词,在不同的场合说不同的话,而且说起话来滔滔不绝,口若悬河,引经据典,成语、俗语、歇后语等信手拈来,毫不费力。他们对粤语区的文化风俗有着相当深刻的理解,可以与专业人士对各种各样抽象性的题目作深度的研讨。这种水平的说话人,即使在粤语区的本地人当中也并不多见。
上述从0+到5六个口语水平等级的划分,体现了对交际功能、发音、词汇、语法、语段和文化理解等多种因素的综合考量。根据这种综合考量的原则,在1-4级之间再细分出1+, 2+, 3+, 4+ 四个加等,由此组成了粤语口语水平的全部十个等级:0+, 1, 1+, 2, 2+, 3, 3+, 4, 4+, 5。
(三) 粤语水平考试的内容与形式
上述美国政府部门语言圆桌委员会对口语水平10个等级的划分,可以作为我们进行汉语口语水平考试的基础。根据这10个等级的划分标准,美国政府部门语言圆桌委员会为每个等级设定了相应的语言交际任务(Tasks)让考生来完成,从而判定考生是否达到该语言的某个等级。下面是美国政府部门语言圆桌委员会为六个基本语言等级所设定的语言交际任务:
水平等级 (Proficiency Levels) | 语言任务 (Language Tasks) |
Level 0+: 死记硬背的语言水平 (Memorized Proficiency) | 会说以下的片言只语: 数字;年、月、日;时间;家庭成员;天气;颜色等。 |
Level 1: 初级的语言水平 (Elementary Proficiency) | 能完成最基本生活需求的日常交际任务; 能进行最基本的日常情景会话; 会问问题。 |
Level 2: 有限的工作水平 (Limited Proficiency) | 会叙述过去发生的一件事; 会叙述现在一般常发生的事情; 会叙述将来的计划; 会描述(人物,地方,物件); 会说明一个程序的先后顺序或给问路人说方向; 会报告一段新闻; 会进行最基本的日常情景会话并有应变能力。 |
Level 3: 一般的专业工作水平 (General Professional Proficiency) | 会表达并支持自己的观点; 会进行假设; 会讨论抽象的题目; 会在情景会话中解决不常发生的问题。 |
Level 4: 高级的专业工作水平 (Advanced Professional Proficiency) | 会表达并支持自己的观点; 会进行假设; 会讨论高度抽象的题目; 会在正式和非正式场合下进行情景会话。 |
Level 5: 相当于本族人水平 (Functionally Native Proficiency) | 会表达并支持自己的观点; 会进行假设; 会讨论高度抽象的题目; 会在正式和非正式场合下进行情景会话; 会熟练地使用成语、俗语、歇后语等。 |
需要指出的是,语言交际任务(Task)与实际考试的题目(Topic)是两个不同的概念。每个考生要达到某个语言等级,都得考相同的语言任务;可是,不同的考生在考相同的语言任务时,往往根据其不同的背景考不同的题目。举例来说,同是“叙述过去”这一个语言任务,测试员会要求刚从中国回来的考生说说在中国碰到的难忘的一件事;而对刚刚大学毕业的考生,测试员则会要求考生叙述毕业典礼的过程。这就是口语水平考试中的“个人化”(Personalized)原则。只有贯彻个人化的原则,才能保证考生在口试中有话可说,才能收集到大量的语言材料,并在此基础上作出科学的分析,从而客观地判断出考生的真实语言水平。
口语水平测试的程序,一般包括四个步骤。首先,是热身(Warm-up),通过让考生先做简单的自我介绍,以及测试员问一些与自我介绍有关的简单问题,使考生进入测试状态。另一方面,也让测试员对考生的语言水平有一个初步的印象,从而设定一个暂定水平(Working level)开始测试。 第二个步骤是基本水平检测(Level check),目的是要确定考生语言水平的下限(“Floor”)。测试员根据热身阶段对考生水平的初步印象而设定一个暂定水平,然后, 测试员根据这个暂定水平进行检测。在基本水平检测的过程中,如果发现考生达不到测试员起初假定的暂定水平,则要把暂定水平降下来,在新的暂定水平的基础上继续进行基本水平的检测。第三个步骤是高一级的水平探测(Probe),目的是要确定考生语言水平的上限(“Ceiling”)。在基本水平检测的基础上,测试员要判断考生是否达到了测试员起初假定的暂定水平。如果达到了,则穿插进行2-4个高一级的水平探测,以确定考生语言水平的上限。一般来说,对基本级(达不到加等的)要进行两个高水平的探测,而对加等必须进行4个高水平的探测。如果在这个步骤的测试中发现考生超过了测试员起初假定的暂定水平,则要把暂定水平上升一级,继续按照新的暂定水平进行测试。最后一个步骤是结束(Wind-down),通过几句简单的对话,让考生在口试结束前有一个良好的感觉。
在热身阶段充分了解考生的背景,是口语水平考试个人化的关键。为了保证能得到足够的考生资料,测试员一般在热身阶段需要了解考生五方面的问题:家庭情况,教育背景,个人爱好,工作经验,和旅游经历。根据热身阶段得到的个人情况,测试员才有可能设计出个性化的考题。举例来说,在热身阶段,考生告诉测试员他每个星期天都去教堂做礼拜。根据这个情况,测试员就可以在考“描述”这个二级语言任务时,请他描述一下他去的那个教堂里面的布置。在考“说方向”这个语言任务时,就可以让他说说从他家到那个教堂怎么走。对这样个人化的考题,如果考生说不出什么,就足可以证明他缺乏那样的语言能力,而不是缺乏那方面的知识。
目前美国国内的汉语口语水平考试(包括普通话、粤语、台湾话和上海话等汉语方言)主要有三种形式。第一种是美国政府机构所采用的面谈式口试(Oral Proficiency Interview, or OPI),以美国政府部门语言圆桌委员会所制定的语言分级标准(Language Skill Level Descriptions) 为指南。学术机构所采用的面谈式口试,则以全美外国语教师协会所制定的外语口语水平指引为宗旨。这两个机构面谈式口试的方法大同小异。它们的相同之处是,两者都采用面谈式,测试员在与考生聊天式的对话中,通过给考生相应的语言任务而对考生的总体语言交际能力作出评估。两者的考试都经过热身、基本水平检测、高一级的水平探测、结束等步骤。考试历时30-45分钟不等,取决于考生的口语水平。两者的主要不同之处在于考试评分程序和口语水平等级的设定。在考试评分程序方面,全美外国语教师协会采用一位测试员考一个考生的办法。第一位测试员考完以后即对考生的口语水平给以评级,然后再由第二位测试员根据考试的录音给以评级。如果两位测试员的评级不一致,则要由第三位、甚至第四位测试员参与评定考生的最后等级。美国政府部门的口语考试则采用两位测试员同时考一个考生,然后各自独立评级的办法。如果两位测试员的评级不一致,同样要由第三位、甚至第四位测试员根据考试录音参与评定考生的最后等级。无论是美国政府部门语言圆桌委员会还是全美外国语教师协会,对口语测试员的资格要求都十分严格。只有经过为期两到三星期的专门训练并通过其规定的考试以后,才能取得口语考试测试员的执照。美国国防语言学院甚至规定,口试测试员每年必须重新接受训练并通过考试,才能延续其测试员执照(Recertification)。
第二种口语考试的形式是电话访谈式(Telephonic Oral Proficiency Interview)。它其实是面谈式口语考试的变种,考试程序与面谈式口试完全相同。唯一的不同是口试通过电话来进行,测试员与考生彼此不见面。这对于身处异地的测试员和考生尤为方便,因此这种电话访谈式逐渐成为目前汉语口语水平考试的主流。
除了上述两种口语水平考试形式以外,美国近年来还有一种用电脑进行语言水平考试的形式(Computer-delivered Proficiency Test)。用电脑进行语言水平考试,不但可以考听力和阅读,还可以考口试和写作。听力和阅读的水平考试,一般采用多项选择题,电脑可以根据输入的正确答案直接判卷。口语和写作的考试,则需要测试员根据考生的录音和写作答卷进行评分。电脑操作的口语水平考试可以同时接受数量众多的考生,这是它的优点;可是,由于题目需要预先设定并把题目录好输进电脑,因此就丧失了测试员当面考考生时可以随时调整内容和暂定水平的灵活性。目前解决这个问题的方法是在设定个人化的题目前,在热身阶段首先采集考生的大量个人资料以建立考生的档案。例如,在“你周末有什么活动?”这个问题的下面,罗列出包括去教堂做礼拜等十多种常见的活动,并在每种活动下面再要求考生回答一些细节的问题。这与面试热身阶段的做法是一样的。通过问考生大量的问题,把考生详细的个人资料输入电脑,从而由电脑生成个性化的题目。对于电脑在考试中不能像测试员那样随时调整考生的暂定水平这个问题,解决办法是设立初、中、高三个水平的考试题目,让考生根据自己的情况选择合适的试题。另一方面,在同一考卷中增加不同水平不同内容的试题,让考生作答,由此产生足够的语言材料,供测试员听录音时对考生的语言水平作出客观的评判。在美国,使用电脑进行语言水平考试已经是大势所趋。前面所说的美国政府部门和学术机构的汉语口语水平考试,目前正在试行电脑考试的方式。美国大学汉语先修班的口语水平考试(AP Oral Exam),从一开始就采用电脑考试的形式。而中国研发的汉语水平考试(Hanyu Shuiping Kaoshi, or HSK)目前采用的也是电脑考试的方式。当然,尽管中美上述口语水平考试都用电脑考试的形式,但是,他们考试的内容和评级的原则其实是很不一样的。细细比较一下,就可以发现他们的显著区别。因此,中美学术界加强这方面的交流与合作是完全必要的。
(四) 余论
如何科学地判定一个人的粤语口语水平,无论在理论上还是在实践上都有很多问题值得研究和讨论。例如,美国政府部门语言圆桌委员会对各个语言水平交际任务的设计,是以英语作为基础的。因为英语动词有过去时、现在时和将来时的区别,因此在二级水平语言交际任务中,包括了叙述过去、现在和将来的三项任务。对于没有时态(Tense)却有动作的态 (Aspects) 的汉语来说,二级水平是否只需要叙述过去这个语言交际任务值得考虑。另外,在三级水平的语言任务中,包括了假设(Hypothesis) 这个任务,这是因为在英语的语法结构中,假设的语法结构非常复杂,真实条件句和非真实条件句(虚拟语气)的语法结构各不相同。可是在汉语普通话里,表示假设的结构都是一样的,很简单,所以,假设是否应该包括在三级水平的语言任务中,值得商榷。此外,在粤语口语水平考试的考题设计方面,牵涉到对粤语基本语法特征的了解。粤语的基本语法特征究竟包括哪一些?粤语中具有非常丰富的语气词,有一种与语法和词汇紧密相关的变音现象,如何在考题设计上反映上述粤语的特征?所有这些,都值得我们好好研究。本文聊作引玉之砖,不当之处,敬请各位专家学者批评指正。
(原载《南方语言学》9辑,2015)
图文编辑:廖小曼
责任总编辑:老甘