查看原文
其他

许家金:基于语料库的历时语言研究述评(下)|《外语教学与研究》2020(2)

The following article is from 北外学术期刊 Author 外语教学与研究

点击上方关注我们



基于语料库的历时语言研究述评(下)

作者 | 北京外国语大学 许家金


提要:本文旨在梳理近年兴起于各语言学分支领域的历时研究动向。语料库理念和方法是这一研究趋势的重要推动力。得益于众多千年和百年历时语料库,以及多元统计和可视化方法,词汇、短语、句法、话语、语用、认知等诸多语言维度的长期演变和短期渐变成果叠出。语料库语言学的概率方法,以及语言特征和语境因素共现/ 共变的理论思维,使得历时语言变化研究在描写和阐释方面均有建树。


关键词:语言演变、语言渐变、历时语言学、多因素分析、语料库


完整文章请见《外语教学与研究》

2020年3月 第52卷 第2期

(接上文)


3.语言演变研究


虽说历时语言研究近年呈现集中发展趋势,但语言历时演变从来都是语言研究的重点。例如,国际最著名的 ICAME 语料库研究会,1996年在International Computer Archive of Modern English的基础上增加“中世纪英语”,改名为International Computer Archive of Modern and Medieval English,就是一个明证。基于语料库的语言演变研究涉及单个语言特征(往往以词汇化形式出现的语法范畴,如 that、be 动词、thou 等)、特定短语项(如 in terms of、frankly speaking),以及对多个语法范畴的综合考察(如语法复杂度;属格标记与体裁、历史年代、说话人性别等因素的交互影响)等一些研究选题。



在较早开展的历时语料库语言学研究中,Matti Rissanen 等人的工作最具影响。Rissanen曾基于赫尔辛基历时语料库开展了宾语从句引导词 that 及其零形式演变趋势的研究。在该研究中,Rissanen 对各历史时期口语和书面语中that/零形式分布、引导动词(如 say、tell、know、 think)对 that/零形式的选择倾向、主句主语为名词或代词、引导动词与连接标记之间是否有插入成分、引导动词是否是限定形式,以及体裁对that/零形式的选择偏好,进行了全面的量化统计。得出以下结论:宾语从句的零形式引导语并非 that 的省略,在古英语中 that/零形式两者并存。我们不能说其中一种形式是另一种形式的省略。只不过,在口语风格英语语料中,零形式自古至今都是宾语从句连接成分的非标记形式。在书面体裁英语中,that 历来就是默认形式。就具体历史阶段来看,17世纪是英语宾语从句 that 省略的高峰期,而18世纪人们更倾向于循规蹈矩保留 that。就引导动词来看,动词 say 后面接 that 更倾向于出现在正式语体中。而从15世纪至今,动词 think 后会更多采用零形式引导宾语从句。新进入英语的动词,其引导的宾语从句起初都采用显性 that 标记,经过若干历史时期后,才会逐步出现零形式的情况。可见,that/零形式选择使用的历时发展受体裁、引导动词等多方面因素的影响。在近年的语法范畴演变研究中,Sommerer 关于古英语中冠词形成的构式研究,也体现出很强的理论和方法价值。


在专就短语层面的英语历时演变研究方面,Hoffman的一项代表性成果集中讨论了一组“介词+ 名词+ 介词”型复杂介词短语(如 on behalf of、with regard to、in search of、in relation to 等)的演变问题。这里以 in terms of 为例,对Hoffman的研究加以概述。Hoffman 基于古登堡工程以及牛津英语词典中的例句,构建了其历时英语语料库,同时整合了当代英语语料。经对英国国家语料库调查发现,in terms of 是最高频的复杂介词短语。In terms of 的零星使用始见于19世纪末的语料,20世纪初叶使用逐渐增多,且在英语口语中最为常见。即便在口语中,in terms of 也是在相对正式的会谈或会议中使用更多,而在普通人的会话中出现并不多。In terms of 的演进过程经历了明显的语用化。语料统计显示,in terms of 经常与填充停顿(13%)、话语片段重复(9%)等非流利现象共现,有时 in terms of 本身也是非流利话语的一部分,属于即席话语中的迟疑标记,有时可起到转换话题的作用,或者说是一种话轮管理的交际策略标记。历时语料可以有效揭示 in terms of 这样的语法片段如何逐步词汇化及语用化。短语这一语言学范畴与认知语言学中的构式有很大交叠。近年也有不少针对某些构式进行历时考察的案例。


随着语料库语言学方法的深化,同时对多个语法特征进行综合考察已十分常见。Biber & Gray基于1700-2005年间各类学术文本,对学术英语句法复杂度的历时演变做了深入探究。其中早期语料源自 ARCHER 历时语料库,另外他们还自建了20世纪学术英语库,同时结合了当代英语语料资源。所有语料都充分考虑到小说、新闻、学术(甚至文科、理科等子学科)的语域细分,以便深入考察语域与语法特征之间的关联。该研究得到一些重要发现,一改以往对学术英语的固有认识。先前通常认为学术英语的突出特点是句式复杂(特别是嵌套句型较多)、多用被动态和名物化;并且,相对于口语、小说、新闻,学术语体随着时间推移,在语法上相对稳定,变化不大。但 Biber 和 Gray 的历时研究表明,传统意义上的学术英语特征并未显著高于其他语域,而学术英语在名词短语的构成上,经历了极具语域特色的突出变化。学术语域的句法复杂性主要表现为名词短语复杂性,而非主从句嵌套方面的复杂性。


具体而言,几百年间,学术英语由多用主从复杂句式逐步发展为多用“形容词+ 名词”、“名词+ 名词”、“名词+ 名词同位语”、“名词+ 分词短语”、“名词+ 介词短语”等构造。这些名词构造使得当代学术英语结构更为紧致(structurally compressed),信息更为浓缩。相应的名词短语事实上起到了关系从句和属格(’s 和 of 结构)等作用。这反映了学科发展不断精细化,学科领域不断分化。科学中新的现象、概念、方法不断涌现,而这些主要通过名词性成分来承载。比如当代学术文本中高频使用的 N-based、N-related 一类的合成词,起到的作用便是交代新兴概念和方法等相关背景,或者说明不同概念之间的关系。


Biber 和 Gray 的研究除了发现学术英语语法演变主要围绕名词,体现出浓缩化演变趋势外,与之相对,他们还发现非正式语体的语法演变,较多围绕与动词相关的语法范畴展开。后者的演变在近100年也存在显著变化。不过,从千年的语言演变历史来看,这样的变化只能算作渐变。



4.语言渐变研究


近100年左右的语言渐变,总体表现为“通俗化”(popularization)或者“口语化”(colloquialization)的倾向,具体表现为缩略形式(如’s、’t)增多、半情态动词(如 have to)增多、进行体增多等。


Leech et al.基于两代布朗家族语料库,即上世纪60年代的 Brown 和 LOB 语料 库,以及 上世 纪90年 代的 Frown 和 FLOB 语料 库,从历 时和 英美变体两个维度对多项语法特征进行了对比。这些语法范畴包括:虚拟语气、(半)情态动词、进行体、被动语态、轻动词、非限定小句、名词短语。以情态动词的渐变为例,四个百万词级语料库中呈现出相当一致的趋势,即在30年间,所有情态动词(would、will、can、could、may、should、must 等)均有不同幅度的减少。而在情态动词的语义表现方面,原先有多重含义的 may、should 逐渐只保留其中最常用的一个含义,这印证了语法化理论里的“专门化”(specialization)过程。而就 must 而言,在总体频数降低的同时,其表示强制义务情态(deontic obligation)含义的用法出现下降。从 must 的主语来看,第一人称和第二人称的数量在30年间明显减少。Leech 等人将情态动词总数的降低和强制意味情态义项的减少解释为英语的“平易化”(democratization)。与此同时,其他一些英语表达顺势而升。例如,与 must 的少用形成对照的是 be able to、be going to(包括 gonna)、have to、need to、want to(包括 wanna)的多 用。除语法化、平易化外,近30年英国英语还出现“美国化”(Americanization)倾向。例如,与上世纪60年代相比,英国英语中 help…do 明显增多,而 help…to do 的使用显著减少,这与美国英语 help…do 的使用模式越发接近。可见,即便在很短的历史时期内,也会发生较为明显的语法变化。语料库证据告诉我们,语法并非像以往认为的那样相对稳定,几十年之内不会发生显著变化。


除了像 Leech 等人对30年间两组语料库进行对比外,研究中若能更细密地收集历时语料,则可对语言渐进做精细考察。比如 Leech在1961年 和1991/1992年语料基础上增加了1901年、1930年、2006年数据,从而达到5个英国英语数据点,据此更清晰地揭示出一个世纪以来,英国英语整体呈现少用情态表达的趋势。Leech还利用COCA和COHA 两个美国英语语料库,证明了美国英语同样出现情态动词减少的情况。此类研究中,均衡取样的历时语料不易获得,而不同时期语料取样的可比性是研究信度和效度的保证。不应出现Millar以《时代周刊》这一特定杂志语料库中的情态用法,得出整个英语走势的错误做法。




图片来源:TIME


在语言渐变研究领域,也如长期语言演变一样,出现了综合数十个语法特征考察英语演变的研究思路。Yao & Collins运用分层聚类(hierarchical cluster analysis)和多维尺度(multidimensional scaling)等多元统计方法,围绕69个语法特征的分布情况对澳大利亚英语四个不同时期(1931、1961、1991/1992、2006)的演进进行了综合讨论。在分析过程中,该研究将澳大利亚英语语料库(AusBrown)与不同时期的美国英语布朗家族语料库和英国英语布朗家族语料库进行了对比。作者从与英国的宗主关系和全球化等社会历史因素角度解释了澳大利亚英语追英、自创、学美的语法变化特点。同时,在澳大利亚英语中也出现了前文所谈的口语化和信息浓缩的演变特征。


像 Yao & Collins这样,以多特征多变量的方法考察文本,与 Biber的语域变异研究较为类似,换言之,已进入话语研究层面。



5.话语、语用、认知历时研究


前文介绍的历时语言研究,多在既有语言现象基础上,增加不同时期语料数据点,通过前后对比观察历时变化。而近些年基于语料库的历时语言研究中,在语言现象选择方面也有所拓展,主要体现为对话语、语用、认知现象的考察,相关成果数量增长迅速。语法化过程有时历经千年,而话语、语用、认知现象的演变,往往通过对近百年,甚至几十年间的语料对比便可观察到。基于语料库的历时话语研究并非都是最近10年左右新增而来。Biber & Finegan基于4 个多世纪的小说、杂文和信函语料,考察了400多 年来三个语域中67项词汇语法特征所呈现的语域特征。总体上,三个体裁都随着时间推移,逐步表现得更加口语化。这种口语化在18世纪时经历了一些反复。这跟前文 Leech 等人谈到的英语平易化十分类似。Atkinson按照 Biber 和 Finegan 的方法系统研究了1675—1975年间的《伦敦皇家哲学学会会刊》(The Philosophical Transactions of the Royal Society of London),发现学者们开始变得更为客观,较少以作者本人作为主语;抽象表述不断增加;话语的叙述性减弱。


在话语研究领域,针对特定概念以及事件的话语建构研究,都或多或少地涉及历时语料的使用。例如,1586年以来英国詈骂语的演变史、“9· 11事件”前后新闻报道方式的变化、半个世纪以来英美博物馆宣传话语的演变、1987-2014年《纽约时报》中“危机”概念的表述、学术话语的历时变化等。还有些课题则限于历史上的话语现象。例如,历史文本中的会话互动、17世纪娼妓文化等。历时视角之所以在话语研究中不可或缺,原因在于有关现象或事件都会经历酝酿、发展、关键节点及后续影响这样的演变路径。在批评话语研究领域,更有“话语- 历时分析法”,主张将历时分析作为话语研究必不可少的维度。


图片来源:Chinadaily


语用现象的历时研究以 Andreas Jucker 及其创办的《历史语用学学刊》(Journal of Historical Pragmatics)最具代表性。在语料库历时语用研究方面,Jucker 成果最为丰硕。Jucker & Taavitsainen基于 COHA 美国英语历史语料库以及 COCA 美国当代英语语料库,考察了1810年至2010年间“赞誉”这一言语行为的演变。除了发现语料中 compliment 一词出现频率存在明显减少趋势外,作者还对赞誉类型、赞誉发出者、赞誉受话者、赞誉目标、赞誉的回应都做了手工标注。研究发现与 Holmes的结论不同,200年来,美国英语中以 compliment 一词发出的赞誉言语行为由男性占主导(75%以上)。相关的赞誉主要关注个人特质/ 友谊、能力,其次才是对外貌和物品的赞美。另外,七成以上美国人都倾向于接受他人赞誉。Su(forthcoming)利用局部语法对美国英语中的道歉进行了历时描写。另一类重要的历时语料库语用研究是有关语用标记的形成,这一过程往往跟词汇化、语法化交互影响。


相关研究中涉及的认知现象,主要包括概念隐喻、概念转喻以及构式的历时演变。这一研究取向多由西欧学者主导,特别是Dirk Geeraerts 及其团队成员。例如,Glynn对比了19世纪和20世纪的通俗文学作品中“家”(home)的概念隐喻演变。他对“家”的概念范畴(即 place‘处所’、 house‘住宅’、 land‘土地’、nation‘国家’)及语义特征(包括 lodging‘起居’、shelter‘庇护所’、 comfor‘t 舒适’、securit‘y 安全’、origin‘s 源泉’、belongin‘g 归属’、possession‘拥有’、 struggle‘奋斗’、building‘建筑’)进行了详细标注。Glynn 通过层次聚类分析发现,19世纪到20世纪的200年间,home 表达住宅和国家这两个概念的情况始终比较稳定。多重对应分析则显示,在概念、语义、时代三个变量的交互中,可以观察到从19世纪到20世纪,house 都与“舒适”、“起居”关联密切,而在20世纪 house 很明显与“奋斗”、“拥有”关系比较近。可见20世纪人们背负着更重的住房压力。Zhang运用多维尺度法对我国周朝至民国汉语中女性概念的转喻用法做了历时考察,揭示了女性概念在不同目标域范畴以及不同题材语料中的演变规律。


隐喻、转喻之外,构式是历时认知语料库研究中最为重要的话题。比如,Delorge et al.运用对应分析法,对19世纪和当代荷兰语中转移类构式的使用倾向进行了描绘。Shank et al.运用逻辑回归法对1560年至2010年的英语口语和书面语中 I think that 和 I think [零形式] 的选择制约做了多因素考察。这与上文介绍的 Rissanen研究几乎同题,然而考察的因素更为细致,作者们针对9,720例含 think 的语句,深入分析探讨了历史时期、语体、主句成分、从句长度、主语代词使用、主从句时态一致性、主从句指代一致性、主从句极性一致性等因素。另外,在研究方法上,Shank et al.与 Rissanen的主要不同在于,前者不但分析了各因素的单独影响,还探讨了因素间的交互作用。更重要的是,每个因素在I think that/零形式这一构式演变中的影响程度都通过量化指标得以表示。Shank et al.总体上验证了前人研究,但在部分指标上也更新了此前的结论。例如,不像 Rissanen发现零形式用法越来越多,相反,随着历史的推移,that 作为导句词的用法实际上是有所增加的。


在词汇、语法、话语、语用、认知这些语言本体层面的历时研究之外,利用语料库开展语言接触、翻译对原创语言的影响研究,也散见于文献中,值得关注。



6.结语


用法本位语言观强调语法的动态浮现性,这一理念本身便蕴含“时间性”(temporal)。每个语言特征,如同生命体,都有其历史。在历时语料库支撑下,学者们可以对传统的词源学、对比语文学、语法化进行更为系统的考察。概而言之,在大数据、多元统计、共现与共选等新思维的指导下,我们可以将任一语言学分支都冠以“历时/ 历史……研究”,本文开始处已列出很多此类学科融合,另有“历史语料库文体学”、“历史话语分析”的例子。这也与国际学界学科深化、细化的趋势一致。近年历时语言研究子学科的层出不穷之势,也是学科专门化的自然体现。虽说可以对所有语言现象都进行历时语料库的探究,然而,这终究不过是一种研究视角和路径。热衷于打造新兴子学科,有舍本求末之嫌。我们主张应当多谈实际语言问题,少提新兴学科领域。


在研究选题上,基于历时语料的词汇语法(如情态动词及 that 从句等)研究,可靠性明显更高;然而有关语用现象(如言语行为)的研究,仅从个别词汇短语入手,以形索义,终因形义并非一一对应,仍然显得捉襟见肘。 


在历时语料库研究的分析方法上,多维度分析、多因素分析被越来越多的研究采用。这些方法不仅对语言现象的描写更加细致、全面;更重要的是,它们可以考察多个语言特征以及语言特征与语境变量之间的相互影响。这在很大程度上已进入到现象的解释层面。


从上文综述可见,在这股新兴的研究热潮之中,中国学者,特别是一批海外归来的青年学者,已将我国历时语料库研究成果推向国际。只可惜相关研究更多是英语本体研究,也多半是在西方学者框架内的复制或延展性研究,缺少对我国本土历时研究选题的关注。在国内,赵秋荣、王克非(2013)、秦洪武、夏云(2017)、王克非、秦洪武(2017)、庞双子、朱一凡(2018)立足汉语,关注了外译汉以及翻译对现当代汉语形成的影响,获得了很多有价值的发现。


(全文完)





期刊介绍:教育部主管、北京外国语大学主办的学报。我国外语界著名学者王佐良、许国璋教授等曾先后担任本刊主编。现设有语言学、语言研究、外语教育、翻译研究、中外文化交流研究等栏目,涵盖外语学科各主要方面。




推荐阅读

推荐阅读:

精彩不容错过!近期28场语言学、翻译、科研公益讲座回放集锦(附官方链接)

会讯︱国际应用语言学前沿问题研究高端论坛(二号通知)

中英文学科、专业名称对照

2019年中国语言文字工作“靓”点 + 中国语言生活总体状况介绍

多模态话语分析:以“疫情防控外语通”为例

世界语言谱系及语种全览 | 语言学微课堂

苗兴伟:什么是话语分析?| 语言学微课堂

视频 | Metaphors We Live By 内容导读 (我们赖以生存的隐喻 by Lakoff & Johnson)

语言学家 Lakoff & Duran:特朗普正在将言语变成武器,对民众进行洗脑!

吴岩:我们再也不可能、也不应该退回到疫情之前的教与学状态

热议 | 已发表的中文论文,翻译成英文后,还能再次发表吗?

如何利用政府工作报告学好翻译?| 经验分享+资源好帖

总理记者会妙喻连连,“翻译女神”张璐逐个击破,真稳!| 侃英语

视频双语 | 总理记者会精彩语录+双语全文,张璐翻译传神到位!

重磅资源 | 外语教学论文写作与发表(免费下载论文写作资料大礼包)

资源推荐丨汉语学习实用APP/小程序/网站大搜罗

学习资源 | 几乎所有中国美食的英文翻译及相关知识, 一定要收藏备用!

这120个中国传统文化名词如何用英文表达?

教育部:推荐使用的外语词规范中文译名(第 1-9 批合集)

精选 | 应用语言学研习丛书(13种)一览:回顾经典 分析热点

牛津社会语言学丛书 | 9种精选,一次看个够(可试读)

LingPress | 语言学中外文重要期刊目录一站式阅览

书讯 | 2019年商务印书馆学术中心全年书单

《爱丽丝》是个语言(学)宝藏

Forceville等:《多模态隐喻》| 德古意特认知语言学应用丛书

讲座视频 | 乔姆斯基: 语言学的基本问题 (上) Fundamental Issues in Lingui. (at MIT)

讲座视频 | 乔姆斯基: 语言学的基本问题 (下) Fundamental Issues in Ling. (at MIT)

乔姆斯基:语言结构体系及其对进化的重要性(司富珍 译)

重磅资源丨第四批发布!外文局审定新冠疫情相关词汇英文表达(1-4批大合集)

第五批来了!外文局审定新冠疫情相关词汇英文表达(第五批)

复旦教授蔡基刚:AI 时代,高校翻译专业必然走向消亡

热议 | 高校翻译专业将走向消亡,不仅仅是因为AI

数字社会中的隐喻:平台(platform)

文科大学生最重要的学习方式就是——自己读书

招聘 | 近期25所高校(院、系)招聘信息汇总




大家都在看,就差你啦~



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存