查看原文
其他

读书小札 | 黄立波、王克非:如何用语料库分析文学作品?

语言学通讯 翻译学通讯 2023-03-04


点击蓝字关注我们



语言学通讯

读书小札

《文学语言与人物塑造的语料库语言学研究方法:析弗吉尼亚·伍尔夫的<海浪>》

导读

作者:黄立波 王克非

世界知名图书公司约翰·本杰明出版公司(John Benjamins Publishing Company)到目前已陆续出版了八十多个系列的学术著作,其中“文学的语言学研究途径”(Linguistic Approaches to Literature,LAL)丛书已出版30本,汇集了一大批来自各个相关研究领域世界顶尖级学者作为丛书编委,这个系列丛书的宗旨在于“运用语言学方法达到对文学多方面更深入、更深刻的认识,强调文学领域内语用学方法与实验心理学、心理语言学、计算语言学、认知语言学、文体学、话语分析、社会语言学、修辞学和哲学的交叉”。丛书第18卷是《文学语言与人物塑造的语料库语言学研究方法:析弗吉尼亚·伍尔夫的<海浪>》(A Corpus Linguistic Approach to Literary Language and Characterization: Virginia Woolf ’s The Waves),出版于2014年,作者是意大利学者Giuseppina Balossi,Balossi的硕士、博士均就读于英国兰卡斯特大学,师从该校语言学及英语系Elena Semino教授,本书以她的博士论文为基础撰写而成。

定价:66元

限时优惠:52.8元


Balossi在一开篇就明确指出,结构主义到来之前的文学研究主要是以直觉式的自由阐释为基础,计算机技术的出现使得对文学作品进行更为系统的研究成为可能,但问题是文学批评在很长一段时间以来都对计算机持拒斥态度。实际上,对文学文本的量化分析早在19世纪中期就已经出现,主要用于考察某一作品的作者权归属(authorship attribution),这一研究领域通常被称为计量文体学(Stylometry)。1851年,英国数学家Augustus de Morgan提出利用词长(length of words)统计来确认《希伯来书》(Epistle to the Hebrews)的作者(Love 2002:133)。1887年,美国物理学教授Thomas Corwin Mendenhall提出,根据一位作家的一定量文本抽样中使用不同长度词语的范围及配比,便可勾画出该作家使用语言的特征曲线(characteristic curve),同一作家的不同作品会表现出相同的特征曲线,不同作家作品的特征曲线通常会表现出一定差异性,且有一定的区分度(参见黄立波 2018)。计算机技术出现以后,计量统计分析有了更好的辅助工具,涉及计算机辅助的文学语言与文本分析的研究大量涌现,根据Biber,基于语料库的研究方法应用于文学研究已经有五十多年的历史(2011:21),近年来已经成为文学研究领域的一个主要研究范式。

尽管计算机技术不可能像人类大脑那样来理解和欣赏文学文本,但语料库方法论却为我们打开了一种思考语言和文学的新途径,帮助我们认识一些仅通过肉眼观察而无法发现的语言现象,为我们的研究提供新的思路和出发点。本书的目的在于尝试如何运用计算机辅助方法来考察英国作家弗吉尼亚·伍尔夫小说《海浪》中语言与人物塑造的关系,集中关注是否可以通过考察小说中人物语言的词类分布及语义范畴来区分不同人物,从而探究伍尔夫如何运用语言来塑造个性化人物形象。Balossi同时指出,虽然语料库的方法也可能存在一些问题,但这一方法确实可以让我们重新认识小说以及其中的人物。

全书共分为8章,第1章为绪论,是对全书主要内容及结构安排的概述。Balossi首先对伍尔夫的小说《海浪》做了简要介绍,指出该小说由于其独特的叙事结构和人物呈现模式,被誉为20世纪现代主义小说最突出的成就,也是最具争议、最难懂的小说之一。小说中的人物语言不仅具有高度象征意义,而且作者这种自造的语言风格在日常交际中并不常见,所有人物似乎通篇都用同样的方式说话。正是这些特征使这部小说的人物塑造方法成为大量争论的焦点。小说中三男三女从童年到老年人生不同阶段的生活故事通过独白(soliloquy)的方式展现,每个阶段之间以第三人称叙事的抒情描写作为插曲(interlude)间隔开来,描写从日出到日落的一天生活,象征生命的各个阶段。每位人物的独白都以明确的转述句(reporting clause)标示,如“said Susan”、“said Jinny”、“said Rhoda”等。尽管如此,许多评论家认为,六位人物的独白表现出这样一些特点:(1)语言风格完全一样;(2)语言风格在小说中通篇不变;正因如此,我们无法分辨(3)每位人物是否有自己的个性身份;(4)每位人物从童年到老年是否表现出各自性格的发展变化。Balossi的研究正是围绕学者们对伍尔夫作品《海浪》人物塑造的争议,提出自己的研究问题:是否能够通过小说中六位人物所使用的语言将他们的性格特征区分开来;是否能够根据六位人物各自使用语言的历时变化来发现他们的成长。

第2章是对伍尔夫写作风格与其作品《海浪》的简介。Balossi指出,伍尔夫对现代主义文学的贡献不仅仅在于其创作的作品,还包括她的小说创作思想,尤其是在人物塑造方面的一些看法。根据伍尔夫的观点,成功的小说作品取决于其人物塑造的优劣,她认为,对于一位好的小说家,其任务应当是转向人物内心,探索复杂的个人意识,其小说《海浪》就采用了这种以人物及其心理过程为中心的写作方式。Balossi从构思、结构、人物塑造方法、关于人物塑造的争议、词汇运用模式、人物心理分析等方面对小说《海浪》做了比较全面的介绍。就这部小说中塑造的人物是否各具特色,相互间是否具有一定区分度,以及每位人物的性格是否表现出一定的历时发展存在的争议,Balossi将现有观点归纳为三类:(1)小说中的人物在整部小说中从头到尾没有区分度,人物形象属扁平、静态模式;(2)小说中的人物均有自己的个性,并表现出各自的历时发展;(3)所塑造的六位人物之间存在差异,存在各自的性格发展,同时又是一个统一体或同一思想的几个部分。对于小说《海浪》中人物塑造存在的这些争议,正是本书作者Balossi博士的选题背景以及研究问题的出发点,本书的主旨在于如何借助语言分析来证实或证伪以上观点。

第3章中,作者从文学作品人物塑造理论、社会心理学的人物性格界定、人物塑造的文体学研究途径、语言与人物性格等几方面对本研究涉及的文学批评理论问题做了综述。Balossi首先引用Culpeper(2001)的观点讨论了文学作品中人物的本体地位:“人性化”(humanized)的和“去人性化”(dehumanized)的人物。前一类观点将文学作品中的人物视为可独立于文本的人,而后一种观点则将其看作情节产品或单纯的文本现象。自亚里斯多德以来,形式主义、结构主义、符号学的叙事传统一直认为情节远比人物重要,人物只不过发挥着推动情节发展的辅助功能,被视为文本的构件。形式主义、结构主义、符号学的观点源于语言是一种符号系统这样一种认识,他们更关注于识别不同文本中塑造人物的普遍规律。现代主义意识流作家,如普鲁斯特、伍尔夫、乔伊斯等也反对采用现实主义手法刻画文学人物,许多批评家认为他们是将“去人性化”的效果引入了自己的小说创作。但实际上,他们对小说中的人物塑造均有自己独到的认识,如伍尔夫就是通过展现人物心理过程和意识活动从内部来塑造其作品人物的。关于人物类型,Balossi介绍了Foster(1927)关于“扁平”(flat)与“丰满”(round)人物的类型划分、Harvey(1965)“主人公”(Protagonists)、“背景(人物)”(Background)和“中间人物”(Intermediate figures)的划分,以及Fishelov(1990)关于作者使用语言塑造的“文本层面”(textual level)人物与读者感受的“构建层面”(constructed level)人物的划分。除上述固定的类型划分方式外,还有一些打破常规的人物分类法,如Ewen(1983)关于“复杂型”(Complexity)、“发展型”(Development)和“穿透内心”型(Penetration into the inner life)人物类型的划分、Phelan(1989)的“仿拟型”(the mimetic)、“综合型”(the synthetic”)和“主题型”(the thematic)人物类型的划分。从社会心理学视角,性格(personality)被定义为“可用来解释一个人在特定时间、特定情境下一贯的模式化行为的特征”,一个人所感、所思、所为的特征化方式称为性格特质(personality trait)。Balossi指出,对人物性格的研究主要采用的是社会认知方法。通常,我们都是利用储存在记忆中的先前知识(prior knowledge)或背景知识来认识和理解新事物,对文本的认识也不例外。图式(schema)是对我们关于外部世界知识的部分心理表征,这些图式知识储存在我们的大脑中,在新的情境下就会被激活。其中的认知过程可以包括自下而上(bottom-up)和自上而下(top-down)两种方式:前者是以所输入的信息为出发点,后者则是以来源于先前经验和储存在记忆里的已有知识为出发点,这些认知方法可以帮助我们分析和理解文学作品中的人物性格。Balossi继而对图式理论的起源、发展与应用做了比较全面的综述,并且指出尽管图式理论存在一些不足,但对于阅读理解与回忆研究的确产生了重大影响,尤其在人物性格分析方面。Chatman(1978)、Toolan(1988)、van Peer(1989a)、Mead(1990)和 Culpeper(2001)都倡导从文体学视角来研究人物塑造,其核心思想是将人物视为文本与读者背景知识相互作用而构建起来的一种心理表征(mental representation)。文学文体学更多关注于识别哪些文本特征提供了关于人物的信息,而认知文体学主要关心语言结构与读者在确定文本意义时的认知机制之间的关系,尤其是对“自上而下”和“自下而上”两种认知模式的认识。Culpeper利用认知理论尤其是图式理论,以及社会认知理论提出,这些理论有助于描述读者是如何对自己关于人物的印象加以充实并使其连贯化,并强调不同类型的社会范畴是构建社会图式的材料,对这些社会范畴的认识有助于个人对他人的感受和认识。Culpeper区分了三种范畴类型:(1)个人范畴(Personal categories),包括关于个人偏好、兴趣、个性特征、习惯、目的等方面的知识;(2)社会角色范畴(Social role categories),即关于人物社会功能的知识,包括血亲关系角色、职业角色和社会关系角色灯;和(3)群体成员范畴(Group membership categories),即关于社会群体的知识,如性别、种族、阶层、年龄、国籍、宗教信仰等。我们对人物的认识不仅仅依靠图式化知识或是自上而下的认知过程,更多的还要依靠先前知识,即借助个人对目标人物所赋予的属性来认识人物。尽管如此,自上而下和自下而上两种认知模式实际上是一个连续统一体的两端,两者之间还包括其他一些范畴化过程,如初始范畴化(initial categorization)、确认范畴化(confirmatory categorization)、再范畴化(re-categorization)和零散一体化(piecemeal integration)(Fiske & Neuberg 1990)。就文学人物塑造而言,Culpeper认为Fiske和Neuberg模式是对Foster(1927)二分法的有效补充,这一模式使文学人物类型划分更加多样化。就文学人物研究而言,Culpeper还提出了其他一些值得我们思考的观点,如“戏剧角色”(dramatic role),即文学作品中人物在作品环境中所履行的功能或承担的角色;“可能性扭曲”(possibility distortions),即在小说中,作家会过度夸大人物的某些属性特征,让读者能够感受到这种人物属于夸张式的人物,与我们通常熟知的社会范畴原型不同,是对一般原型的偏离;此外,人物的特征还有可能部分地符合既有社会图式,部分却与其相冲突。Culpeper还举例说明了文本能提供的关于人物塑造的三种线索:(1)显性人物塑造线索(explicit characterization cues),即作品人物自己呈现的信息,我们通常认为这些信息是真实可靠的;(2)隐性人物塑造线索(implicit characterization cues),我们可以从语言及非语言行为(如语用行为)推理出的关于人物的信息;和(3)作者提供的线索(authorial cues),如人名等专有名词、舞台说明,以及第三人称转述等。

对个性化人物塑造的认识还可从修辞性语言,比如,我们可以通过与人物相关的修辞性语言来推理他们的内心世界或思维风格(mind style)。思维风格研究一直是文体学、认知文体学和当代叙事学的研究主题之一,主要关注如何通过从词汇、语法到修辞等不同语言特征来考察小说人物或叙述者的内心世界。此外,认知隐喻理论也已被广泛应用于考察小说人物模式化的隐喻使用,从而来认识小说人物的世界观及其性格特征。

20世纪90年代以来,社会心理学等社会科学领域开始关注对自然生成语言的研究,其理念在于:人们在真实生活中所使用的语言可以反映出他们的社会身份、情感、信仰和思想。一些学者采用计算机辅助手段,通过考察词汇使用来研究人物性格(如Chung & Pennebaker 2008;Pennebaker 2011),其方法类似于计量文体学对作者权归属的考察,通常认为功能词要比实义词更能揭示人物的个性。在心理学领域,研究者会采用实证性实验方法辅以录音材料转写、网格图、问卷法等心理统计学手段,通过受试者所使用的词汇来判断其性格、情感等特征。此外,还有“数词法”(word-count),例如从语言使用者所使用情感类词汇的数量来判断其想要表达的思想或情感。一些研究者认为,此类语言研究的关注点应当放在人物如何(how)说而不是说了什么(what),因为说话方式要比内容能更好地提供心理学信息。另一些研究还是坚持将重点放在语言内容方面,他们认为只有从实义词中才能推断出有效信息。然而实证研究表明,功能词尤其是代词、介词、助词和连词是最能提供有效信息的心理学标记。例如,大量使用第一人称单数“I”通常与沮丧、病痛、欺骗和自我中心等性格特征相关;“I”或“we”的使用会反应出说话者与听话者之间不同的关系类型;尽管第一人称复数“we”可体现出集体认同,但同样也会不自觉地传达一种情感上的距离。文体差异的另一个表现就是性别,即男性和女性使用的语言会表现出一定的文体差异。研究表明:相对来说,男性语言会表现为更直接、简洁、个人、工具性,而女性语言更为间接、详尽、感性;女性使用的词汇更多与心理或社会过程相关,男性使用词汇更多是关于事物的属性和非人际话题。

第4章是对文学作品及其语言的语料库研究途径的一个综述,具体包括语料库概念的界定、语料标注、语料库分析通常采用的技术手段和文学文本语料库的标注及应用。通常意义上的语料库,指的是某一类文本的整体汇编。语料库语言学领域所讲的语料库,是指根据一定研究目标,按照一定原则收集的具有一定规模和代表性、电子化、可机读,并能够借助计算机软件进行检索、统计和分析的文本数据库。有学者认为,文学文本由于其特殊性不能被作为严格意义上的“样本”,因为单个的文本语料欠缺代表性。Balossi指出,本研究所讲的语料库只能代表一位作家(伍尔夫)在其一部作品(《海浪》)中的语言使用风格,而且关注焦点放在借助语言的个性化文学人物塑造方面。

就语料标注,Balossi指出最常见语料库标注类型包括词类标注、语义标注、词汇标注、语用标注和语言学标注五类。词类标注也称为句法-形态标注,可为每一个词标出词性,并可区分同形异义词;语义标注可以标出每个词语在文本语境中的语义类别;通过词汇标注,我们可以弄清楚一个文本中的词目(lemma)使用情况;语用标注可以帮助我们考察文本中祈使、疑问等口语表达类型;语言学标注的对象如言语或思想表达等。对语料库标注的深度,不同学者看法不尽相同,有些学者认为生语料能够更为真实地代表语言使用的本来面目,过多的标注会增加语言分析的主观性因素。相反,有些学者认为,标注信息会增加语料的价值,既可进行自动检索,也可进行人工分析。

常用的语料库分析的基本技术手段包括词频(word frequency)统计、关键词(keywords)分析、多维分析法(multi-dimensional analysis)或多因素分析法(multivariate analysis)、词汇密度(lexical density)、类符-形符比(type-token ratio)。此外,还可借助检索项(concordance)来考察带语境的词汇、短语、关键词、语法结构等。语料库在搭配考察方面应用比较广泛,如对语义韵律(semantic prosody)的考察等。尽管语料库工具在形式化语言项的考察方面很有优势,但在涉及交际语境因素的态度或语用意义提取方面有一定的局限性。

在第本章最后一节,Balossi从文学文本的文体量化分析、作者风格考察、人物塑造、小说《海浪》人物塑造四个方面,对近年来运用语料库方法进行文学文本分析的文献(如Hoover 1999,2004,2007,2014;Hardy 2007;Ho 2011;Hori 2004;Fischer-Starcke 2006,2010;Mahlberg 2007,2012;Tabata 2002;Toolan 2008;Culpeper 2002;Ramsay & Steger 2006 等,参见本书49-58)做了分类梳理与评述,并且将重点放在运用定量分析方法,通过考察语言来分析小说人物塑造或性格特征方面。其中,运用计算机辅助方法对小说文本《海浪》的研究现状,也为本研究提供了出发点和研究思路。

第5章是本研究的方法论部分。Balossi首先介绍了小说《海浪》的叙事框架:整个故事由九段插曲和九段独白交叉进行,描写了六位主要人物一天当中的九个时段,每段独白都对应人生九个阶段的描述,所有言语都以“XX说”这一转述句标出。Balossi指出,这样一种有规律可循的叙事结构十分有利于对小说人物使用的话语进行共时或历时分析,前人在此方面已有一些相关研究(如Ramsay 2007;Treloar 1988;Aspeslagh 1999)。Balossi借鉴Carter et al.(1997)用图表来展示小说结构安排的方法,同时根据Rantavaara(1960)的思想,依据六位人物共同经历的主要事件为叙事线索,将每位人物从早到晚九个时段所经历事件的独白按顺序清楚地展示出来,这样的结构安排不仅有利于我们对每位人物的话语做历时分析,还可以对六位人物的话语做共时比较。

在这一部分,Balossi还介绍了文本电子化处理和标注的方式,以及所使用的Wmatrix文本分析工具。研究所用文本均以txt格式存储,为方便对人物话语的分析,插曲部分和叙述者的叙述需要排除在独白之外,并且能对不同人物的话语加以区分。所使用的标注符包括:<ch1>… </ch1>指插曲1的开始与结束;<p1>指段落1;<pb n = 6>指页码第6页;<S>…</S>人名首字母,这里指Susan。以下例文是插曲1和插曲2的开头部分:



其中,话语部分的标注,每位人物以其名字的首字母来代表,依次为:Bernard(B)、Susan(S)、Rhoda(R)、Neville(N)、Jinny(J)和Louis(L)。标注后的文本被分成两个文档:ALLINTER(所有插曲)文档和ALLCHRS(所有人物)独白文档,前者将被排除在分析之外,后者按照人物再被分成独立文档以备检索分析。各部分文本可分可合,方便研究者进行各种方式的交叉对比分析。

本研究所使用的Wmatrix是由英国兰卡斯特大学开发的一款基于网络平台的语料库分析和对比软件,该软件可以完成在线自动标注,标注可包括语法标注和语义标注两类,语法标注采用Claws tagger(详见http://ucrel.lancs.ac.uk/claws/trial.html),语义标注采用USAS (UCREL Semantic Analysis System) tagger,可以标注21大类语义范畴(分别用大写英文字母指代),每一个大类又包含若干次类(详见http://ucrel.lancs.ac.uk/usas/)。软件可以生成词表、统计文本中词汇搭配的MI值和T值,以及词语共现频次,还可用于主题分析,对比研究用语料库与参照库词频的显著性差异。可生成的词表包括:(1)词频(包括词表、(相对)频次);(2)POS词类频次(各个词类的(相对)频次);(3)USAS语义标注符频次(语义标注(相对)频次);和(4)词频及USAS语义标注符频次(词语及其语义标注符(相对)频次)。

Balossi在正式分析统计之前,通过试验研究发现了自动标注范畴存在的一些不足,在此基础上对原有标注类别进行了一定修改(详见5.4.1),以适合自己的研究目标。之后通过将文本载入Wmatrix分析平台,得到小说中每一个人物词类标注和语义标注Excel格式的原始数据表(参见http://dx.doi.org/10.1075/lal.18.additional),采用人工方式修正其中存在的一些标注错误。最后,Balossi对每一位人物所使用词语的形符(token)情况进行初步统计。


第6章第7章是本研究的主体部分,Balossi围绕前文(2.2.4节)所提及的围绕《海浪》人物塑造存在的争议:六位人物的语言是否表现为同一种“声音”还是六种不同的声音;每位人物的语言在其人生不同阶段是否保持历时的一致性或稳定性。研究目标在于考察六位人物是否拥有各自的个性化语言(idiolect)且是否会发生历时变化。根据所获得数据,Balossi分别从词类分布和语义场两方面来探究语言与人物塑造之间的关系。

第6章中,Balossi通过比较每位人物独白语言中词类频次分布,来探究它们之间是否存在同一性。此部分的量化分析分为两步:第一步是将独白文本整体词类频次分布与每位人物独白中所使用词类频次分布进行对比,来发现其间是否存在规律性差异;第二步集中关注每位人物在其人生各个阶段所使用词类频次是否存在历时变化。最后一部分是对Bernard词类频次的统计。

整个独白部分词类频次统计由高到低依次为名词、动词、代词、介词、冠词、连词、形容词、副词、限定词、助词、情态词、不定式标记、否定形式、数词、there存在结构、所有格、感叹词、字母词、Before从句标记,前八位的使用量较高,从限定词到情态词数量有所降低,从不定式标记之后数量较低;六位人物言语所占独白文本总量(69,757词)的比例依次为Bernard(45.1%)、Neville(13.9%)、Louis(12.2%)、Rhoda(11.6%)、Jinny(8.7%)、Susan(8.3%)。根据这两方面的统计可以发现,独白部分整体词类频次与每位人物的词类频次纵向分布情况相似,说明作家所使用的语言在作品中保持了一致性。统计数据还表明,六位人物在不常用词类使用方面表现出较大差异,也就是说,根据不常用词类使用情况,可以判断不同人物的个性化语言。这样的发现初步说明,一些评论家关于《海浪》中不同人物的语言没有区分度的说法不一定站得住脚,也说明文本中的有些差异尽管摆在我们面前,但我们肉眼却无法识别,而语料库的方法却能够在这方面帮助我们,这在一定程度上也体现出计算机语言分析的优势。

对每位人物在自己人生各个阶段使用的语言是否存在规律性的历时变化,Balossi采用共时横向比较,将每位人物在每一个时段词类使用情况与其他人物进行比较,即一对五的比较。例如,Susan与其他五位人物的词类频次分布比较显示,两部分数据在第二时段(青少年)名词与形容词使用频次存在显著差异。Balossi随后采用一对一的比较方式,并采用对数似然统计检验(the log-likelihood statistical test)就二者是否存在显著性差异加以确认(这种统计可在线进行,详见http://ucrel.lancs.ac.uk/llwizard.html)。对数似然统计检验通常用于检验某一语言项分别在两个大小有差异的语料库中的频次之间是否存在显著性差异,研究者可根据研究需要对显著性差异的对数似然值分界值加以设定。Balossi将本研究分界值设定为6.6,并尤其关注对数似然值高于15.13的情况。总体比较显示,每位人物在每个阶段都表现出对特定词类的较多使用(参见附录D);每一位人物相对于其他人物在词类使用方面都表现出其人生的历时变化(参见附录E)。初步发现表明,就词类使用频次分布而言,每一位人物的确与其他人物之间存在差异性,而且这种差异性在青少年阶段比之后的阶段表现更明显。在本章最后部分,研究者对每一位人物的词类使用统计结果做了比较详细的介绍。

Balossi在本章最后也指出了现有研究的一些局限性。比如,如果对多个变量采用多因素分析或聚类分析的统计方法,就可以将各个因素之间的相互关系展示在一张图表上;尽管对数似然统计检验中个别数值体现出一定的显著性差异,但并不能从总体上说明两个比较项之间存在显著性差异。现有关于词类使用频次分布情况的比较只能说明一些细微差异,在一定程度上说明伍尔夫在形态句法层面对人物的个性化语言存在有意识的驾驭。

第7章是对人物独白语言中语义场的考察,目的在于发现语义场使用是否能够有效区分个性化的人物。Balossi以Culpeper(2001)人物塑造的认知模式为理论框架,将人物视为文本与读者背景知识相互作用的结果,读者对作品中人物的认识包含自上而下和自下而上两种认知过程,其中自上而下的认知过程主要受性别二分法的社会图式影响,自下而上的认知过程主要涉及文本所提供的线索,在本研究中就是人物相对过度使用的语义范畴。定性分析部分主要依据认知隐喻理论,根据每位人物言语中的认知隐喻类型,来揭示每位人物的个人化世界观(the idiosyncratic world-views)。

许多批评家认为,尽管《海浪》发表于20世纪30年代,但这部小说依然深受英国维多利亚社会价值观和思想的影响,体现性别方面,就是认为女性生来就是要做家庭主妇、贤妻良母,男性生来就是要接受大学教育,拥有职业和社交生活。这种性别思维定势可用来解释小说中的人物形象。Balossi将小说《海浪》中的人物分成女性(Susan、Jinny和Rhoda)和男性(Louis、Neville和Bernard)两组,并分别对每一位人物突出使用的语义场进行统计分析,进而对语义场与人物性格间的关系做了阐释。以三名女性为例,Susan言语中涉及的语义场主要包括自然界、房子、与家庭相关的活动、作为妻子或母亲的角色、时间和感官六类;Jinny的语义场主要包括身体、色彩和运动三类;Rhoda的语义场主要包括自然界、运动、情感、形状和色彩五类。Balossi指出,三位女性人物言语中的使用较多的语义场揭示了她们所关心的事物表现出一定差异,这些差异反过来也说明了她们之间存在性格差异。以Susan为例,她使用最多的语义场是与自然界相关的词语,尤其是与土地、植物和动物相关的词语。这些语义场所包含了Susan所使用语言中隐喻的源语域(source domain),Susan正是通过这些隐喻来投射自己的情感的。事实上,Susan本人来自乡村也生活在乡村,并且非常眷恋自己的出生地,因此不热心社交生活,而是偏爱对外部世界具体体验的感觉。从她使用的其它语义场,还可推知她的兴趣、习惯、个性以及个人志向等。她的这种性格特征也符合人们对于二十世纪前半叶女性社会角色的思维定势。对Susan所使用语义场的历时分析表明,尽管Susan的社会角色完全符合人们对当时女性的一般认识,但可以发现,在Susan的个人志向(做一个贤妻良母)实现以后,其内心已经发生了变化,最终表现为对自己选择的一种强烈不满。

尽管统计分析表明三名男性人物所使用的语义场也存在一定差异,Louis使用较多的是地理名称、人物与人际关系、自然界、历史和文学,Neville主要是文学与哲学,以及研究兴趣,而Bernard更多涉及的是认知与抽象,以及学术兴趣,但不难看出,他们之间存在一个相似之处,那就是对写作和阅读的兴趣。尽管如此,对其它语义场的分析表明,他们属于不同类型的人物。研究者将Louis过多使用地理名称、人物与人际关系方面的语义场解释为其两种突出的性格:一种源于作为殖民地居民的深深自卑感(如使用较多的“Australia”、“accent”等),另一方面是他对自己作为英国上层阶级一部分的身份感到厌恶(如使用较多的“try/tried”等)。并且这种性格特征一直保留在其生命里,尤其是在其求学期间。六位人物的性格差异体现在语言使用方面的差异,这些语言使用差异可能是由以下因素造成:(1)真实的/假定的社会出身(中产阶级和上层阶级);(2)性别(男-女);(3)所受教育(女性受教育时间较短,男性受教育时间较长且更具学术性);(4)个人经历(婚姻状况、职业、社会关系以及所置身的社会环境);(5)性格特征。《海浪》中的第七个人物Percival与其他六位主要人物完全不同,关于Percival的所有信息完全是通过他人之口来展示的,因此研究者未对其做语法或语义分析。但Percival在Bernard、Neville、Louis、Rhoda言语中被提及的频次很高,Jinny言语中提及三次,Susan仅一次,读者可以从其它人物的言语中得知Susan是Percival所爱的人。Percival的个性正是通过这种间接的方式得以呈现。

对《海浪》中人物话语的定量与定性分析表明:六位人物的语言的确存在各自的个性化特征,语言的差异说明他们之间存在性格的差异;每位人物在其人生各个阶段所使用的语言也存在一定的历时变化。共时比较与历时比较的研究结果表明,伍尔夫用表面看似“统一”的语言风格,塑造了六位拥有自己性格的人物,同时,让每位人物在其人生各个阶段使用的语言也表现出一定的历时变化,说明了人物的成长历程。

第8章是本书的结论部分,Balossi从研究方法、内容与发现等方面对本研究做了总结,并指出计算机辅助方法用于文学作品个性化人物塑造研究的优势,此种方法还可进一步应用于各类文学或非文学文本中的人物研究。

本书在书目之后还附有一些相关研究期刊网站和在线的语料标记及处理软件,以及包含14个附录近70页的数据(部分数据可通过链接下载获得,如Appendix C. ALLCHRS POS & USAS),统计十分详实,可供读者参阅。

近年来已涌现出大量借助语料库量化实证方法研究文学文本语言文体特征的研究,此类研究通常被冠以“语料库文体学”(corpus stylistics),主要关注特定作家、特定文本或特定作品中某位人物的词语分布特征,考察方法主要包括关键词分析、扩展词汇短语(词簇或词串等)分析,以及搭配分析(Biber 2011:16)。本书从研究内容到研究方法带给我们诸多启示:

首先,树立研究中的问题意识,不人云亦云。学者们对伍尔夫作品《海浪》人物塑造手法存在较大争议(参见2.2.4),Balossi的研究正是围绕这些争议提出了自己的研究问题:是否能够通过小说中人物的语言来区分其性格特征;是否能够根据人物在其人生不同阶段使用的语言来发现他们的历时成长。通过这样的考察,还可以探究伍尔夫作品塑造人物的方法,并与伍尔夫本人关于小说人物塑造的思想相互应证。这种从文本出发的研究思路,从一开始就为本研究的效度奠定了基础。

第二,树立跨学科意识,不局限于一种思维方式。关于文学作品中人物塑造的研究是文学研究领域的传统课题之一,通常都是通过语言或话语分析从表层到深层来揭示人物性格特征的。然而,语言是人类各种活动中一种极为特殊的现象,涉及的影响因素纷繁复杂,对于一种语言表现方式,仅仅依靠一种方式进行解释远远不够。Balossi的研究中综合运用了文学理论、认知语言学、认知文体学、社会心理学、语料库语言学等诸多理论,从多个视角讨论语言、人物塑造和性格之间的关系,各种理论之间互为补充、交叉验证,保证了研究的信度。研究中的跨学科意识开阔了研究者的思维,充分体现出跨学科研究方法的优势,这一点在任何研究中都是值得借鉴的。

第三,对于传统问题的探究可另辟蹊径,对新方法、新技术,保持一种开放的研究心态。Balossi在本书序言中就指出,尽管计算机辅助的方法已经在很多学科领域普遍应用,但文学批评却在很长一段时期对计算机技术持拒绝态度。Balossi的研究让我们可以清楚地看到,计算机技术应用于文学文本分析,可以帮助我们发现一些仅凭肉眼观察或想当然所无法注意到的现象。除传统的词类频次分布考察外,Balossi的研究还集中关注了人物语言中的语义场及其中蕴含的认知隐喻,借此来探索不同人物之间的差异。因此对任何传统问题的认识,我们都可采用新的方法来重新加以审视,这同样也是保证研究创新性的一种方式,即方法的创新。这就要求我们对待本研究及相关研究领域的新方法、新技术,要有一种开放的心态。

第四,对定量研究与定性研究应当有正确的认识,定量与定性相结合。传统的文学研究以定性研究为主,计算机辅助的文学语言和文学文本分析可以为相关研究提供各种统计数据,尽管这些数据不能代表研究的全部,但的确能够为我们提供一些研究思路。问题的关键在于,我们需要对统计数据做出合理的、具有说服力的阐释。另一方面,定性分析依然占有不容置疑的地位,但主观的、印象式的、抽象的结论会欠缺一定的说服力,定性讨论必须有理有据。也就是说,我们不能过分夸大定量分析的作用,用数据来代替研究,同时也不能否定定性分析对问题做出的合理判断,即便是量化分析数据的解释,也需要做质性的分析。因此,在研究中应当遵循定量与定性方法相结合的原则,既要让客观的数据“说话”,同时还要辅以研究主体的“推理”与“判别”。


扫码购买

8折:52.8





提示:如需购书发票,请在地址栏下方留言处自行备注抬头、税号

主要参考文献

Balossi, Giuseppina. 2014. A Corpus Linguistic Approach to Literary Language and Characterization: Virginia Woolf ’s The Waves[M]. Amsterdam: John Benjamins.

Biber, Douglas. 2011. Corpus linguistics and the study of literature: Back to the future? Scientific Study of Literature 1(1):15-23.

Culpeper, Jonathan. 2001. Language and Characterisation: People in Plays and Other Texts[M]. Harlow: Longman.

Fischer-Starcke, Bettina. 2010. Corpus Linguistics in Literary Analysis: Jane Austen and her Contemporaries[M]. New York NY: Continuum.

Hori, Masahiro. 2004. Investigating Dickens’ Style: A Collocational Analysis[M]. Basingstoke: Palgrave Macmillan.

Love, Harold. 2002. Attributing Authorship: An Introduction[M]. Cambridge: Cambridge University Press.

Mendenhall, Thomas Corwin. 1887. The Characteristic Curves of Composition[J]. Science (11): 237-49.

Toolan, Michael. 2008. Narrative Progression in the Short Story: A Corpus Stylistic Approach[M]. Amsterdam: John Benjamins.

黄立波. 2018. 语料库译者风格研究反思[J]. 外语教学 39(1): 77-81.

 本系列其他著作


推荐语:本书作者运用关联理论研究网络语境下的交际行为,由此提出“网络语用学”(cyberpragmatics)的概念。本书首先分析了网络交际中的身份构建和人际关系,接着从认知语用学的视角探究了不同的网络交际模式。此外,作者还针对网络语境下的交际新特点,对关联理论进行了局部的适应性修正,比如提出了针对信息处理的认知回报等问题,以此丰富对关联性的认识与理解。书中提供了大量的文献资料和语料支持,帮助读者全面了解不同的交际方式及其认知语用机制。


推荐语:
本书分别从认知语言学,文化语言学和语言人类学三个视角来探讨语言、认知和文化,提出文化语言学的理论框架,强调语言、认知和文化的学科交叉性,主张多元化的研究方法。本书还回顾了过去30年有关文化认知模型的研究,探讨了图式与文化认知模型的关系,并对学科交叉进行展望。本书特点在于打破了认知语言学早期理论的高度封闭性,开创性地引入了社会、历史和文化等因素推荐语:本书作为学科间的界面研究,试图从认知科学的角度解读文本,探究其中的语言、文化和美学观点,全书主要关注五个方面,它们分别是自身的本质,语言的艺术和科学,叙事小说的主人公视角,美学的科学探究,文本中的历史、文化、政治和种族。作者是语言与认知科学领域的两位专家,在书中他们侃侃而谈,旁征博引,观点时有不同,有时又互为补充,使读者在阅读的同时仿佛享受两种思想的交锋,生动有趣,充满思辨。推荐语:本书基于认知心理学和脑科学的研究成果,开创性地研究了年轻读者对小说的认知和情感投入,探索了小说如何激发感知、注意力、想象力和其他认知活动,并为年轻读者开拓了全新的文学思维方式。作为认知批评研究的一个重要里程碑,本书提供了令人信服的实证,证明阅读小说对于年轻人的智力、情感和社交发展是不可或缺的
推荐语:列维的这部著述主要是基于文学翻译问题的理论探讨,但其框架和基础却是调和翻译研究中"二元对立"观念的尝试。其中既有将译作视为文学文本的分析,又有符号学和功能学派的语言学理论作为理据;既考量文本存在的历史语境及其一般特征,又关注文本内部的结构与自足的文体特点;既谈文学、美学的有关问题,又不离开翻译的讨论核心;既有充分的理论借鉴,又始终立足于具体的文学翻译实例。书中所举例证,并非在向读者展示文学翻译的所谓"规范"(norm),而是作为一种参考和指引,并以讲究均衡与辩证的捷克结构主义作为理论支撑。这部著作本是翻译学研究中文化学派的早期研究文献,其认识论吸收了阐释学的有关原理,方法论则立足于布拉格学派的结构主义方法,更多地侧重于翻译实操中文学文本的解读对翻译过程所起的影响


网课:遇见文学的黄金时代

网课:谁在书写我们的时代


专著推荐|  最容易读懂的SFL原版教科书:David Banks著 A Systemic Functional Grammar of English

专著推荐 | 甄凤超:《语料库驱动的短语配价型式研究》

专著推荐 | 甄凤超:《基于语料库的中国学习者英语特征研究及应用》

专著推荐 | 朱一凡:基于语料库的英汉翻译对当代外语影响的研究

专著推荐 | 黎昌抱 《基于平行语料库的文学自译现象研究》

专著推荐 | 胡开宝教授团队《语料库批评翻译学概论》

新书推荐| 郭鸿杰:基于语料库的加拿大英语和英国英语强化词变异比较研究

文学解读 | 作家苗炜:《文学体验30讲》

文学悦读 | 《最后的访谈》:那些曾获得诺奖或落榜的名作家们

专著推荐 | 到底谁是“迷惘的一代”?杨早:《对决人生:解读海明威》

查询本公众号历史消息方法如下:



扫码关注我们

外联邮箱:dianzishu@126.com

新浪微博:珞宾王


点“在看”给我一朵小黄花

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存