好文荐读|郑伟、刘婧婧:人工智能与大数据时代多维度的语言运用研究
好文荐读(第102期)人工智能与大数据时代多维度的语言运用研究。
“好文荐读”不定期更新,为大家带来最新的核心期刊亮眼论文,希望大家多多支持,也欢迎给我们留言推荐更多值得一荐的好文哦~
华东师范大学中国语言文学系/语言认知与演化教学实验室
文章简介
文章来源:郑伟,刘婧婧.人工智能与大数据时代多维度的语言运用研究[J].当代修辞学,2024(02):45-59.
摘要:人工智能、大型语言模型等科技浪潮给语言学带来了研究范式的革新,也给聚焦于语言运用能力探索的修辞学、语用学等相关学科构建了异于传统风格的研究维度。文章首先评述了近年来计算机科学与技术对自然语言中语用含义的生成与理解的研究;其次阐述了从语言生理、认知心理等普遍机制层面展开的基于言语障碍的神经语用学、儿童语言运用能力研究;再次从个案分析和研究趋势两方面,介绍了基于泛时观与大型语料库的语言运用研究;最后就语言运用在大数据时代应有的研究理念、范式与目标作了总结与展望,并强调从语言结构出发,以认知心理和语言生理为研究方法的必要性。
关键词:语言运用;语言生成与理解;人工智能;多维度研究;语法能力与语用能力;
基金项目: 本文是国家社科基金重大项目(项目编号:18ZDA296)、国家社科基金专项项目(项 目编号:23VTS013)、上海市教育委员会科研创新计划人文社科重大项目(项目编号:2019-01-07-00-05-E00049)、华东师范大学新文科创新平台建设项目(第二轮)(项目编号:2022ECNU-XWK-XK005)的阶段性成果。感谢《当代修辞学》授权推广,全文下载请点击文末“阅读原文”。
一.人类之“心”与机器之“心”:言外之意的生成与理解
人工智能(artificial intelligence,AI)时代的核心话题是计算机智能与人类心智(mind)的互竞与博弈,机器语言对人类自然语言的模仿是其中最重要的一环。因发现DNA结构而获得诺贝尔奖的英国物理学家和生物化学家F·克里克(Francis Harry Compton Crick)曾提出一项“惊人的假说”,即“我们的精神(大脑的行为)可以通过神经细胞(和其他细胞)及其相关分子的行为加以解释”(克里克2007:8)。这一观点实是渊源有自,笛卡尔的“身—心二元论”便已经主张“内在语言”存在于人类的心灵之中,它有别于人类的自然语言。理性主义哲学家康德(Immanuel Kant)认为人类生来就具有一些知识的内置模板,也就是先验知识,它们决定了感觉经验如何被接受以及被理解。很明显,这些观点后来成为乔姆斯基提出“普遍语法”(universal grammar,UG)的哲学基础。
英国生物学家达尔文(Darwin 1871:57)从进化论出发,于19世纪后期提出“远古的人类老祖先,一定早在开始运用最不完美的言语形式之前,就已经比任何现存的猿类都具备更高度发展的心智能力;然而,我们也许可以自信地认为,持续地运用与提高这种能力,应该也会对心智产生作用”。笛卡尔曾认为意识为人所独有,但随着进化论的出现,我们已经清楚地认识到,意识并非人类独有,而语言确实又是人和其他动物最重要的区别。职是之故,若要探讨作为精神行为之一的智能/心智问题,不管是人类之“心”(人类智能)还是机器之“心”(人工智能),语言与语言运用(language usage)无疑是最重要的切入点和突破口之一。
人类语言信息的计算建模是人工智能时代重要的研究领域,也是人机交互(human computer interaction)得以实现的基础和前提。从图灵测试(Turing test)开始,机器能否在对话中表现得像个人类便成为机器“智能”与否的判断标准(Turing 1950)。显然,自然语言的交互功能是智能发展的关键方面,计算机科学与人工智能研究也一直在理解和生成自然语言的道路上持续前进。随着科学技术的进步和计算机性能的提升,自然语言处理的领域经历了多个阶段的快速变革。早期的自然语言处理(NPL)试图基于人工编写语言规则来实现言语交互,诞生于麻省理工学院的著名的SHRDLU正是早期基于规则理解自然语言的程序的代表(Winograd 1971)。随着计算机算力的提升,基于大规模语料库的统计方法得以实现,例如Ngram语言模型就是基于统计的算法(Jurafsky & Martin 2008 /2018:69—101)。随后,支持向量机(support vector machines)等机器学习(machine learning)的方法在自然语言处理的任务中取得了突破性成功(Cortes et al. 1995),研究者们开始用更复杂的特征和算法来跟进语言处理。深度学习(deep learning)的方法进一步推动了自然语言处理技术的发展,例如“递归神经网络”(recurrent neural network,RNN)(Rumelhart et al. 1986)和“长短时记忆网络”(long short-term memory, LSTM)(Hochreiter et al. 1997)的应用,神经网络的研究成果让自然语言处理取得了显著的进展,同时也为机器翻译等商业领域做出了重要贡献(Wu et al. 2016)。
到了被称为“人工智能元年”的2018年,预训练模型在理解语言的深层含义方面迈出了重要一步,谷歌公司的BERT模型(Devlinetal.2019),以及OpenAI的GPT模型(Radfordetal.2018)都是通过大规模的预训练,使得模型能够更好地理解和生成自然语言,从而提高了人机交互的体验。从图灵的“模仿游戏”到具有革命性意义的大语言模型,随着计算机算力的不断提升和算法的迭代优化,人类也愈加靠近人与机器无缝交互的想象世界。
1.1 自然语言处理对语言风格的理解
语言信息在计算机编码中的技术飞跃激动人心,但要让计算机更全面、准确地理解自然语言,从而接近人类的语言理解水平,仍然需要付出巨大的努力。将自然语言处理中的技术突破聚焦在更为具体的语言分析当中,对于不同语言风格的理解和生成便是其中的关键。
人类语言中往往包含着极其复杂且相互关联的信息,丰富的修辞手法和隐含的言外之意普遍存在,而这对于自然语言处理来说是不小的挑战。自然语言处理的过程从文本出发,通常是经过分词(tokenization)、词性标注(part-of-speech tagging)、语法分析(syntactic parsing)来实现语义分析(semantic analysis)这一核心任务。若要理解更多隐含在文本之外的语言风格信息,则对上下文结构和整体背景的理解提出了更高的要求,这也是实现高级语义分析和人工智能任务的关键。比如人类语言的修辞往往意味着说话者所说的内容和意图表达的内容之间存在差异,自然语言处理要理解说话者实际语义则需要弥合这种文本到语义间的空隙。按照自然语言处理中基础的语义分析来看,对含有修辞表达的语句进行直接分析并不能获得全部含义,这就要求结合更多的语言学、认知科学与计算机科学的知识来共同助力自然语言处理。
以我们常见的隐喻(metaphor)为例,它往往使用字面上毫无关联的事物或者概念进行类比,隐喻的识别一直是自然语言处理中的难点和瓶颈之一,在情感分析和机器翻译等任务中充满挑战。早期的研究基于语法规则和“词网”(WordNet)(Christiane 1998:1—19)中的信息,对于句子是否包含隐喻进行判断和识别。其后,舒托娃(Shutova 2010)使用谱聚类(SPEC)(Brew et al. 2002)的方式,利用英国国家语料库(BNC)的材料,提出了新的隐喻识别系统。
随着大规模语料库的建设,CorMet系统实现了从大语料库中获得不同概念间的隐喻映射(Mason 2004)。还有基于相似度的隐喻识别算法,如基于句子相似度计算的Trope Finder(TroFi)系统(Birke et al. 2006)和基于词义相似度的PMWs.方法(Nissim et al. 2003)。深度学习的方法和预训练模型也陆续用于隐喻的识别和检测,例如基于目标注意力的长短期记忆网络(TRAT-LSTM)进行的中文隐喻情感分析(Peng et al. 2018),以及运用无监督学习的方式并基于预训练模型BERT的语言模型来预测隐喻的字面对应。
幽默(humor)是人类语言中普遍存在且富有创造性的表达,这同样为自然语言处理中的计算编码提出了难题。识别笑话,是高级人工智能领域才能完成的任务。早期的幽默识别主要利用语言学特征来提取进行分类识别,米哈尔恰和斯特拉帕拉瓦(Mihalcea & Strapparava 2006)则使用自动分类技术,提取短句俏皮话(one-liner)语料中的头韵、俚语为特征,建立了幽默和非幽默的数据集来搭建幽默风格识别的计算模型。此外,还有利用情景喜剧中幽默对话的语音、韵律特征(Purandare et al. 2006)或社交网络语料中的句法、语用特征(Raz2012)来实现的幽默识别,杨笛一等(Yang et al. 2015)则利用幽默背后的几种语义结构为特征,由此计算和识别幽默。深度学习的模型为识别幽默提供了更丰富的资源,奥利韦拉和罗德里戈(Oliveira & Rodrigo 2015)的研究首次利用基于神经网络的深度学习框架进行幽默识别,学习了Yelp(美国点评网站)中的评论文本,改进了传统的方法。并且,在深度学习应用中,使用卷积神经网络(CNN)模型的自动幽默识别能够扩展到不同语言(汉语和英语)、不同类型笑话的有效识别(Chen et al. 2018)。预训练模型逐渐普及后,这种从海量数据中学习到的强大的理解能力也运用到了幽默识别中(Rodriguez-Muro et al. 2021),预训练模型的幽默理解能力在不断调整中提升。就面向中文的幽默理解来说,研究表明,加入汉语拼音等语言学知识对于处理相应任务的预训练模型有着积极的影响(Chen et al. 2023)。当然,由于幽默涉及个人和文化主观性及无数子类别,计算幽默识别系统的适用性仍然受到限制(Ramakrishna et al. 2018),跨语言的幽默识别与分析仍然存在挑战,在机器翻译等领域需要进一步提升(Tamayo et al. 2023)。
关于反语、曲言等修辞格的计量研究相对较少,它们是通过具有否定意义和负面意思的词来表达积极的含义,通常用作委婉的表达,实现一种轻描淡写或者是反讽的效果,具有丰富的言外之意(Lanham 2012:95—96)。在面向曲言(litotes)的建模中,近来的研究结合认知模型中的意象图式理论,取得了良好的分析效果,也为理解修辞表达的计量分析提供了有趣的思路(Mitrovic' et al. 2020)。
1.2 自然语言的生成与语言风格迁移
我们期望计算机能够在不同的场景下都准确、流畅、自然地生成语言,这其中可能涉及的一个有趣且具有挑战性的问题,就是语言的风格迁移(style transfer),亦即将文本从一种语言风格转换为另一种语言风格,改变表达方式、语气或文体,同时仍然保留原文本的内容和结构。
作为自然语言处理中较为复杂和高级的领域,风格迁移的量化研究是人工智能是否取得进步的重要标准。人类语言除了语义表达,还有丰富的个性化特征,诸如不同的文学体裁、情感倾向等(Enkvist 2016)。自然语言生成中同样需要有差异化的写作风格和文本特征(Syed et al. 2020)、不同的年龄或性别(Subramanian et al. 2019)、礼貌程度(Madaan et al. 2020)等特征。从某种程度上说,语言风格迁移也是一种特殊的机器翻译,将一种语言风格翻译成另一种语言风格,语言风格迁移研究更复杂的方面在于缺乏机器翻译领域那样丰富的平行语料,而需要对非平行的数据加以学习和评估(Fu et al. 2018)。
近年来,深度神经网络在语言风格迁移的研究中成为主流,先进的风格迁移模型主要是基于非平行语料库的半监督甚或无监督学习。如张志锐等(Zhang et al. 2018)将语言风格迁移作为无监督的机器翻译,利用基于注意力的神经机器翻译(neural machine translation)的风格迁移模型,探索所“翻译”句子的风格属性(Sutskever et al. 2014)。Yu et al. (2020)则提出了一种生成对抗网络(unified generative adversarial networks),旨在减少训练时间的前提下实现多向的文本风格迁移。预训练模型的使用进一步提升了语言风格迁移的效果,戈亚尔等(Goyal et al. 2021)将多个判别性语言模型与基于语言模型的编码器—解码器相结合,实现了多种语言风格的鉴别以及对多个目标语言风格的重写。
二.语言使用能力的普遍机制: 生理与心理维度
语言运用( 或表达) 是人类的语言能力( language competence) 的一种具体表现,同时是涉及“说者—听者”( speaker-hearer) 的信息编码与解码的动态过程。乔姆斯基( Chomsky 2000: 26) 在笛卡尔哲学思想的启示下,主张将语言能力解释为存在于脑( brain) 或心智( mind) 中的“内在性语言”( internal-language) 。作为代表“语法能力”( grammatical competence) 的“I-语言”,区别于代表概念组织的“语用能力”( pragmatic competence) 。在形式语言学派看来,语言表达反映的并非语法本身的属性。符号学理论认为,语法学的研究对象是符号与符号之间的关系,而语用学的研究对象则是符号与符号使用者( 或解释者) 之间的关系,二者有明确的界限。生物语言学、形式语言学、心理学、认知神经科学等相关学科都很关心语言生成与理解的生物( biological) /神经( neural) 基础。乔姆斯基( Chomsky 2000: 1—2) 明确主张语言的生成与理解( “语言能力”) 是“脑 /心智”功能的重要表征,并将其视作心理机制及生物机能的一部分。
理解说者的表达意图,在言语交际中是一件极复杂的任务,牵涉到包括情感表达在内的诸多复杂信息。从人的语用处理出发,探寻隐喻、讽刺、幽默等语言表达中人在理解言语沟通这一复杂过程背后的神经机制,体现了语言运用的生理维度。大致来看,有两个方面的研究与之直接相关: 第一,基于临床观察与诊断的言语障碍研究,即语言运用能力的“丧失性”研究; 第二,基于儿童语言习得( 当然也包括可能伴随的言语障碍) 的动态过程,即语言运用能力的“获得性”研究。
2.1 语言运用能力的言语障碍视角
临床研究发现,大脑右半球损伤的患者在理解更深层次的语言信息方面存在困难( Critchley 1991) ,例如右脑损伤的患者比失语症患者更难理解副语言情感线索( Weintraub 1981) ,以及右脑损伤患者对于隐喻、幽默等修辞表达的理解也存在问题( Winner et al. 1977; Brownell et al.1983) 。卡普兰等( Kaplan et al. 1990) 则发现,右半球损伤会导致患者在识别虚假的话语的语用意图时出现偏差。右半球损伤的患者在语用测试中的表现也更为弱势( Cutica et al. 2006) 。这些脑损伤研究都倾向于支持语用处理具有右半球偏侧化( lateralization) 的观点。
随着脑成像技术引入语言学研究,我们进一步了解到语用处理与大脑两个半球的不同的作用,超越了原有的“右半球假设”,发现双侧皮层都在处理语用现象( Bambini et al. 2011) ,尤其是额颞叶和内侧前额叶区域( Bohrn et al. 2012; Reyes-Aguilar et al. 2018) ,前额叶( prefrontal lobe) 和颞顶( temporoparietalis) 联合区域等脑区也在理解他人答复时做出贡献( Bašnáková et al. 2015) 。
语用性言语障碍在精神类疾病中较为常见,患者在言语交流中对语用信息的理解往往存在困难。最近的研究表明,神经发育障碍中的语用障碍,尤其是在儿童的自闭症谱系障碍( autism spectrum disorder) 中最为严重( Reindal et al. 2023) 。精神分裂症( schizophrenia) 在社会认知上的困境也带来语用能力受损,会对理解幽默与讽刺等语用层面的表达产生困难( Schnell et al.2016) 。
巴拉( Bara Bruno G. ) 的科研团队以闭合性头部损伤患者( Bara et al.1997) 、普通和脑损伤儿童( Bara et al. 1999a) ,以及阿尔兹海默症( Alzheimer’s disease) 患者( Bara et al.2000) 等沟通能力存在不同缺陷的被试为例,以神经科学( neural science) 的研究范式来验证言语交际理论。研究发现,脑损伤的受试者对直接言语行为和间接言语行为的理解没有差异,这与言语行为理论中间接言语行为比直接言语行为更难理解( Searle 1975) 的观点有所不同。Bara et al. ( 1999b) 认为言语行为应当以“简单”和“复杂”来进行区分,这比直接言语行为与间接言语行为的概念更具有普遍性,而且在认知加工的实验中能够得以印证。
言语行为中的语用处理还在基于神经电生理技术的研究中得到进一步探索。例如研究表明,语用信息能够在早期得到快速地处理,与其他语言信息并行( Marslen-Wilson & Komisarjevsky1975; Marslen-Wilson 1987; Strijkers et al. 2017) ,但是限制条件是交流过程中语用和语义信息都可感知时,人脑才会发生快速的语用处理,从而理解说话者的意图( Tomasello et al. 2019;Tomasello 2023) 。
总体上说,神经语用学( neuropragmatics) 给传统语用学研究提供了新的研究范式和论证方法,也为语用学理论开辟了具有心理现实性层面的解释路径,加深了对语言使用、语用意义构建及其神经基础的理解,从而为语用信息的生成( 产出) 和理解( 感知) 所涉及的认知和神经过程提供了切实的见解。
2.2 语言运用能力的语言习得视角
行为主义先驱斯金纳( B.F. Skinner 1957: 23—24) 最早从后天的环境影响来讨论语言习得,他认为儿童是按照行为主义的模式来模仿成人的语言,他们正确的模仿会得到积极的强化,错误的模仿则不被强化,由此来习得语言。乔姆斯基( Chomsky 1965: 25—36) 认为人脑具有一种专门的语言官能,使得儿童能够迅速地学习和产生语言。勒纳伯格( E.H. Lenneberg1967: 175—182) 提出了著名的语言习得关键期假说。
儿童的语用习得是一个极复杂的过程。孩子们必须识别出各种语言元素的功能和它们的形式与意义的对应,以及如何使用、何时使用这些语言元素,这在儿童语言习得的过程中是一个非常重要的过程( Clark 2014) ,儿童正是在大量的言语交互中不断学习如何使用语言。他们在很早的阶段就开始关注如何正确地使用语言( Dore 1974) ,甚至在开口说话前就已经在积累语用技能,关注人际交互中的手势、眼神等( Marcos 2001) ,并且能很快学会用手势和韵律作为先于言语的语用表达方式,表示请求、礼貌等不同的信息( Hübscher et al. 2019) 。
语用习得作为复杂的语言使用能力,还牵涉到儿童认知神经方面的发展和表现。普罗尼那等( Pronina et al. 2021) 调查了使用加泰罗尼亚语( Catalan-speaking) 的 3 至 4 岁的儿童使用韵律来表达语用意义的情况。研究表明,学龄前儿童能够以广泛的韵律策略来表达不同的语用意义,儿童在语用韵律知识上的获得,与“心智理论能力”( theory of mind[ToM]ability) 的发展有一定关系( Leslie 2001) 。
神经发育障碍的儿童患者的语用能力发展也被广泛关注。例如,相比特定型语言障碍( specific language impairment,SLI) 的孩子,自闭症谱系障碍( autistic disorder,ASD) 和注意缺陷与多动障碍( attention deficit and hyperactivity disorder,ADHD) 的儿童都具有更严重的语用困难。自闭症儿童的执行功能、注意力以及语言使用和社交沟通能力之间均存在关联( Howard et al.2023) 。多动症( hyperactivity) 儿童也比正常发育的孩子表现出更多的语用缺陷,这可能是他们社交障碍高发的原因之一,这对于多动症儿童的治疗和问题预防有重要意义( Staikova et al.2013) 。除了临床诊疗外,这些研究也对神经基础和语用能力发展的关系提出了挑战。
和听力正常的孩子相比,听力损失儿童的语用能力总是相对匮乏的( Lederberg et al. 2000) ,这些孩子往往需要更多的关注。牟斯特等( Most et al. 2010) 比较了使用人工耳蜗、使用助听器的听障儿童与健听儿童三组儿童的语用能力,使用助听器组的儿童存在更多的弱势。显然,听力损失儿童的语用能力需要在康复中得到更多干预,比如由医疗专业人员监测听障儿童的语用发展,进行专业地评估和指导( Toe et al. 2020) ,制定有针对性的教学策略,以培养特定的语用能力,来帮助他们成长( Goberis et al. 2012) 。
三. 语用功能标记的泛时性探索及其方法
语言运用在多个方面存在差异,时代、地域、人际、代际、交际方式( 口头/书面) 或交际对象的性别、职业、文化程度、社会等级等都能构成语用性的影响因素。社会语言学将“两个能指具有同一所指而他们之间的区别具有文体或社会等另外的功能时”所使用的“两种不同的形式”叫做“语言变体”。例如法语 toilettes( 盥洗室) 、lieux( 方便处) 、chinottes( 茅厕) 、W.-C. ( 厕所) 、petits coins( 方便间) 。在历时层面,“这些不同的词在使用过程中分布于各年龄层上: 比如,年轻人用petits coins,他们的父母辈使用 toilettes,而他们的祖父母一辈说 lieux”( 卡尔韦 2001: 78) 。
索绪尔开创的结构主义语言学,提倡“共时性”( diachronic) 与“历时性”( synchronic) 、“语言”( langue) 与“言语”( parole) 的二分法,与同时代的语言学家梅耶( A. Meillet) 的意见相左。后者所持的观点是“对语言的社会性的断言同时包含着对语言行为的内在研究法和外在研究法以及对语言行为的共时研究法和历时研究法的融合”( 卡尔韦 2001: 2) 。
明末学者陈第( 1993: 1) 所说的“时有古今,地有南北,字有更革,音有转移,亦势所必也”,是为打破语言历时状态与共时状态之间界限的理论性总结。语言是变动不居的,无时无刻不在变化之中,共时形式是历时变化的必然结果,历时变化则是共时状态的真实过程。拜比( Bybee 2010 /2020:118) 说: “语言变迁不仅仅是附加于共时理论的一种外围现象。我们必须把共时分析和历时分析视为一个互为关联的整体。变化既是观察认知表征的窗口,也是语言模式得以创造的源泉。”
将历时与共时相统一的是“泛时观”( pan-chronic) ,也就是“齐一性原则”/“均一性假说”( uniformitarian hypothesis) ,即历史上曾经发生的语言变化,在不同的历史阶段( 包括所谓共时阶段) 都有可能发生。从语言使用的角度,也可以说,同一语用功能( pragmatic function) 在某个语言的不同历史阶段,都有可能出现,同时会使用语义来源相同或相近的语用标记,或者遵循历史语言学的一般性原则而使用相关联的语用标记。
3.1 从形态到句法: 古今汉语代词的强调标记
古汉语有“吾、我”( 第一人称代词) 、“汝、尔”( 第二人称代词) 、“胡、何”( 疑问代词) 、“夫、彼”( 指代词) 等语法功能相近的代词。这几组代词中的前一个都是上古鱼部字,后一个则为歌部或支( 佳) 部字。在上古音阶段,鱼部字为零韵尾,歌部、支部另有* -l 韵尾( 有的学者主张该韵尾是* -j /-i 或* -r,总之与鱼部的韵尾相异) 。
胡适( 1922 /2013: 173) 借用印欧语的格标记范畴,认为大致上“吾”作主格,“我”作宾格,同时“我”字“有时亦用于主次( 引者按: 即主格) ,以示故为区别或故为郑重之 辞”。金 守 拙( G.Kennedy) ( 1956) 认为“吾”“我”是重读与非重读的分别。周法高( 1990: 73) 在同意胡适关于“吾”“我”主宾格之别的前提下,进一步认为“‘我’用作主语时,大体由于加重语气( 或者‘我们这一方面’的缘故) ”。尽管各家说法不一,但对“吾”“我”在先秦汉语文献( 以《论语》为代表) 中的功能分野并无疑义,而且汉语史界大体上都承认“我”与“吾”相比,强调性的语用功能较为突出。郑张尚芳援引亲属语言的语料,论证了古汉语“我”是“吾”的强调式的观点( 转引自潘悟云2001) 。藏缅语族独龙语“不仅强调意义与汉语相同,而且语音形式也相似”。
表1 独龙语第一、第二人称代词及其强调式
潘悟云( 2001) 在郑张先生的研究基础上,不仅讨论了“吾—我”类“基本式—强调式”的语音及语用区别,还指出以下人称 /指示代词的“强”“弱”对立:表2 古汉语人称/指示代词的语用分别
从上表可见,弱化式代词的主元音均为[ɯ]( 有些学者将这类韵母的主元音拟作* -ə) 。就实际音值而言,元音[ə]属于音色含混的弱化元音( “混元音”) ,而[ɯ]与[ə]在听感上最近。相较而言,作为强调式的[a]系代词,其前低主元音的音色则更清晰。承担“强调”这一语用功能,[a]系代词可谓适得其所。
在语言类型上,先秦汉语有着更多的分析性( analytical) 语言的特点,比如通过声母清浊交替、在词根上附加词缀( 词头或词尾) 、改变声调等方式,表达一定的语法意义。汉代以后,汉语的类型发生转变,随着语音的简化( 复辅音声母、前缀与后缀、声调韵尾等消失等) ,之前属于音节层面的形态交替手段,被词汇/句法手段所代替( 如使成式、动补式及其句法标记的出现) 。需要说明的是,我们这里所说的“语法意义”应作广义理解,实际上还应该包括“语用意义”。潘悟云( 2001) 已指明,上古汉语的“形态有两种,一与句法发生关系,……一与语用发生关系,……上古汉语的强调式与弱化式既与句法现象发生关系,也与语用有关”。“吾”“我”类代词的语用功能差异,是通过词法/形态层面的韵尾或主元音的不同而实现的。唐五代的汉语( 如佛教典籍《祖堂集》) 里有“是我、是汝、是渠”这样的代词强调式,且仍见于现代北部吴语。“是 + 人称代词”是跨层词汇化( lexicalization) 的结果。这一方面说明,代词在语用上有“强”“弱”之分的观点,在历时与共时层面、汉语与非汉语材料中都有切实的证据; 另一方面,如吉凡( Givón 2015: 25) 所说,“如果说今天的黏着语素就是昨天的词,那么今天的词法就是昨天的 句 法”( If today's bound morphemes are yesterday's lexical words,then today's morphotactics is yesterday’s syntax) ,但古今汉语的强调式语用标记的变化情形与西方语言似乎不同,而是形态( 词法) 型标记的出现在先,词汇/句法型标记的出现在后。
3.2 语料库语用学与泛时语用学
上文所举的古汉语代词表强调式或弱化语用标记的例子,其语用功能的辨析和历时演化的勾勒,主要仰赖于历代文献语料对相关代词的用例记录。随着大数据时代的到来,历时语用 学( diachronic pragmatics) /历史语用学( historical pragmatics) 探讨历时性变化,也可以在文献不足征的前提下另辟蹊径。尤克尔和塔维采宁( Jucker & Taavitsainen 2014: 7) 的导论性文章指出,传统语用学主要关心动态性的语言现象,早期的研究聚焦于当下的日常口语,语料包括音视频记录、访谈、问卷等,其获得的方式是发音人的直觉判断,或者是实际语言或录音材料的经验性转写; 方法论上,是定性的、经验性的。而大数据时代对于语言学研究来说,利用大型语料库、以定量与统计为基本方法是其鲜明特色,催生了“语料库语用学”“计算语用学”之类的交叉研究。如上述论文便使用了布朗语料 ( Brown Corpus) ,美式英 语历史语料库 ( The Corpus of Historical American English ( 2010— ) ) ,晚期英语语料库( A Corpus of Late English Dialogue ( 1560— 1760) ) 等 15 种大型语料库,当引入语料库方法与历时—共时结合的维度以后,Reber & Jucker ( 2023) 最近提出了可用于英语口语研究的众多大型语料库,包括 19 世纪后半叶以来的音频 与视频档案、英国国会的官方口头记录( 1803—2005) 、当代美国英语语料库( 1990—2019) 、影视语料库、肥皂剧语料库等。尽管这些语料库也有不足,比如不乏有文学加工的痕迹或政治文 化的风格倾向、语料的内容比较单调等,但总的来说,拿来作为探讨口语中一些常见语用变化 ( 话语标记、话语关系、话轮转换等) ,成效令人满意。
Taavitsainen et al. (2014) 在《编者序言》中说,新资料推动了研究问题的拓展和方法论的更新。我们在最近的一篇文章中也指出: “对于自然语言的直接调查仍然是语言学工作的重要部分。这些语言材料可以为人工智能提供数据集,作为机器的最佳学习素材,保证了人工智能获得系统的、可靠的、动态发展的语言数据。对语言学来说,……研究者必须要收集和探究真实语料,力图从中找到人类语言的共性或个性。”( 郑伟、尹嘉怡 2022) 正如上文所论,“共—历相通”的泛 时研究更符合人工智能时代依赖大数据语料集来进行语用标记功能研究的基本理念。
四.结语
4.1 信息传递和人际交往是语言作为符号系统的两种最基本的功能。
既然语言存在于使用它的人群之中,势必产生语言与使用者的关系,即语用表达的各种问题;言语行为受不断变动中的语言及非语言层面的环境制约,因此语用学与社会语言学、历史语言学有着天然的联系。乔姆斯基的普遍语法理论将语言(语法)能力、语用能力截然二分,并主张只有前者才是“语言官能”(“心智/脑”)的基本表征。如果承认语用能力是语言能力的重要组成部分,那么 势必要从生理、物理与心理三个层面对其作出普遍性解释。以学习与记忆的杰出研究获得诺贝尔生理学或医学奖的坎德尔( Kandel 2018: 227) 客观 地指出,尽管克里克对意识问题的探索持续了三十年,但对其机制的研究,并没有取得显著的成绩。作为以人类心智( mind) 、意识( consciousness) 为主要研究对象之一的认知神经科学和神经生物学,一旦将语言和学习( learning )、记忆( memory )、注意( attention)、思维( thought)、智能( intelligence)等精神活动都纳入研究范围,那么正视语言与其他人类行为( 包括语用行 为)之间不可分割的联系便显得尤为重要。人工智能和大数据作为鲜明的时代特征,如果只 是将其理解为计算机科学技术方便了人类的生活,未免过于狭隘。AI 技术的进步与革新,实 际上是为语言学研究提供了多学科、多维度发展的契机。必须看到,动物模型( animal model) 研究是探索包括语言及语言运用在内的人类复杂行为的重要参照。乔姆斯基与其他一些心理学家、动物学家持相同观点,认为语言能力的神经基 础是“拱肩”( spandrel)式的,也就是说它专门用于语言,且只用于语言( Pinker & Bloom 1990; Hauser et al. 2002)。但神经生物学家开展的动物实验表明,“大脑的每一项心理功能———从最简单的反射到语言、音乐和艺术领域富有创造性的行为———都是由大脑不同区域特异性的 神经环路实现的”。鉴于此,应该“使用‘心智生物学’( biology of mind)这个术语来表示由这些特异性的神经环路实现的一套心理操作,而不是用‘该心智的生物学’( biology of the mind),后者意味着全部心理操作是由单独某个脑区完成的”( 坎德尔 2019: 2)。所以说,大脑的语言加工机制遵循了“并行”“多层”的处理模式,与人工智能的神经网络是有可比性的。此外,语言能力的“天赋论”将经验主义排除在外,否认“学习改变大脑”,忽视语言能力是个模块性和可塑性并存的复杂适应系统,也很难得到动物模型的支持,“有机体许多行为的潜能 是先天内置于大脑的,并在很大程度上受到遗传和发育控制;然而,一个生物的环境和学习能够 改变这些预先存在的通路的效能,因而导致行为通过新的模式表达出来”( 坎德尔 2019: 216) 。 现代科学技术的发展日新月异,可谓“乱花渐欲迷人眼”,如何才能“柳暗花明又一村”? 答案就是:观念决定方法,材料决定思路。具备上述理性精神,语言运用的研究才能异彩纷呈。
4.2 人工智能、深度学习以及ChatGPT等大语言模型,只是研究自然语言问题的技术参照。
结构性、系统性、层级性是语言的基本特点。20世纪50年代以后,生成语法学派的出现 结束了结构主义一统天下的局面,但我们不能认为前者就完全摒弃或取代了后者。事实上,普遍语法理论受到了变换分析方法的启发,进而区分了深层结构与表层结构。我们赞同拜比( Bybee 2020: 233)对结构主义与语言运用的定位:“语言结构生发于语言使用过程。由此可见,使用语言的社会和文化语境对新结构的创生有一定影响。”换句话说,语言的结构与功能相伴相生。就语言系统内部而言,已有的研究集中于语用与句法、词汇、语义之间的关系( Hansen & Visconti 2009),学界对语用与语音/音系的互动似乎较少注意( 故而笔者在上文举了古汉“吾”“我”类代词的语用功能之别为例)。手势语言( sign language)与有声语言,在音系、词汇、句法等层面的系统性与结构性上,并无二致。对双语者在语用发展和认知优势方面的研究,也是值得深入探讨的论题。限于篇幅,将来再作讨论。
作者简介
个人简介:郑伟,男,江苏常州人,复旦大学语言学及应用语言学专业博士(2008.06),现任华东师范大学中国语言文学系教授、博士生导师、“紫江青年学者”,现代汉语教研室主任。《辞书研究》联合主编、《东方语言学》副主编及执行主编、中国民族语言学会理事、上海市语文学会理事。研究领域:语言认知与演化、汉语历史音系学、南方少数民族语言古文献与古文字、现代汉语方言等。
本文来源:《当代修辞学》
点击文末“阅读原文”可跳转下载推 荐
2024-05-26
2024-05-25
2024-05-21
2024-05-12
2024-05-10
2024-04-30
2024-04-26
2024-04-22
2024-04-20
2024-04-14
“语言学心得交流分享群”“语言学考博/考研/保研交流群”
今日小编:墨色深
审 核:心得小蔓
转载&合作请联系
"心得君"
微信:xindejun_yyxxd