查看原文
其他

翻译百科|《中国大百科全书》中的“语料库语言学”

梁茂成 翻译圈
2024-09-09


语料库语言学|Corpus Linguistics

《中国大百科全书》(第三版·网络版)发布了梁茂成教授撰写的“语料库语言学”词条。现转录如下,以资交流。


充分利用当代计算机技术,从语料库中获取各种语言信息的一种学习研究方法。最早由 J.阿尔茨( Jan Aarts,荷兰)和 T.范登赫维尔( Theo van den Heuvel ,荷兰)在《语料库语言学中的语法和直觉》( Grammars and Intuitions in Corpus Linguistics, 1982)中使用。


英文名称

学科体系划分
corpus linguistics 语料库语言学
创建人
代表著作
J.阿尔茨、T.范登赫维尔《语料库语言学中的语法和直觉》
所属学科

语言文字

阿尔茨最初使用这个词语,只想唤起人们对语料库价值的意识。因此首次使用时并未明确定义。进入21世纪,使用语料库进行语言研究已经极为普遍。


学界在"语料库语言学是什么"的问题上具有争议,核心分歧之一在于如何看待理论和语料库数据之间的关系。J.辛克莱领衔的伯明翰学派在学界具有影响。辛克莱认为,研究语言问题永远不能脱离语言事实,语言研究只能通过观察大规模语料库进行,使用语料库描写研究语言是一种全新的视角。任何忽略语言使用事实的内省研究都可能站不住脚,类似于研究植物学却只观察人造花卉。辛克莱不仅反对内省的研究方法,而且排斥实验方法,因为这些方法都并非基于真实的语言使用。在观察语料库之前,研究者不应带有任何先入为主的观点或理论去语料库中验证。据此,辛克莱进一步提出干净文本原则,认为标注语料库是将某种尚未经过语料库验证的理论植入语料库之中。经过几十年的发展,辛克莱提出以大型语料库为数据源、以短语和搭配为核心、以意义为研究目的观点,受一些研究者推崇。


其他学者持有不同观点。1959年, R.夸克(Randolph Quirk ,英国,1920~2017)开始英语用法调查( Survey of English Usage ),调入伦敦大学学院后,逐渐建成一个规模可观的口语语料库,后因数据采集困难,他通过诱发( elicitation )方法,刺激英语本族人进行对话,由此获取更多数据,弥补语料库的不足。在夸克团队看来,语料库是一种可靠的数据源。但不管规模多大,它终究只是一个有限的数据集,对英语语法进行全面描写时仍显不足。诱发数据始终是语料库数据的一种重要补充。通过语料库与诱发数据的结合,夸克最终建成一百万词的口语语料库。夸克对语言研究数据更为开放的态度被 G .利奇等人继承,逐渐形成称为兰卡斯特大学学派的研究团队。这一学派常以某种理论为基础提出某种假设,进而在语料库中加以验证,被大多数实证研究者推崇。


此后,E.托格尼尼﹣布内里( Elena Tognini - Bonelli )更明确地区分对语料库的两种态度,称前者为"语料库驱动的研究方法"( corpus - driven approach ),称后者为"基于语料库的研究方法"( corpus - based approach )。随着语料库被各种流派的语言研究者出于多种研究目的使用,两种研究方法间的区别逐渐淡化,研究者们也变得更为包容,认为语料库语言学兼有理论和方法的两面


作者简介

梁茂成,1964年生,南京大学应用语言学博士,北京外国语大学中国外语教育研究中心博士后,英国伯明翰大学访问学者。2008年人才引进入职北京外国语大学中国外语教育研究中心,2018年人才引进入职北京航空航天大学,现为北京航空航天大学外国语学院教授、博士生导师。担任国家社科基金通讯评审专家、教育部人文社科项目评审专家、国家留学基金委评审专家、中国博士后科学基金评审专家,国内外多家学术期刊审稿专家。多年以来主要从事语料库语言学研究和应用语言学研究,并设计开发多款语言分析软件,是iWrite英语作文智能评阅系统的总设计人。



文献来源

原文发表于《中国大百科全书》第三版网络版,欢迎各位学者阅读、分享



特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。

- END -



翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!


转载来源:《中国大百科全书》(第三版网络版)

转载编辑:王真真

核:吕欣潼、吴志雄

项目统筹:吕欣潼

资讯推荐


语料库库容设计


▶精品课程

精品课程|刘世界:6节语料库专题课,从入门到精通

精品课程|倒计时5天!实习证明、翻译项目,尽在四周暑期口笔译实习实践竞赛营!

精品课程|ChatGPT提示工程(Prompt Eng.)实践工作坊

精品课程|2023年暑期翻译技术实战研修班重磅来袭

精品课程|ChatGPT辅助翻译质量评估沙龙

精品课程|2023年暑期翻译技术实战研修班

精品课程|ChatGPT时代语料库与术语库建设与应用工作坊

▶翻译百科

翻译百科|《中国大百科全书》中的“法律翻译”

翻译百科|《中国大百科全书》中的“语料库模式分析”

翻译百科|《中国大百科全书》中的“自适应机器翻译”

翻译百科|《中国大百科全书》中的“翻译批评”

翻译百科|《中国大百科全书》中的“翻译规范”

翻译百科|《中国大百科全书》中的“翻译思维”

翻译百科|《中国大百科全书》中的“翻译对等”

翻译百科|《中国大百科全书》中的“翻译隐化”

翻译百科|《中国大百科全书》中的“翻译语料库”

翻译百科|《中国大百科全书》中的“翻译简化”

翻译百科|《中国大百科全书》中的“翻译伦理”

翻译百科|《中国大百科全书》中的“语料库翻译学”

翻译百科|《中国大百科全书》中的“翻译技术”

翻译百科|《中国大百科全书》中的“机器翻译”

▶译界动态

译界动态|第二届中英联合翻译学研讨会2号通知

译界动态|李长栓:用ChatGPT解决英译汉中的理解问题

译界动态|ChatGPT时代翻译技术教育创新论坛成功举办

译界动态|AIGC时代翻译教育创新与发展论坛2号通知(含直播通道)

译界动态|从书面到口头:AI口译的挑战与可能性

译界动态|GPT应用场景下语言服务与医学模型技术论坛——暨第六期新译大讲堂

译界动态|今日开讲:“识变应变,数智赋能——人工智能背景下的翻译教育创新发展”系列讲座

译界动态|2023年人工智能的一些顶级趋势

译界动态|王华树 刘世界:数字人文视域下译者数字素养研究:内涵、问题与建议

 关注我们 了解更多

CATTI和MTI资讯

语言服务就业信息

翻译名师真知灼见

翻译学习精品课程


继续滑动看下一个
翻译圈
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存