翻译百科|《中国大百科全书》中的“可比语料库”
可比语料库|Comparable corpus
《中国大百科全书》(第三版·网络版)发布了胡开宝教授撰写的“可比语料库”词条。现转录如下,以资交流。
可比语料库可分为单语、双语或多语可比语料库。双语或多语可比语料库一般收录具有可比性但不存在翻译关系的两种或两种以上语言的文本。这种语料库主要应用于语言对比研究。单语可比语料库指由某一种语言的原创文本和翻译文本组成的语料库。单语可比语料库由收录某一语言原创文本的子语料库和收录该语言翻译文本的子语料库组成。其中,该语言的翻译文本译自不同语言。这两个子语料库所涉及的领域、语言变体和时间跨度相似,而且库容也大致相当。如翻译芬兰语语料库(CTF)收录了译自英、俄、德、法等十几种语言的翻译芬兰语文本和芬兰语原创文本,可容总量为960万词,其中翻译芬兰语文本580万词、芬兰语原创文本380万词。
语料的可比性是可比语料库至关重要的特征。语料库的可比性指比较或对比语言或语言变体时所依据的共同标准,是对两种或两种以上语言或语言变体进行比较和对比描述的出发点,是语言或语言变体共同具有的某种属性或范畴。语料的可比性标准通常划分为语外标准和语内标准,语外标准一般包括语料生成或出版的时间跨度、语料的影响力、作者和译者的地位、性别及其影响力等。语内标准通常涵盖语料库的库容、语料的题材、体裁、语料的翻译方向和翻译方式。意大利学者S.拉维奥萨主持建设的英语报纸可比语料库(A Comparable Corpus of English Newspaper Articles) 由《卫报》翻译英语语料子库和《卫报》非翻泽英语语料子库组成,前者库容25879词,后者25832词。葡萄牙里斯本大学的葡萄牙语可比语料库由收录安哥拉、莫桑比克等五个非洲国家葡萄牙语文本的五个语料子库组成,每个子库库容均为60万词。
作者简介
胡开宝,男,1966年4月生,中共党员,博士,教授,博士生导师,教育部国家重大人才计划特聘教授。现任上海外国语大学校长助理、语料库研究院院长。曾任上海交通大学外国语学院副院长、常务副院长和院长等。
文献来源
原文发表于《中国大百科全书》第三版网络版,欢迎各位学者阅读、分享。
特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。
- END -
翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!
转载来源:《中国大百科全书》(第三版·网络版)
转载编辑:张一孟
审核:吕欣潼、吴志雄
项目统筹:吕欣潼
资讯推荐
▶精品课程
精品课程|倒计时5天!实习证明、翻译项目,尽在四周暑期口笔译实习实践竞赛营!
精品课程|ChatGPT提示工程(Prompt Eng.)实践工作坊
▶翻译百科
▶译界动态
译界动态|AIGC时代翻译教育创新与发展论坛2号通知(含直播通道)
译界动态|GPT应用场景下语言服务与医学模型技术论坛——暨第六期新译大讲堂
CATTI和MTI资讯
语言服务就业信息
翻译名师真知灼见
翻译学习精品课程