查看原文
其他

第二届全国翻译技术大赛第四期培训内容回顾&牛刀小试



第二届全国翻译技术大赛第四期培训已经结束了,没来得及参与直播的小伙伴们不要着急,培训直播回放、内容回顾及模拟题都在这里,欢迎大家学习!




第四期培训回顾



为帮助翻译从业者、爱好者及高校师生进一步了解翻译技术,同时为第二届全国翻译技术大赛参赛者提供备赛参考,中国翻译协会、中国外文局翻译院、北京第二外国语学院于4月起启动第二届全国翻译技术大赛系列培训。


第四期培训邀请广东外语外贸大学博士生导师戴光荣教授以《语料库与翻译》为题作讲座。内容概要如下:


语料库与翻译


一、语料库简介

本部分介绍了语料库的定义、特征、类型、功能、发展阶段及代表性语料库。


二、语料库创建方法及在线语料库使用介绍

本部分介绍了单语语料库、双语平行语料库的创建方法,并介绍了在线英语语料库()的使用方法。


三、语料库检索及应用分析

本部分介绍了语料库检索方式,包括通过检索关键词、关键词搭配等方式使用语料库。同时介绍了以下语料库高级检索技巧(包括通配符、正则表达式等):

1. 输入“a*of”检索所有a...of表达;

2. 输入“\S+_VB\w+”检索所有be动词;

3. 输入

“\S+_VB\w*\s(\S+_[RX]\w+\s)*\S+_V\wN\s”检索被动语态及其汉译;

4. 输入“it+BE+adj.+that”检索强调句结构。


四、从语料库到大语言模型

本部分展望了大语言模型时代语料库的发展趋势。当前ChatGPT等生成式人工智能在多语言翻译、多领域翻译、长文本翻译、风格化翻译等方面展现较强能力,在翻译行业中的应用愈发广泛。广大翻译行业从业者、学习者要保持开放心态,及时了解技术最新发展,同时加强对语料库使用方法的学习,以此辅助提升人工智能技术素养。同时,介绍了在使用ChatGPT时提示词(Prompt)的设计原则,即:

1. 清晰:切忌复杂或歧义,如果有术语,应定义清楚;

2. 具体:描述语言应尽量具体,不要抽象或模棱两可;

3. 聚焦:问题避免太泛或开放;

4. 简洁:避免不必要的描述;

5. 相关:主题相关。


此外,还分享了语料库及翻译技术相关学习资源(点击链接,跳转至学习页面http://blog.sciencenet.cn/u/carldy


第四期培训练习题




01

以下关于语料库的说法错误的是:

A. 语料库有一个或多个应用目标。

B. 语料库只可被计算机程序检索。

C. 语料库内包含具有一定规模的语料。

D. 语料库指经科学取样和加工的大规模电子文本库。


答案:B【B. 语料库中的语料可通过人工处理,也可借助相关软件或者语言模型处理。】

点击查看答案与解析


02

以下关于语料库的说法正确的是:

A. 英国国家语料库(British National Corpus)是没有经过抽样的语料库。

B. 语料库是未经处理的原始文本集合。

C. 英国国家语料库(British National Corpus)是机读语料库。

D. 语料库只能用于词典编纂。


答案:C【A. 英国国家语料库(British National Corpus)是经过抽样的机读语料库的代表之一;B. 语料库是科学取样和加工后的大规模电子文本库;D. 语料库应用广泛,不仅限于词典编纂。】

点击查看答案与解析


03

以下关于语料库分类的说法错误的是:

A. 按照用途分类,可分为通用语料库和专门语料库。

B. 按照模态分类,可分为单模态语料库和多模态语料库。

C. 按照平台分类,可分为在线语料库和本地语料库。

D. 语料库分类有固定标准,各个类型语料库彼此无关联。


答案:D【D. 语料库在不断发展,彼此之间并非割裂存在,一个双语语料库同时也可能是多模态语料库。】

点击查看答案与解析


04

以下关于语料库功能的说法错误的是:

A. 语料库可以协助研究人员深入研究语言行为。

B. 语料库统计方法可以协助研究人员开展语言描写。

C. 语料库只能协助研究人员开展定量研究。

D. 语料库可以协助研究人员开展实证研究。


答案:C【C. 语料库可以协助研究人员对语言进行定性和定量研究,不只局限于定量研究。】

点击查看答案与解析


05

建立单语语料库的正确步骤为:

①在相关网站上进行语料搜集    

②导入语料库分析软件       

③文档整理保存

A. ①②③

B. ①③②

C. ②①③

D. ③①②


答案:B

点击查看答案


06

关于建立双语语料库,以下说法错误的是:

A. 首先要搜集双语语料,保存为doc文档。

B. 运用文本分析软件,进行语料对齐。

C. 将中外文文本保存在同一个txt文档中。

D. 对中外文文本进行分词处理后,再用语料库软件分析。


答案:C【C. 建立双语语料库时,中外文文本需要分别保存为两个独立的txt文档,才能进行对比和分词处理。】

点击查看答案与解析


07

以下功能无法通过语料库实现的是:

A. 词语检索

B. 词频分析

C. 关键词分析

D. 使用者语言能力评估


答案:D

点击查看答案


08

以下软件/应用能够进行语料分析的有:

A. AntConc

B. ChatGPT

C. Trados, memoQ

D. ParaConc


答案:ABD【C. Trados和memoQ是计算机辅助翻译工具,不能进行语料分析。】

点击查看答案与解析


09

语料库语言学的主要研究领域包括:

A. 词汇学研究

B. 句法研究

C. 语义研究

D. 话语分析


答案:ABCD

点击查看答案


10

以下哪些是在ChatGPT输入Prompt时需要注意的原则?

A. 清晰:切忌复杂或歧义,如果有术语,应定义清楚。

B. 简洁:避免不必要的描述。

C. 具体:描述语言应尽量具体,不要抽象或模棱两可。

D. 聚焦:问题避免太宽泛或开放。


答案:ABCD【ChatGPT Prompt设计原则:

1) 清晰,切忌复杂或歧义,如果有术语,应定义清楚;

2) 具体,描述语言应尽量具体,不要抽象或模棱两可;

3) 聚焦,问题避免太泛或开放;

4) 简洁,避免不必要的描述;

5) 相关,主题相关。】

点击查看答案与解析


关注视频号,预约培训直播

第五期培训将在本周六19:00举办,主题为人工智能辅助翻译,欢迎大家预约观看!

继续滑动看下一个
中国外文局翻译院智能翻译实验室
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存