第二届全国翻译技术大赛第四期培训内容回顾&牛刀小试
第二届全国翻译技术大赛第四期培训已经结束了,没来得及参与直播的小伙伴们不要着急,培训直播回放、内容回顾及模拟题都在这里,欢迎大家学习!
第四期培训回顾
为帮助翻译从业者、爱好者及高校师生进一步了解翻译技术,同时为第二届全国翻译技术大赛参赛者提供备赛参考,中国翻译协会、中国外文局翻译院、北京第二外国语学院于4月起启动第二届全国翻译技术大赛系列培训。
第四期培训邀请广东外语外贸大学博士生导师戴光荣教授以《语料库与翻译》为题作讲座。内容概要如下:
语料库与翻译
一、语料库简介
本部分介绍了语料库的定义、特征、类型、功能、发展阶段及代表性语料库。
二、语料库创建方法及在线语料库使用介绍
本部分介绍了单语语料库、双语平行语料库的创建方法,并介绍了在线英语语料库()的使用方法。
三、语料库检索及应用分析
本部分介绍了语料库检索方式,包括通过检索关键词、关键词搭配等方式使用语料库。同时介绍了以下语料库高级检索技巧(包括通配符、正则表达式等):
1. 输入“a*of”检索所有a...of表达;
2. 输入“\S+_VB\w+”检索所有be动词;
3. 输入
“\S+_VB\w*\s(\S+_[RX]\w+\s)*\S+_V\wN\s”检索被动语态及其汉译;
4. 输入“it+BE+adj.+that”检索强调句结构。
四、从语料库到大语言模型
本部分展望了大语言模型时代语料库的发展趋势。当前ChatGPT等生成式人工智能在多语言翻译、多领域翻译、长文本翻译、风格化翻译等方面展现较强能力,在翻译行业中的应用愈发广泛。广大翻译行业从业者、学习者要保持开放心态,及时了解技术最新发展,同时加强对语料库使用方法的学习,以此辅助提升人工智能技术素养。同时,介绍了在使用ChatGPT时提示词(Prompt)的设计原则,即:
1. 清晰:切忌复杂或歧义,如果有术语,应定义清楚;
2. 具体:描述语言应尽量具体,不要抽象或模棱两可;
3. 聚焦:问题避免太泛或开放;
4. 简洁:避免不必要的描述;
5. 相关:主题相关。
此外,还分享了语料库及翻译技术相关学习资源(点击链接,跳转至学习页面http://blog.sciencenet.cn/u/carldy)
第四期培训练习题
01
以下关于语料库的说法错误的是:
A. 语料库有一个或多个应用目标。
B. 语料库只可被计算机程序检索。
C. 语料库内包含具有一定规模的语料。
D. 语料库指经科学取样和加工的大规模电子文本库。
02
以下关于语料库的说法正确的是:
A. 英国国家语料库(British National Corpus)是没有经过抽样的语料库。
B. 语料库是未经处理的原始文本集合。
C. 英国国家语料库(British National Corpus)是机读语料库。
D. 语料库只能用于词典编纂。
03
以下关于语料库分类的说法错误的是:
A. 按照用途分类,可分为通用语料库和专门语料库。
B. 按照模态分类,可分为单模态语料库和多模态语料库。
C. 按照平台分类,可分为在线语料库和本地语料库。
D. 语料库分类有固定标准,各个类型语料库彼此无关联。
04
以下关于语料库功能的说法错误的是:
A. 语料库可以协助研究人员深入研究语言行为。
B. 语料库统计方法可以协助研究人员开展语言描写。
C. 语料库只能协助研究人员开展定量研究。
D. 语料库可以协助研究人员开展实证研究。
05
建立单语语料库的正确步骤为:
①在相关网站上进行语料搜集
②导入语料库分析软件
③文档整理保存
A. ①②③
B. ①③②
C. ②①③
D. ③①②
06
关于建立双语语料库,以下说法错误的是:
A. 首先要搜集双语语料,保存为doc文档。
B. 运用文本分析软件,进行语料对齐。
C. 将中外文文本保存在同一个txt文档中。
D. 对中外文文本进行分词处理后,再用语料库软件分析。
07
以下功能无法通过语料库实现的是:
A. 词语检索
B. 词频分析
C. 关键词分析
D. 使用者语言能力评估
08
以下软件/应用能够进行语料分析的有:
A. AntConc
B. ChatGPT
C. Trados, memoQ
D. ParaConc
09
语料库语言学的主要研究领域包括:
A. 词汇学研究
B. 句法研究
C. 语义研究
D. 话语分析
10
以下哪些是在ChatGPT输入Prompt时需要注意的原则?
A. 清晰:切忌复杂或歧义,如果有术语,应定义清楚。
B. 简洁:避免不必要的描述。
C. 具体:描述语言应尽量具体,不要抽象或模棱两可。
D. 聚焦:问题避免太宽泛或开放。
关注视频号,预约培训直播
第五期培训将在本周六19:00举办,主题为人工智能辅助翻译,欢迎大家预约观看!