查看原文
其他

技术应用 | 术语库创建与应用

刘含 语言服务行业
2024-09-09

 案例描述



总体背景:
  目前我们已有一个Excel表格(xlsx格式文件),表格里记录着术语;另外我们想创建一个术语库,把Excel的内容导入进术语库,用术语库对术语进行管理。

实现难点:
  • 术语库不支持xlsx格式的表格文件的导入,只支持xml格式导入,如何把xlsx转化为xml格式?
  • 术语库的结构如何设置?怎么设置会更加合理?


解决步骤


大致思路



Excel表格预处理

首先要保证表格符合转换的要求,如图,第一行必须是标题,第一列必须有内容

把表格处理成符合要求的格式,如下

Excel表格转换

1. 打开SDL MultiTerm Convert软件,点击下一步

2.  选择新建转换会话,点击下一步

3. 选择转换Excel格式文件,点击下一步

4. 选择要转换的Excel文件,点击下一步

    定义Excel表格中每一列对应的数据是什么内容

    语言字段:

    把某一列设置为语言字段,等同于把Excel中的该列定义为某个语言的术语说明性字段:把某一列设置为说明字段,等同于把Excel中的该列定义为用于解释说明的内容列


1. 英文列属于“语言字段”定义为英语


2. 中文列属于“语言字段”定义为中文
3. 中文缩写列属于“语言字段”定义为中文
4. 英文缩写列属于“语言字段”定义为英语
5. 下面的领域列、解释列、备注列都属于说明性字段,属于说明性字段中的“Text”也就是“文本”
6. 说明性字段进一步解释:说明性字段有六种属性可供选择,图片中从上到下分别对应“文本”“编号”“布尔运算”“日期”“挑选表”“多媒体文件”,这六种属性就是在描述Excel中的某列对应的到底是什么内容,比如说Excel中存在图片列,图片列是对中英文术语的图片解释,那么图片列就应当定义为“多媒体文件”属性,下面第二张图展现了,每种不同属性的说明性字段最终在术语库中是什么呈现效果
7. 现在要为术语库创建一个结构,如果把术语库比做一个房子,那么现在就是在画图纸,在创建结构之前我们需要先介绍一下左侧条目结构是什么意思
  • 术语的条目结构
    • Entry Level 中文为条目层,是术语库最高层级
    • Index Level 中文为索引层,是术语库的第二层级
    • Term Level 中文为术语层,是术语库的第三层级
8. 每一个层级最终在术语库的呈现效果如下,条目层包含所有语种(中、英、西不同语言的术语),索引层就是指某个特定语言(比如图中就是英语),术语层包含了某一个语言中多种不同的术语表达方式(比如说这里的Socialism with Chinese Characteristics是中国特色社会主义英文的全称术语,但同时我们也还可以在这里写一个缩写版的术语,比如SCC,同样代表中国特色社会主义,与全称版术语是平行的两个术语,且都为英语术语)
9. 在理解条目结构的基础上,我们要合理地把说明性字段插入合适的层级当中,比如说这里“领域”描述的就是该术语是什么领域的术语,我们以“英文”为例,可以看出“领域”字段就不适合放在Entry Level,因为这个“领域”描述的是特定术语的领域,不是整个术语库所属的领域,也不适合放在Index Level,因为这个“领域”描述的是某一个特定英文术语的领域,不可能所有的英文术语都是属于某一个领域,所以这个“领域”只适合放在术语层,描述英文这个语种中,某一个具体的英文术语术语什么领域
10. 确认无误,点击下一步
11. 等待转换成功,点击下一步
12. 转换完成
13. 转换完成后会在Excel所在文件夹内新出现三个文件,分别是xdt文件(术语库结构定义文件,也就是术语库的“图纸”)mtf.xml文件(后续在空白术语库搭建好后用于填充术语库内容)以及log文件(没什么用的日志文件)




创建空白术语库并导入术语

1. 打开SDL Multiterm Desktop软件,点击创建术语库

2. 选择术语库文件的保存位置,并命名,命名的时候建议按照规范命名,以免后续文件过多,命名混乱,找起来也费劲

3. 弹出术语库向导界面,点击下一步

4. 选择载入现有术语库定义文件,这里的术语库定义文件就是上一步生成的三个文件其中之一,是xdt文件,也就是所谓的术语库的“图纸”

5. 给术语库起一个名字,这个名字将来会在软件当中显示,和上一步术语库的命名是两个名字,这里创建的名字相当于昵称,上一步的术语库命名相当于大名,这个名称主要是为了方便在软件当中快速寻找到术语库用,所以可以起一个对于自己来说(或者对于其他用户来说)更加清晰明了的名称,最好一眼就能看出来术语库的用途

6. 无需设置,点击下一步

7. 无需设置,点击下一步

8. 无需设置,点击下一步

9. 点击下一步

10. 此时空白的术语库已经创建好,由于我们已经载入了术语库的“图纸”文件,所以目前的术语库虽然还没有任何的内容,但是已经有了正确的结构,下面点击术语库管理

11. 在这里先点击左侧的“导入”,然后激活图片右面的内容

12. 激活完成后,右键点击“导入”,弹出对话框,选择“处理”

13. 按照图片说明操作

14. 点击另存为

15. 在弹出的对话框内先为排除文件命名,然后点击保存

16. 点击下一步

17. 检查无误后点击下一步

18. 等待导入完成,点击下一步

19. 点击完成

20. 按照图片操作,最终完成创建术语库


















关于术语库字段属性的特别说明


在创建术语库的时候我们有以下几个字段属性:01




文本 Text

该字段的属性就是普通的文本,适用的场景包括普通的备注、术语添加者的姓名、对术语的解释说明、术语的来源等等02




日期 Date

该字段用于记录某一个术语添加的日期03




编号 Number

该字段用于记录术语的编号04




挑选表 Picklist

该字段用于创建一些可以快速使用的标签,比如说某个术语库包含的术语大概有经济、政治、文化三类,那么我们可以创建三个标签,这样每次给术语分类的时候可以快速调用标签,不用每次都手动输入“经济”“政治”“文化”05




多媒体文件 Multimedia

该字段用于添加一些图片视频等,用于对术语的描述或解释06




布尔运算 Boolean

在SDL Multiterm中,术语库的字段属性设置中的布尔运算属性用于指定一个字段是否允许布尔运算符(AND、OR、NOT)在术语搜索时进行使用。

当布尔运算属性设置为允许时,用户可以在术语搜索中使用布尔运算符来组合多个条件,以更精确地筛选出符合特定要求的术语。


 以下是一些使用布尔运算符的示例:
 01




AND 运算符:

将多个条件连接起来,返回同时满足所有条件的结果。例如,搜索 "computer AND software" 将返回包含同时包含 "computer" 和 "software" 两个术语的条目。

02OR 运算符:

将多个条件连接起来,返回满足任意一个条件的结果。例如,搜索 "car OR automobile" 将返回包含 "car" 或 "automobile" 任一术语的条目。 

03




NOT 运算符:

用于排除某个条件,返回不包含指定条件的结果。例如,搜索 "apple NOT fruit" 将返回包含 "apple" 但不包含 "fruit" 的条目。

关于术语库条目结构的特殊说明

在上文中,我们介绍了有关于术语库的条目结构,下面展示一个实际案例,辅助大家理解如何正确设置条目结构,来构建一个结构合理的术语库,以下是条目结构设置图,以及最终对应在术语库中的呈现效果:




声明:本公众号转载此文章是出于传播行业资讯、洞见之目的,如有侵犯到您的合法权益,请致信:532541801@qq.com,我们将及时调整处理。谢谢支持!
【语言服务行业】分享群

群内会定期推送语言服务行业最新动态、活动预告、竞赛通知📝等内容~


欢迎你的加入🥰!



-END-

文章来源:北外CAT课程展示-刘含
本文转载自:翻译技术教育与研究公众号
转载编辑:盼盼 


关注我们,获取更多资讯!

往期回顾

行业动态1. 行业动态|首届外语学科横向课题拓展与管理研修班(支持线上同步)
2. 行业动态 | 从译者走向语言技术和服务架构师
3. 行业动态 | 全球视野下国家战略传播与翻译专业人才培养创新论坛成功举办4. 行业动态|首届外语学科横向课题拓展与管理研修班5. 活动预告 | GenAI时代的西部翻译技术实战研修班(一号通知)

行业洞见
  1. 行业观察|王立非:提升国家语言服务能力,促进“一带一路”高质量发展
  2. 行业动态 | 全球视野下国家战略传播与翻译专业人才培养创新论坛成功举办
  3. 行业洞见 | 李晗佶老师:技术哲学视阈下的翻译技术
  4. 行业观察 | 贾艳芳老师:始于兴趣,长于实践,技术之路常学常新


行业技术
  1. 技术应用 | 术语管理主要工具
  2. 翻译技术|代码分享——spacy词形还原
  3. 技术应用 | 术语库基础知识
  4. ChatGPT | 中科院学术优化本地部署
  5. ChatGPT | 基于OpenAI Whisper模型的WhisperDesktop转写工具

精品课程
  1. 行业动态|首届外语学科横向课题拓展与管理研修班
  2. 新课来袭 | 开启倒计时!AI时代掀起影视字幕翻译的智能革命
  3. 基础篇 | 从入门到进阶:语料库建设与统计分析实务
  4. 进阶篇 | 从进阶到精通:基于Python的语言数据分析实战



资源干货
  1. 技术科普 | 揭开手写文本识别“最先进”的秘密
  2. 资源干货 | 英语外刊获取途径、网站推荐
  3. ChatGPT | AI外语写作助手,助力高效写作
  4. 双语干货 | 谢锋大使向中美媒体发表讲话
  5. 资源宝库|译者用“典”,多多益善——精选31款在线词典

招聘就业1. 博硕星睿 | 办公室实习助理招聘(北京)
2. 博硕星睿 | 好的平台,“职”等你来3. 译者招募丨英译中,经济学(有署名)4. 招聘快报 | CNBC财经电视台上海分公司招聘发行部助理实习生5. CATTI备考在即,备考实习两不误,硬核语言专业线上实习机会来了
继续滑动看下一个
语言服务行业
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存