查看原文
其他

技术应用 | Smartcat平台简介与功能介绍

张宇颖 翻译技术教育与研究
2024-09-09


1. Smartcat平台简介与功能介绍

1.1 Smartcat平台简介

官网地址:https://www.smartcat.com/
Smartcat是一款在线翻译协作管理工具,是兼有CAT和TMS工具系统的一体化平台。该平台基于云计算,帮助翻译公司和译员进行工作流程的协作,简化了翻译流程。Smartcat有包括中文在内的多种界面语言,支持60多种文件格式,可以翻译数百种语言。提供免费的基本版服务,但也有付费的高级版服务可供选择,但都必须注册才能使用。功能包括机器翻译、翻译编辑器、翻译记忆库、术语库、质量检查等,可以辅助检查文章术语、标点等,次数不限,帮助提高译员翻译效率和正确率。
Smartcat有免费版和付费订阅版,本文将对免费版功能进行介绍。

1.2 Smartcat用户界面简介


用户界面包括任务、个人资料、提现、客户、语言资产、工作效率与服务、翻译工作、工作区设置板块。

图1 Smartcat用户界面任务:译员可以在此处创建项目及查看正在进行的项目,翻译任务也在此处进行,为译员的主要工作区。
个人资料:类似个人简历,包括个人基本信息,教育/工作经历等,以及可以提供的服务等。完成项目后客户满意度和准时交付率也会显示在这里。
提现:译员可以查看付款方式、付款状态、提现历史记录和付款请求。Smartcat提供美元国际电汇、PayPal、Payoneer美元或欧元帐户三种付款方式。此外,Smartcat还支持译员对不在该平台上上完成的工作进行收款。
客户:译员在此处可添加客户和净费率计划。
语言资产:包含术语库、翻译记忆库、搜索和翻译记忆库编辑器。在术语库中,译员可以自行添加术语,以及上传和下载术语库。在翻译记忆库中,译员可以建立自己的翻译记忆库,记录翻译过的句子或段落;Smartcat支持TMX、SDLTM、XLSX三种格式文件的导入。在搜索板块,译员可以搜索术语及包含目标关键词的完整句子。在翻译记忆库编辑器中,译员可以对搜索到的翻译记忆库内容进行编辑。
工作效率与服务:包括机器翻译和OCR服务,译员可以选择通过银行卡或PayPal购买需要的页数,所有服务套餐的时长都为12个月。
翻译工作:此处为客户发布任务的平台,译员可以选择合适的翻译任务并与发布者取得联系。
工作区设置:包含通知、邮箱&密码、占位符、文件格式和模板。

1.3 Smartcat 翻译功能介绍


该板块主要对Smartcat免费版的文件翻译功能进行更加详细的介绍。


1.3.1 机器翻译

在进行人工编辑审校前执行机器翻译,可以有效降低翻译成本、提高翻译效率。Smartcat平台上聚集了10个机器翻译引擎,如:Google神经机器翻译、DeepL、ModernMT、Yandex、Microsoft Translator等,但以国外的居多,适合英中互译的国内主流机译引擎只有百度翻译。
此外,Smartcat平台上的机器翻译有免费版和付费版。本文使用的是Yandex Free进行免费机器翻译。使用免费翻译的条件是需对翻译结果给出反馈,如:将翻译结果发送给机器翻译提供商,以及对机器翻译译文进行编辑。付费服务包括机器翻译及OCR功能,译员可根据翻译需求及预算自行选择。



图2 Smartcat平台上聚集的机器翻译引擎部分截图

1.3.2 翻译编辑器

Smartcat的页面布局比较清晰,基本分为功能区、原文展示区、译文编辑区、语料参考区和预览区等,并可以查看翻译字数、翻译进度等。页面顶端为状态栏,显示当前文件的信息,包括文件名、语言对、文件类型、总字数、可翻译字数以及完成进度等。

图3 Smartcat的翻译编辑界面

页面上方为快速访问区,包含了各种帮助处理文档的基本功能,如确认句段、锁定句段(所有语言)/译文(一个语言)、转至下一个未确认的句段、按编号转至句段、撤销/重做上次操作、将原文复制到译文、清除译文、替换、插入特殊字符、更改大小写、插入标记、句段长度限制、添加术语、将该句段恢复至上一个阶段、打开自定义词典、相关搜索、选择多个句段进行合并、将光标置入原文本中等。快速访问区下方为搜索区,可以对分别对原文和译文进行搜索,并可以添加筛选条件。
页面左侧为原文展示区和译文编辑区,译员可以自行在相应区域进行翻译,也可以通过使用快捷键将机器翻译或翻译记忆库的译文快速粘贴到译文框中,并进行所需的修改,最后点击右侧“√”确认句段。
页面右侧的操作区包含句段评注、文档评注、预览、CAT信息和相关搜索功能。预览功能方便编辑人员查看上下文语境和译文格式。
页面下方的操作区则包含历史记录、质量保证检查、CAT面板。质量保证检查功能可以实时警告有问题的地方,译员可根据提示修改翻译结果。CAT 面板可显示已启用的项目资源中包含所选句段的所有译文:来自翻译记忆库、机器翻译和术语表的匹配结果。

1.3.3 预翻译

在翻译项目的准备阶段,Smartcat的预翻译功能可以获取翻译项目中的所有源文,复制仅含数字的句段到译文,并将符合匹配要求的翻译记忆库译文或机器译文自动填充到译文栏中,从而在整个项目层面实现对翻译记忆库和机器翻译系统的快速调用,起到减少翻译工作量、提高翻译效率的作用。

1.3.4 译后编辑

在Smartcat 的编辑界面打开原文时,点击每个句段,译文输入框内就会自动添加机器翻译译文或翻译记忆库匹配译文,供译者进行译后编辑操作。译文句段下方还会列出译文匹配的来源,即机器翻译匹配、私人翻译记忆库匹配或术语库匹配,供译员作为翻译参考;来自翻译记忆库的结果为绿色,并会显示匹配率;机器翻译的结果为紫色的MT图标。这种译文呈现方式为译后编辑提供了极大的便利,译后编辑人员可以在机器翻译译文和翻译记忆库匹配译文之间进行比较和取舍。此外,Smartcat上匹配的机器翻译可自动识别源语中的tag标签,在翻译时将标签自动保留,保证译前译后格式一致,且不需要手动复制标记,大大提高了翻译效率。

图4 Smartcat的译后编辑界面



2. Smartcat文件翻译的实际应用


案例描述:现有一个商务英语相关的项目文件,需将英文文本翻译为中文。项目资料有客户提供的“商务英语ENG.docx”,以及双语对照文本“商务英语-双语对照.xlsx”。且此后还有相关的翻译任务,需要重复翻译的部分较多,可调用此次的翻译记忆库。
在用Smartcat处理该翻译任务时面临以下主要问题:
  • 如何在Smartcat中创建术语库及添加术语?
  • 如何利用Smartcat进行高效翻译?

2.1 在Smartcat创建术语库并添加术语

2.1.1 创建术语库

进入Smartcat官网https://smartcat.com/用户界面,点击“语言资产”。

图5 Smartcat用户界面

选择“术语库”。

图6 Smartcat语言资产界面

点击“创建术语库”。

图7 Smartcat术语库界面

为术语库命名,设置语言对(语言1是源语,语言2是目标语),点击“保存”,一个空的术语库建立完毕。(需注意,术语库和翻译项目的语言对必须对应,否则将无法使用建立好的术语库。)

图8 Smartcat术语库创建界面

2.1.2. 添加术语条目

在术语库中添加术语有两种方法,一种是直接添加,一种是批量添加。
2.1.2.1 直接添加条目

点击“添加新条目”,在列表中手动输入术语,点击“√”确认添加。如果想要一个/多个源语对应多个/一个目标语,可以点击对应列术语后面的“+”添加条目。

图9 Smartcat术语库“添加新条目”界面

这种添加方式仅适合术语条目较少的情况,当术语较多时,这种添加方式并不高效,这时需要用到批量添加的功能。


2.1.2.2 批量添加条目

点击“下载”,将系统输出的“商务英语.xlsx”文件保存到电脑。

图10 Smartcat术语库下载界面

打开下载好的文件,可以看到该术语库的创建日期、作者、最后编辑日期和编辑者等,最后两栏为术语栏。

图11 Smartcat术语库中输出的XLSX格式文件内容

打开准备好的“商务英语-双语对照.xlsx”文件,复制所需添加的术语。

图12 需从双语对照文件中复制添加的术语

将所需添加的术语粘贴到“商务英语.xlsx”中,注意源语和目标语正确粘贴到对应列,点击保存。

图13 “商务英语.xlsx”中粘贴的新术语回到Smartcat术语库界面,点击“上传”。

图14 Smartcat术语库“上传”界面


依次选择导入文件“商务英语.xlsx”,选择“添加术语”,点击“导入”,批量添加完毕。


(需注意的是:从MultiTerm XML文件导入时,只有无附加属性的术语将被上传。上传有属性的术语,需使用 XLSX 格式。)

图15 Smartcat术语库导入界面

术语条目批量上传成功的界面如下:

图16 术语条目批量上传成功的术语库界面Smartcat中的术语库可以下载导出,供译员共享或自己整理术语库使用,输出文件为XLSX格式。

2.1.2.3 翻译过程中添加术语

打开需翻译的文件,可以看到标黄的地方就是术语库中的术语。

图17 术语库中的术语(黄色高亮部分)

在翻译这份文件的过程中,译员若发现了术语库中没有的术语,并想要添加该术语,可点击红框中的符号或使用快捷键Ctrl+E。

图18 翻译过程中添加术语需点击的图标


此处以添加英文“Business consulting”对应中文“商务咨询”为例,复制Business consulting后使用快捷键Ctrl+E,添加界面会自动出现术语原文Business consulting。

图19 翻译过程中添加新术语界面添加完术语后可点击“转至术语”查看是否添加成功。

图20 添加完术语后点击“转至术语”界面若添加成功,原术语库中可以看到新添加好的术语。

图21 术语库中新添加好的术语”Business consulting-商业咨询“

2.2 利用Smartcat进行高效翻译

在Smartcat中无法直接进行文件翻译,如需翻译则要创建项目,并将文件上传至项目内。

2.2.1 创建项目

2.2.1.1 基础设置

进入用户界面,点击“任务”。

图22 Smartcat用户界面上传需要翻译的文件“商务英语ENG.docx”,如果有翻译记忆库或参考文件也可以添加,如没有则点击“下一步”,进入Smartcat的项目创建界面。

图23 Smartcat文件上传页面设置项目名称、截止日期、语言对(源语言及一个或多个目标语言)。译员还可添加评注并选择是否使用机器翻译,以及使用免费机翻服务还是付费服务。

图24 Smartcat项目创建页面
2.2.1.2 高级设置

高级设置包括翻译记忆库、术语库、质量保证和预翻译功能,译员可以根据自己的需求加入翻译记忆库、术语库、质量保证和预翻译。项目创建完毕后,点击打开即可进行翻译编辑。
翻译记忆库部分的最低匹配率表示记忆库中低于该最低匹配率的句段不会生成为译文,用户可以根据翻译需求进行设置。

图25 项目创建过程中的高级设置功能界面

2.2.2. 文件翻译

2.2.2.1 预翻译

未使用预翻译的界面如下:

图26 Smartcat未使用预翻译的界面

已全部进行预翻译的界面如下:

图27 Smartcat已全部进行预翻译的界面

句段切割:Smartcat平台的编辑器是以句子为单位的翻译形式,可以看到其句段切割基本无问题,且机器翻译可以保持原文标记格式应用到译文,不需要手动复制标记,大大提高了翻译效率。
译文质量:但也可以看到,即使在句子不太复杂的情况下,Smartcat平台内置翻译引擎Yandex的翻译结果也并不是很准确,如存在译文语序、标点符号、时态等基本问题,需要进行译后编辑的部分还比较多。
2.2.2.2 译后编辑

译员可以对机器翻译的初始译文进行添加、删除、替换等操作。此外,译员还可根据质量保证检查功能的提示修改翻译结果,如此处译文的标点符号存在问题。此外,在Smartcat中,若遇到因原文格式不规范等原因造成断句不合理的情况,可通过拆分句段功能来作出调整。具体操作是:拆分句段前需将光标定位至需要拆分的位置,然后点击工具栏中的拆分句段图标即可完成拆分。

图28 质量保证检查警告译文的标点符号存在问题待翻译结果确认无误后可以点击“√”或使用快捷键Ctrl+Enter确认句段,之后系统会自动确认与其完全匹配的所有句段。

所有句段确认完毕后可以点击“完成”。若需要输出结果,译员可以点击“下载”选择需要下载的格式,有TMX、XLIFF、DOCX等多种格式可供选择。

图29 Smartcat平台的文件输出格式下图为“商务英语ENG.docx”原文和译文对比,可以看到使用Smartcat翻译能完整保留原文格式。

图30 翻译文件“商务英语ENG.docx”原文和译文对比

2.2.2.3 译后审校


翻译完毕返回项目界面时,可点击“质量保证检查”,检查译文出现的问题并输出质检报告。

图31 Smartcat的质量保证检查界面如图,质检报告会详细地将错误分类列出,并附有链接,点击即可跳转到Smartcat平台页面直接进行编辑,非常便于译者修改译文。

图32 质检报告XSXL格式文件


3. 小结

作为全球化管理软件和外包平台,Smartcat将翻译人才和需求方连接在一起,并促成其合作。作为一个翻译平台,Smartcat平台汇集了Google Translate、Microsoft Translator、Amazon Translate、百度以及 Yandex 等10种机器翻译引擎,支持译员导入术语和记忆库,可以减轻译员负担,提高翻译效率。就Smartcat平台的文件翻译功能而言,其主要有以下优缺点:


优点:(1)用户友好:平台设计相对直观,用户界面简洁明了,上手相对简单,且免费版功能足够基本的翻译需求,适合CAT初学者;(2)全球化支持:Smartcat提供多语言支持,是全球范围内翻译项目的理想选择;(3)自动化功能:平台包含一些自动化功能,例如机器翻译集成、术语库等,且机器翻译可以保持原文标记格式应用到译文,提升了翻译效率;
  • 云端存储:作为云翻译平台,Smartcat 可能允许用户在云端存储和管理其翻译项目,方便访问和分享。

缺点:(1)响应速度慢:服务器在国外,响应较慢;(2)译文质量待改进:免费翻译引擎Yandex 的中文译文质量不高,可读性较差,需进行译后编辑;(3)项目创建过程略显复杂:文件翻译以项目为单位,若翻译量不是很大,创建过程会显得相对复杂;(4)免费功能有限:翻译图片、扫描文件和PDF文件需要付费使用OCR功能,且定价相对较高;(5)依赖网络连接:由于是云翻译平台,需要稳定的互联网连接。在网络不稳定的情况下,用户可能会面临一些挑战。

特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。

- END -



原创来源:北外CAT课程展示-张宇颖-2022

推文编辑:张宇颖

审核:宁静  王贇

资讯推荐


口译员为什么也要建立搜商

▶ 技术与工具

口译系统

国外主流翻译APP

国内主流翻译APP工具

平行语料库在口译实践中的应用

国内外常见术语管理工具

翻译必备术语库和语料库合集(附网址)

翻译必备的计算机翻译辅助软件(附网址)

AntConc:实用的本地语料库检索工具

TREX:有海量例句、丰富语料的在线词典

Netspeak:一款免费的单词搭配检索工具

WantWords反向词典,内含开发团队公开文档

Cymo Booth:同声传译员的专属虚拟同传间

MateCat:一款免费的在线CAT工具

Visuwords:可视化在线词典,帮你一键构造记忆宫殿

Linggle:语料+搭配检索工具(实操演示)

Ludwig: 地道英文写作辅助神器,告别中式英语

Reverso:辅助写作与翻译神器


▶ 国际语言服务动态

| 翻译公司篇 | TransPerfect简介

| 翻译公司篇 | 全球第2名 RWS如文思

| 翻译公司篇 | “收购狂魔”Keywords Studios

| 咨询机构篇 | Nimdzi Insights简介

| 咨询机构篇 | Slator 简介

| 咨询机构篇 | CSA Research 简介

| 行业机构篇 | 国际翻译家联盟FIT

| 行业机构篇 | 美国翻译协会ATA

| 行业机构篇 | 加拿大联邦翻译局 Canada's Translation Bureau

| 翻译院校篇 | 明德大学蒙特雷国际研究学院(MIIS)

| 翻译院校篇 | 格拉斯哥大学

| 翻译院校篇 | 埃塞克斯大学

| 翻译院校篇 | 利兹大学

| 热点追踪 | ChatGPT的伦理问题(上)

热点追踪 | ChatGPT的伦理问题(下)

| 热点追踪 | GPT-4面世——AI引领语言行业革新


专访

李长栓:ChatGPT在翻译中的崭新角色

袁煜:挑战自我,迈出舒适区

王均松:人工智能时代的翻译:技术驱动的变革与未来展望

王树槐:GPT与小说翻译批评:GPT与文学翻译之二

王树槐:GPT与诗歌翻译批评:GPT与文学翻译之一

苏秋军:AIGC背景下的MTI学科建设

王华树:译者数字素养研究亟需加强,打造翻译人才新优势

沈澍:AIGC是敌是友?翻译领域的机遇与挑战

宁静:长缨在手,敢缚苍龙

崔启亮:机器翻译对语言服务企业有多大作用?

韩林涛:文科生如何学习机器翻译?

魏勇鹏:机器翻译质量评估为什么重要?

徐彬:熟练掌握翻译技术,就能做出漂亮的活儿

曹首光:如何打造一款受欢迎的机器翻译产品? 

李梅:机器翻译对未来翻译教育有何影响?

周兴华:高校翻译教师如何学习翻译技术?

丁丽:译后编辑人员与译者身份是否对等?

卢家辉、陈晨:口译员在远程口译中面临的主要问题


▶ 行业洞察

2021年语言服务行业回顾与展望

2022年全球百强语言服务商榜单

2022年翻译行业将迎来哪些新变化

后疫情时代,语言服务行业如何发展转型?

何钦:中国电影对外译介的现状与思考

冯志伟:关于机器翻译行业发展的三点建议

张霄军:伦理视角下,机器翻译的能与不能

黄友义:如何突破中外文化差异,让世界更了解中国?

韩林涛:与ChatGPT共舞


▶ 教育创新

李长栓:MTI论文千篇一律,如何破局?

王华树 刘世界:数字人文视域下译者数字素养研究:内涵、问题与建议

王华树 刘世界:人工智能时代翻译技术转向研究

王华树 刘世界:智慧翻译教育研究: 理念、路径与趋势

曹达钦 戴钰涵:人工智能时代高校翻译技术实践环境建设研究

李梅:如何给“技术小白” 开设计算机辅助翻译课程?

实践导向的MTI人才培养模式——以对外经济贸易大学为例

数字化口译教学资源建设:欧洲经验与启示

如何将翻译项目管理模式应用到CAT教学课堂中?

继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存