查看原文
其他

18 个开源翻译工具帮助你的项目“更接地气”

2017-07-02 OSC-协作翻译 开源中国


在满足世界各地用户需求的开源项目中,本地化扮演着极其重要的角色。除了编码之外,语言翻译也是世界各地的人们从事开源事业并向开源项目做出贡献的主要方式之一。

在语言服务行业存在着各种工具(听到这个事情惊讶吗?),这些工具可以让本地过过程简单即又保质保量。本地化工具包括如下几类:

  • 计算机辅助翻译(CAT)工具

  • 机器翻译(MT)引擎

  • 翻译管理系统(TMS)

  • 术语管理工具

  • 自动本地化工具

这些工具的专有版本可能相当贵。SDL Trados Studio(领先的CAT工具)的单一许可证可以花费数千欧元,即使是这样,它只能一个人使用,并且自定义是受限的(而且,这样的成本也会更高)。想要本地化为多种语言并简化其本地化过程的开源项目将要检索下开源工具来节省开支,并通过定制获得所需的灵活性。我已经整理了许多开源本地化工具项目的高层总结,以帮助你决定使用哪一个。


计算机辅助翻译(CAT)工具

OmegaT CAT工具。在这里你可以看到使用中的翻译记忆(模糊匹配)和术语查全率(词汇表)功能。OmegaT遵循GNU开源许可v3。

CAT工具是语言服务业的主要部分。顾名思义,CAT工具可以帮助翻译人员尽可能快地完成翻译,双语复审和单语复审任务,并通过重用翻译的内容(也称为翻译记忆库)尽可能提高一致性。

翻译记忆和术语识别是 CAT 工具的两个核心特性。它们能让译者在新项目中重复使用在以前的项目中翻译的内容。这使得译者可以在短时间内翻译大量的词句,同时还因为使用相同的术语翻译和一致的翻译风格使翻译内容得到高质量的保障。这为本地化带来极大的便利,因为很多软件和 Web 界面中的文本都是相同的,还不受平台和应用程序的限制。CAT 工具独立于软件之外,需要译者在本地使用它们并将翻译结果合并到中心库。

工具表:

  • OmegaT

  • OmegaT+

  • OpenTM2

  • Anaphraseus

  • Subtitles Translator


机器翻译(MT)引擎


MT引擎可以自动将某种语言的文件转换为另一种语言。MT拥有三个主要的方法理论:基于规则、统计和神经(新加入的)。最常见的MT方法理论是统计,通过运行基于n-gram 模型的双语资料注解的统计分析,它(在短时间内)就能得出两个语言互联的相关结论。如果往翻译引擎中引入新的原语言段落,它会在分析后的语料库中以统计学判断等价的内容,并生成目标语言。

MT 对提高译者生产力很有帮助,它将译者的主要任务从将源文本翻译为目标,变成了编辑 MT 引擎的目标语言输出。我并不推荐直接使用 MT 的本地化输出,但如果你的社区得到过后期制作的训练,MT 就能帮助他们作出大量贡献。

工具列表:

  • Apertium

  • Moses


翻译管理系统(TMS)


Mozilla 的 Pontoon 翻译管理系统用户界面。采用 WYSIWYG(所见即所得) 编辑,你可以在上下文环境中进行翻译以达到一致性的翻译并使翻译质量得到保证。Pontoon 基于  BSD 3-clause New or Revised License 授权。

TMS 工具是用于管理本地化项目并帮助译者和审核人做到最好的 Web 平台。多数 TMS 工具致力于将很多翻译过程中的人工操作自动化。它通过集成版本控制系统(VSC)、集成云服务、项目报告标准翻译记忆库和术语分析等特性来实现此目标。

这些工具最适合社区的本地化或翻译项目,因为它们允许大量的译者和审核人员对同一个项目作出贡献。有些工具使用 WYSIWYG(所见即所得) 来向译者提供翻译的上下文。这个上下文能提高翻译的准确性并减少译者在翻译和预览之间切换用户界面的等待时间。

工具列表:

  • Pontoon

  • Pootle

  • Weblate

  • Translate5

  • GlobalSight

  • Zanata

  • Jabylon


术语管理工具

杨伯翰大学的工具 BaseTerm,添加新术语的窗口。BaesTerm 基于 Eclipse Public License 授权。

术语管理工具提供 GUI 来创建术语资源(称之为术语库),并添加上下文以保证翻译的一致性。这些资源可以由译者在使用 CAT 工具和 TMS 平台中的翻译过程中使用。

在某些语言中,根据上下文,一个术语即可能是名词也可能是动词。术语管理工具允许你为术语添加元数据来标记它的词性、类别、单语释义以及上下文线索。术语管理往往存在不足,但它仍然是本地化过程中重要的一环。在开源系统和特定的生态系统中,它们只能提供少量可供选择的方案。

工具列表

  • BaseTerm

  • Terminator


自动本地化工具

Okapi 框架的 Ratel 和 Rainbow 组件。Okapi 框架基于 Apache License version 2.0 授权。

自动本地化工具会雷傲你处理本地化数据,包括提取文件、文件格式转换、标记化、VCS(版本控制系统)同步、提取术语、预翻译,以及各种基于普通本地化标准文件格式的质量检查。在某些工具套件,比如 Okapi 框架中,你可以创建自动化流水线来执行不同的本地化任务。这对于多种情况下的工作非常有帮助,不过它们的主要作用还是通过对大量任务进行自动化处理来节省时间。它们也可以让你更接近连续的本地化过程。

工具列表

  • Okapi 框架

  • Mojito


为什么开源是关键

本地化在开放环境下才能达到最强大和有效的状态。这些工具为你和你的社区项目多语言本地化提供了更大的可能性。

想了解更多?请查看下面的资源:

  • 免费/开源机器翻译软件列表

  • 开放的翻译工具 电子书


更多翻译干货请前往公众号菜单栏“读我”->“干货分享”查看。



推荐阅读

类似“WannaCry”的新勒索病毒席卷欧洲;Windows 10 源代码网上泄漏

除了 Python ,这些语言写的机器学习项目也很牛

如此“封闭”的腾讯,这些年都开源了哪些项目?

点击“阅读原文”查看更多精彩内容

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存