查看原文
其他

译技术 | Systran:机器翻译行业的拓荒者

TransLearn 翻译学习共同体
2024-09-10

1. 工具简介

1.1 Systran的特色及主要功能

Systran是目前应用最广泛﹑所开发的语种最丰富的翻译软件,可进行英语,繁体中文,简体中文,日语,韩语,西班牙语,法语,德语,意大利语,葡萄牙语,荷兰语,俄罗斯语,瑞典语,阿拉伯等50种语言的互译。它不但提供翻译技术给雅虎(Yahoo!)、AltaVista等大型搜寻引擎,更提供给美国空军(US Airforce)及欧洲联盟委员会(European Commission)使用。

2002年,Systran在30多年积淀的基础上发布了一套完全重新设计的机器翻译技术架构。新的Systran技术包括:模块化(Modularity),有限状态技术(Finite State Technology),词典访问(Dictionary Access),声明化(Declarativity), 隐式转换(Implicit Transfer),交换格式(Exchange Format), 自然语言处理组件(NLP Components)。

在2007年10月,谷歌公司终止与Systran合作,采用自己的统计机器翻译系统后,Systran也开始转变发展方向。2010年,Systran采用规则和统计混合机器翻译系统,后来又引入深度神经网络技术。

现在的Systran作为一种在线翻译工具,基于 AI 的翻译模型,可以实现翻译无与伦比的准确性。根据不同文本类型,Systran调用预先打包好的翻译模型,这些模型涵盖金融、法律、健康、IT、教育及制造业等,可以实现专业领域的翻译。且现支持多种文本类型的翻译,如Word、PPT、PDF等。Systran与知名数据供应商和语言专家建立合作关系,在确保专业领域数据和翻译模型质量同时也保证其安全性,此外这些数据和模型的知识产权仍然归供应商所有。更重要的,它还可以导入用户的翻译记忆库和词典,生成用户专属译文。

官网:https://www.systran.net/en/translate/


2. 图文教程

进入Systran的官方网站,我们可以看到以下视图:

首行六个选项卡分别是“翻译”“为何选择专业版”(介绍专业版的特点)“套餐和定价”(专业版有不同套餐,支持的功能也有所不同)“免费试用专业版”“登录”“语言切换”。我们正常翻译文本时选择第一个“翻译”选项卡即可,专业版可以免费使用14天,但需要注册账号,但经过试验发现地区选择China,显示选择地区与所在地区不符,无法注册,所以这里我们只介绍普通版的相关操作。专业版涵盖三个套餐,分别是“精简版”“加强版”“高级版”,点击选项卡“套餐和定价”就能了解详情,如下图所示:

可以看到翻译Word、Excel、PPT等类型文件要付费,开通包年服务可享月费7折优惠。不同版本涵盖的功能、支持翻译的文档页数、以及账号支持使用的用户人数也有所不同,只有高级版才支持导入翻译记忆库、连接计算机辅助翻译工具和翻译管理系统(TMS)等高级功能。

第二行涵盖三个选项卡,分别是“文本翻译”“文件翻译”“专业领域翻译”。第二个选项卡功能只支持专业版,需要付费,所以就不具体介绍。因此,接下来我们主要介绍“文本翻译”和“专业领域翻译”这两个选项卡。

2.1 文本翻译

网站打开后默认的翻译方式就是TEXT文本翻译,最大字符限制是5000字。我们可以按照自己的需求设置源语和译语的语言类型,此处以源语为英语,译语为汉语为例。我们将文本输入或粘贴至左侧文本框内,系统会自动呈现相应的译文。如下图所示:

需要注意的是,和现在许多机器翻译工具不同,Systran不支持译文修改。在文本翻译选项卡下提供的译文不会调用预置的翻译模型(可以理解为术语之类的),若是翻译的文本是特定领域的则要从“专业翻译”选项卡进入。原文框右下角的橡皮图标是清除选项,译文框右下角的小喇叭支持朗读译文,文本符号则是复制选项。在操作过程中遇到任何问题都可以点击“上报问题”(Report on Issue)进行反映。

2.2 专业翻译

当你要翻译专业领域的文本时,你需要从“专业翻译”(Translate in your domain)进入,这里我们以IT文本为例。

首先,点击“专业翻译”选项卡,我们会跳转到如下页面:

如果你只是想了解这些翻译模型的信息你可以点击“展示所有组合模型”,你就会转到如下页面:

这里展示了收录的所有翻译模型。你可以在搜索框“search”中搜索你中意的模型,或者直接点击“试用”(Test me)。点击首行“所有者”(owner)选项卡你就能获得翻译模型的提供者,如图:

点击“领域”选项卡,你就能知道翻译模块涵盖的领域:

可以看到,我们能从“专业翻译”选项卡提供的专业领域中选择我们的目标领域IT,也可以在“了解所有组合模型”选项卡下的“领域”选项卡中选择IT,点击都能转跳到如下界面:

在这个页面,我们可以获Systran 预置IT翻译模型的相关信息,包括模型的提供者、支持的语言和地区、价格、以及最近更新的时间。根据自我喜好可以随机选择一个模型,这里我们选择Systran自己的模型,源语为英语目标语为中文简体,点击试用,如图:

接下来我们就会跳转到翻译页面,如下图:

我们发现我们回到了文本翻译的页面,但不同的是译文框下方多出了IT翻译模型的提示,接下来我们原文语言设置为英文,译文设置为中文,在原文框粘贴英文原文,自动得到译文,如图:

但是对比之前直接进行文档翻译,我们发现在选择了专业翻译模型后,译文并没有发生多大变化,为了避免这个是个例,我们又换了Mozilla的来自IT翻译模型,源语为英语,目标语为法语,结果如下:

我们可以发现,这两个版本的译文也没太大不同,之后我们又尝试了商业文本,得到的结果也是一样,这很有可能是因为我们使用的常规版,专业版这方面的优势可能会更加凸显。


3. 学习心得

在这次对Systran的了解和学习中,我深深感受到了机器翻译的发展之快。机器翻译的诞生也远远比我们想象中的久远,尤其是当机器和神经网络技术结合起来之后,机器翻译过程中对自然语言的处理也将达到一个新高度。机器翻译技术从老一代的基于规则逐渐发展成语料库驱动的统计计算机翻译,这也意味着机器翻译的准确性将达到空前精准的高度,到那时人类将真正重建巴别塔,不同国家的人依靠机器都能实现无差别交流。

当然随着机器翻译的不断成熟,对译者的要求也越来越高。包括Systran在内的很多在线翻译工具都开始支持导入词典,翻译记忆库,术语库等功能,如果不了解这些技术,译者终将被淘汰。现在任何学科的学习都不再是单学科的“顾影自怜”,而是多学科交叉的“水乳交融”,作为语言的学习者和处理者,我们的发展和机器或者说和科技的发展息息相关,只有保持终身学习的态度,才能不在人工智能时代被淘汰。

当然,在这次对Systran的了解过程中我发现这款工具的“金钱”门槛比较高,相比于其他翻译工具,它的一些较为基础的功能如,word、pdf、ppt等翻译也要收费,这对自由译者而言不太友好,普通版的专业翻译功能优势不太凸显,但必须承认其专业版的高级版功能十分强大,但是,随着时代的发展,国内外也涌现出了一大批功能强大,使用成本不高的机器翻译工具。因此作为机器翻译的拓荒者,Systran在保持优势的同时,也应该紧跟技术的发展。此次学习颇为遗憾的是,因为财力有限,无法探索专业版本中精简版、加强版、高级版的功能。

总之,无论是机器翻译的发展,还是译者个人的发展,都不能囿于现状,发展的大潮势不可挡,注定有人乘风破浪,也注定有人拍在岸上。

4. 配套视频

注:学习作品,仅供参考,欢迎指正。


作者:罗一梦

编校:布兰妮

继续滑动看下一个
翻译学习共同体
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存