其他
GPT X 翻译记忆:基于双语翻译记忆进行智能问答
前言传统的计算机辅助翻译工具有三大核心技术用于辅助译者提升翻译效率和翻译质量,分别是:术语、翻译记忆和机器翻译。崔启亮老师曾经梳理过企业内部的语言资产形态,如下:最近行业内有关GPT的各种讨论都对GPT对机器翻译的影响、技术写作的影响、翻译教育的影响等多有讨论,但“翻译记忆”这个计算机辅助翻译技术的核心鲜有讨论。我认为,以GPT为代表的大语言模型技术是对计算机辅助翻译工具内置翻译记忆技术的彻底颠覆。在简言微信公众号之前的文章中大家可以查看我写的一系列与翻译记忆原理相关的文章,翻译记忆之所以能够提高效率是因为译者在翻译过程中可以基于过去翻译的双语数据来翻译形式上相似的新句子。注意,这里我特别指出了“形式”相似,因为无论是衡量字符串相似度的模糊匹配还是衡量机器翻译质量的BLEU都是形式上相似,我在之前的文章中介绍原理时都详细分析过。但GPT的出现,则通过词嵌入(Embedding)技术将相似度的计算从形式层面带到了语义层面。为了证实这一点,我在ParaTrans上添加了“记忆”模块。视频展示正文一、翻译记忆的对齐与上传目前国内外翻译记忆在线对齐工具中,TMXmall做得应该是最好的:离线对齐工具可以选择Abbyy