查看原文
其他

翻译百科|《中国大百科全书》中的“统计机器翻译”

翻译圈
2024-09-09



01

统计机器翻译|SMT


《中国大百科全书》(第三版·网络版)发布了黄国平博士撰写的“统计机器翻译”词条。现转录如下,以资交流。


通过对平行语料进行统计分析,构建翻译模型、语言模型等子模型,进而组合不同子模型完成翻译的机器翻译技术。简称SMT。

统计机器翻译是机器翻译的一种,也是非限定领域机器翻译中性能较佳的一种方法。相比于基于规则的机器翻译而言,统计机器翻译把翻译问题等同于求解概率问题,基本思想是通过对大量的平行语料进行统计分析,构建统计翻译模型来完成翻译。


统计机器翻译的主要任务是为译文的生成构造合理的统计模型,并在此统计模型基础上定义要估计的模型参数,并设计参数估计算法。主要思想是与语言无关的噪声信道模型(noisy channel model)和区分性训练方法(discriminative training)。模型建立后,对所有的语言都可以适用。典型的统计机器翻译方法有基于词(IBM Model)、短语、层次短语、句法的翻译方法,实用性比较好的是短语翻译方法和层次短语翻译方法,必要的训练步骤包括词对齐、翻译规则抽取、语言模型训练等。


短语翻译模型能大规模地在平行语料中学到类似于词典的短语翻译表,比如“在周日”可以翻译成“on Sunday”及其翻译概率。翻译概率是衡量源语言短语与目标语言短语对应的可能性。短语翻译表建立起两种语言之间的翻译桥梁。


2016年前的实用机器翻译产品大多采用的是统计机器翻译方法,且主要基于短语或者层次短语翻译方法,典型代表是开源机器翻译系统Moses。统计机器翻译能比较好地处理结构不太复杂、中等以下长度的句子。





02

作者简介


黄国平,博士,腾讯翻译负责人,腾讯AI Lab专家研究员,毕业于中国科学院自动化研究所,研究方向为机器翻译、自然语言处理。深入研究交互翻译的研究与应用,在ACL、AAAI、IJCAI、EMNLP等人工智能领域顶级会议与TASLP等顶级期刊发表论文20余篇。




03

文献来源


原文发表于《中国大百科全书》第三版网络版,欢迎各位学者阅读、分享。


特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。

- END -



翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!


转载来源:《中国大百科全书》第三版网络版

转载编辑:李舒蓉

核:吕欣潼、吴志雄

项目统筹:吕欣潼

资讯推荐


ChatGPT辅助单句译文质量评估


▶翻译百科

翻译百科|《中国大百科全书》中的“翻译简化”

翻译百科|《中国大百科全书》中的“翻译伦理”

翻译百科|《中国大百科全书》中的“翻译机构”

翻译百科|《中国大百科全书》中的“翻译服务”

翻译百科|《中国大百科全书》中的“基于规则的机器翻译”

翻译百科|《中国大百科全书》中的“语料库翻译学”

翻译百科|《中国大百科全书》中的“多模态语料库”

翻译百科|《中国大百科全书》中的“翻译技术”

翻译百科|《中国大百科全书》中的“机器翻译”

翻译百科|《中国大百科全书》中的“术语管理”

翻译百科|《中国大百科全书》中的“基于实例的机器翻译”

翻译百科|《中国大百科全书》中的“翻译共性”

翻译百科|《中国大百科全书》中的“机器翻译译后编辑”

翻译百科|《中国大百科全书》中的“翻译记忆”

▶译界动态

译界动态|2023翻译技术研究前沿高层论坛圆满举办

译界动态|2023年人工智能的一些顶级趋势

译界动态|王华树 刘世界:数字人文视域下译者数字素养研究:内涵、问题与建议

译界动态|崔启亮:计算机辅助翻译的教与学

译界动态|李俊:口译技术

译界动态|国内首个大模型评测数据集(MMCU)问世加速完善国产AI产业图谱

译界动态|Windows系统全面接入AI助手,必应集成进ChatGPT

▶精品课程

精品课程|ChatGPT辅助翻译质量评估沙龙

精品课程|2023年暑期翻译技术实战研修班

精品课程|ChatGPT时代语料库与术语库建设与应用工作坊

 关注我们 了解更多

CATTI和MTI资讯

语言服务就业信息

翻译名师真知灼见

翻译学习精品课程


继续滑动看下一个
翻译圈
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存