查看原文
其他

Meta开源能翻译200种语言的AI模型

21CTO 2023-01-28


Meta (Facebook)近日宣布完成开发能翻译200种语言的机器翻译单一AI模型NLLB 200,同时将把该模型及训练用的数据集一同开源。


此产品系 Meta为实现元宇宙跨语言互动开发的高品质机器翻译系统NLLB(No Language Left Behind)。最新完成的单一AI模型NLLB-200能翻译200种不同语言,且精确度相较前代技术,翻译品质平均分数提升44%。


这是继2020年底Meta开源的M2M-100后,最新的一个机器翻译单一AI模型。


Meta首先将首个不需通过英语、可直接翻译两种语言,共能翻译100种语言的AI模型M2M-100开源出来。


Meta强调,NLLB-200对少数语言的支持。该公司指出,这个模型支援一些其他模型不支援或支援度极差的语言,像是肯亚东部的坎巴语(Kamba)和老挝(Lao,或寮国)语。


Meta说,一些常用的(如Google)机器翻译技术支持的非洲语言不到25种。相较之下,NLLB-200支持55种非洲语言,所有支持的200种语言涵括地球数十亿人口。


除了支持语言数量多,Meta也声称能达到高品质的翻译水准。和上一代相较,NLLB-200在FLORES-101标竿测试1万种可能方向的BLEU(bilingual evaluation understudy)得分平均高44%。在部份非洲及印度语言中,NLLB-200的精确度能够提高70%。


Meta表示,其NLLB机器翻译系统将可支持Facebook的News Feed、Instagram及其他平台每日250亿次翻译。高品质而精准的翻译除了可加速用户的使用方便性,也有助于辨别这些平台上的有害内容及虚假信息。


编辑:大雄


相关阅读:


AI人格觉醒?涉事谷歌工程师遭停职

婴儿将是下一代人工智能的关键

英特尔 CTO:开源生态系统“写得不好”


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存