其他
Meta开源能翻译200种语言的AI模型
Meta (Facebook)近日宣布完成开发能翻译200种语言的机器翻译单一AI模型NLLB 200,同时将把该模型及训练用的数据集一同开源。
此产品系 Meta为实现元宇宙跨语言互动开发的高品质机器翻译系统NLLB(No Language Left Behind)。最新完成的单一AI模型NLLB-200能翻译200种不同语言,且精确度相较前代技术,翻译品质平均分数提升44%。
这是继2020年底Meta开源的M2M-100后,最新的一个机器翻译单一AI模型。
Meta首先将首个不需通过英语、可直接翻译两种语言,共能翻译100种语言的AI模型M2M-100开源出来。
Meta强调,NLLB-200对少数语言的支持。该公司指出,这个模型支援一些其他模型不支援或支援度极差的语言,像是肯亚东部的坎巴语(Kamba)和老挝(Lao,或寮国)语。
Meta说,一些常用的(如Google)机器翻译技术支持的非洲语言不到25种。相较之下,NLLB-200支持55种非洲语言,所有支持的200种语言涵括地球数十亿人口。
除了支持语言数量多,Meta也声称能达到高品质的翻译水准。和上一代相较,NLLB-200在FLORES-101标竿测试1万种可能方向的BLEU(bilingual evaluation understudy)得分平均高44%。在部份非洲及印度语言中,NLLB-200的精确度能够提高70%。
Meta表示,其NLLB机器翻译系统将可支持Facebook的News Feed、Instagram及其他平台每日250亿次翻译。高品质而精准的翻译除了可加速用户的使用方便性,也有助于辨别这些平台上的有害内容及虚假信息。
编辑:大雄
相关阅读: