2019西湖机器翻译论坛的几点杂感
1、如果用户问,机器翻译这几年发展到什么程度了?这是一个直观有说服力的好方式:展示用同一个句子跟踪了7年的机翻效果(下图来自中科院自动化所宗成庆)。
2、通用的翻译系统只能像全科医生,提供社区医院服务,解决一些头疼脑热的问题,面向用户定制的翻译系统才像专科医生,提供比较专业的诊疗服务(中科院自动化所宗成庆)。
3、和上一点相关:目前垂直领域翻译系统翻译质量并不比通用翻译系统的质量高(对外经贸大学崔启亮),因为一些所谓的垂直领域只能算泛垂直领域,训练用的数据和通用数据差别并不大。目前对用户有意义的机翻系统分类还是两类:一类是通用的,也是免费的(社区医院),另一类是针对用户、甚至由用户提供私有数据定制的,也是付费的(专科医生)。专业领域数据门槛的原因,专科医院的发展之路还需要时间。
5、数据驱动的方法用于机器翻译之后,多年前给外语人打酱油、写语言规则写到生无可恋、做出来的系统还没人用——曾经想过转行的机翻技术专家终于守得云开见月明。而目前部分外语人为算法工程师打酱油——标注数据、做评测。没有任何有色眼镜的意思(笔者也是外语出身),只是感叹某些事情发展方向谁能预料?如果不能预料,不如做跟随自己的热情埋头做一些事。
6、做翻译机的讯飞赚钱了(讯飞听见王玮)。查了下2018科大讯飞年报,讯飞翻译机销售30万台,占品类销售额70%。如果按照单价3000元算,总销售额是9亿人民币。做翻译机起家的创业公司分音塔科技2017年底已经Pre-A轮,估值3亿,后来跟进得比较好的也是互联网公司。为什么做成这件事的既不是机器翻译公司、也不是人工翻译公司?很奇怪,其实也不奇怪,机器翻译公司和人工翻译公司因为自己的“专业”原因,看不见比自己目标用户群大至少一个数量级的用户群。
9、Lilt的Spence Green非常强调目前的PE(译后编辑)会导致血汗工厂(sweatshop work)生产模式。但如果对译者的付费方式不再按照字数付费,而是按照译后编辑时长付费,是否已经很大程度上解决问题?这方面MemoQ已经在探索。
答:是这一代机器翻译技术专家无法预测的样子。因为前两代被颠覆的规则机器翻译和统计机器翻译技术,其颠覆者都不是从事机器翻译的(阿里巴巴达摩院陈博兴)。
12、以上只是一些零散的记录和思考,记录的部分嘉宾言论,都注明了出处。没有注明出处的,可以理解为胡说~
-End-
1、欢迎关注后续官方发布的现场报道,官方论坛《2019西湖机器翻译论坛》:http://mtforum.niutrans.com/index.html。
2、现场完整视频回放链接:http://ttv.cn/archives/4042 或点击“阅读原文”跳转,来自译直播。
3、关于交互式机器翻译,有兴趣的朋友可以参考:《交互式机器翻译产品的商业逻辑》、《人机交互式机器翻译研究与应用》。
4、如果这块砖能引来玉,有朋友愿意发表感想,本公众号很乐意做一个发布渠道。
-End-
【往期精选】