查看原文
其他

一周锋报丨语言服务取得突破性进展 智能写作与机器翻译受关注

2016-10-02 语言锋标 锋标



本周是10月的第一周,国庆小长假开始了,语言生活也开启了国庆休假模式。


汉语智能写作系统取得突破性进展,机器人也会有情有义;国家外文局为“一带一路”提供战略支持,人工翻译平台覆盖沿线60种语言;广东海关机器人“关员”,多语对答;“汉字之美”2016全球青年设计大赛落幕。


“香港本土派”人士划分“语言阶级”,英语>粤语>普通话。


假期,选择做一头“Sleep camel”……


语言科学新发现:噪音影响幼儿语言发育。有观察表明:谷歌翻译接近人工翻译水平。


越南教育部门提议将汉语列为初级教育第一外语。



精彩内容

国家翻译平台覆盖“一带一路”60种语言

汉语智能写作已经“有情有义”

海关机器“官员”已能多语对答

“香港本土派”划分“语言阶级”

假期选择做一头“Sleep camel”

科学研究:噪音影响幼儿语言发育

观察表明:谷歌翻译接近人工水平

“汉字之美”全球青年设计大赛落幕

越南拟将汉语列为初级教育第一外语


语言服务

国家翻译平台覆盖“一带一路”60种语言



9月30日是一年一度的“国际翻译日”,北京中外翻译咨询有限公司设立的互联网人工翻译平台已吸纳译员10万人,可提供约60种语言的口译、笔译服务,涵盖普什图语、泰米尔语、吉尔吉斯语等“一带一路”沿线稀小语种。


中外翻译咨询公司是中国外文局的直属单位,作为“翻译国家队”的一部分,承担“一带一路”相关的采编和翻译工作。2016年初,该公司推出“译鱼”互联网人工翻译平台。目前,平台注册有10万名译员,将承担国家项目、公益项目、文档项目和即时项目,成为“一带一路”跨文化交流的桥梁。翻译需求方一键下单翻译需求,后台匹配具有专业领域经验的译者、资深审校和母语专家跟进翻译流程,确保及时提交高质量的翻译结果。


汉语智能写作已经“有情有义”


汉语智能写作已经取得了突破性进展,不再是单纯的组稿,更添加了情感因素,令人吃惊。


汉语智能写作成果是首都师范大学副校长周建设教授担任领衔专家的研究团队经过多年探索,在语言智能研究领域取得的一项重大理论和技术突破。周建设教授介绍,智能写作是利用计算机完全自动地对收集的文档进行整理、提取、过滤、筛选、组装、写作,自动地生成相关文章。目前,智能写作平台能够完成受限语体的文稿,受限语体是有特定使用场合,结构、格式比较固定的语体。


汉语智能写作平台包含32项关键技术,其所写文稿内容流畅性、语义准确性与人工写作的差别在缩小。 在语言生成的过程中,汉语智能写作平台对所要表达的信息进行语义和语法方面的聚合,其中,内容规划即内容确定+结构构造,句子规划包括选词、优化聚合、指代表达式生成等,句子实现就是将经句子规划后的文本描述映射至由文字、标点符号和结构注解信息组成的表层文本。


汉语智能写作平台构建了基于汉语智能表达的知识库,其一是语言模板库——单词、短语、句子语料库;其二是语义类型库——给汉语智能表达提供话语论域,以便将话题限定在特定语义领域内布局谋篇、组织语句。有两个子系统支持汉语表达智能模型,即“词项—语句”语义网络,实现从词到句子的自动生成;“语句—语篇”语义网络,实现自然语言语篇的自动生成。


中国科学技术信息研究所研究员张寅生说,从高混乱度的信息材料中抽取知识,按特定场景、话题、文体进行写作,难度很大。他认为,这种汉语集成写作体现了人类智慧,是言语生成研究方向的历史性突破。


海关机器“官员”已能多语对答


10月1日,首批10台智能机器人(下文中“小海”)加入拱北海关大家庭,在拱北、横琴、中山港等3个口岸旅检现场同步“上岗”,辅助旅检查验,为进出境旅客带来全新的服务和体验。这是全国海关旅检口岸首批达到智能程度的机器人投入使用。 


机器人研发单位负责人介绍,小海是依托大数据、智能语音、人脸识别等人工智能技术为核心研发的智能海关机器人。一方面,它具有丰富的感知技术,可进行实时翻译、智能问答;另一方面,它可植入先进的人脸识别技术,快速识别可疑人物,大幅度提高海关打击走私效能。


为适应海关旅检监管的业务需求,拱北海关对该批机器人“量身定做”了多项功能,如配备了专门的海关业务数据库,已储存了3200多条海关旅检常见问题,内容涵盖海关法律法规、办事服务指南、通关数据查询等。对于常见的旅检通关问题,机器人小海能运用广东话、普通话、英语、日语等28种方言和语言进行问答。未来一至两年,小海的数据库还将录入10万条业务数据。


观察表明:谷歌翻译接近人工水平

 

Google Translate作为一种在线翻译工具,推出已有10多年之久,如今已经能够翻译100多种语言,而且还能够翻译外国餐馆的菜单和标识系统,甚至还能实时鉴别方言。


Google Translate使用的是谷歌神经网路机器翻译系统(Google Neural Machine Translation),简称GNMT。Google Brain团队详细阐述了GNMT的来龙去脉,其底层结构是一个长短期记忆网络(LSTM)。LSTM是一个神经网络技术,工作模式与自然人的记忆模式有点类似。常规的翻译算法是将一个句子分成各个单词,这些单词再与字典配对,但是,像谷歌新翻译算法的LSTM支持系统能够有效的进行“记忆”一个句子的始终。因此,Google Translate就能够进行双向处理:GNMT分解单词的意思,进而再整合到句法成分之中,然后再将此结果翻译成另外一种语言。神器?神话?谷歌翻译又出来赚眼球了



语言热点

“香港本土派”划分“语言阶级”


近日,港大中文学院公布了课程授课安排,有接近一半的课程将由普通话授课,该校学生会的一名学生为此向校方抗议。


她认为,粤语授课课程近年来越来越少,担心粤语课程灭绝,影响本地学生学习成果。早在本月初,一名教授讲授的“古代文学评论”课程同样遭到她的投诉,理由竟然是该课教授下发的教学大纲以简体字印刷。


普通话受到抵制并不是第一次出现,有不少大陆学生反映,香港学生常常怀有一种“香港本土派”的傲慢,表现在语言使用上是语言使用的优先级和阶级观。 


在“香港本土派”的极端人士看来,语言不仅仅是用来交流的工具,更是“阶级”的象征。西方世界的“英语”最高贵,粤语其次,而普通话最不上档次。甚至有香港白领叫嚣:“普通话是次等语言”。


“汉字之美”全球青年设计大赛落幕


9月27日,“汉字之美”创意设计国际论坛暨2016全球青年设计大赛颁奖典礼在北京落幕。


“汉字之美”创意设计国际论坛由北京师范大学、清华大学美术学院共同主办,首都文化创新与文化传播工程研究院发起,并联合清华大学平面系统开发研究所、汉仪字库共同承办。 


作为全球性的青年创意设计比赛,“汉字之美”全球青年设计大赛通过设计语言,充分挖掘汉字创意魅力,扩大汉字文化的国际认同,推进汉字文化的对外传播工作,持续扩大中国文化在全球的影响力。


“汉字之美”2016全球青年设计大赛以“心灵生活”为主题,要求参赛者以30个包含“心”字偏旁部首的汉字字库中任意一字为创意起点,在理解其意义内涵并进行积极思考的基础之上,立意“心灵生活”,完成一件设计作品。 


科学研究:噪音影响幼儿语言发育


芬兰专家的一项新的研究表明,噪音对孩子语言发展存在风险。如果房间里有很多背景噪音,如风吹动球和瓶子的声音,孩子们就很难识别文字和字节。而2岁年龄段的孩子是语言发展最快、最关键阶段。因此,为了更好的促使幼儿语言发育,创造良好的声音环境至关重要。


假期,选择做一头“Sleep camel”


对于上班族而言,保持充沛的精力和较高的效率,需要充足的能量。相对于国庆节出游而言,不少上班族国庆节选择在家里做一头“Sleep camel”。


“Sleep”睡眠,“camel”骆驼。“Sleep camel”汉语即为“睡眠骆驼”。骆驼是一种积蓄能力很强的动物,它们可以多日不吃不喝,一旦遇到水草,便大量贮存。“Sleep camel”借用骆驼来比喻,指的是可以多日少睡,到了休息的时候就充分补足睡眠、积蓄能量的人。



汉语推广

越南拟将汉语列为初级教育第一外语


越南教育与培训部提议,从2017年起将汉语增列为初级教育的第一外语。当地教育界对于当局鼓励学生学习汉语表示欢迎。


根据2016-2020年外语教学和研究的提议,第一外语为必修语文。越南三到十二年级的学生可从英语、法语、汉语、俄语和日语中任选一科学习。


越南中文教学专家阮氏林秀接受当地媒体采访时说,将中文列为第一外语有助于越南学生更好地理解中国,也为他们未来求职提供了良好的机会,因为目前越南非常需要会说汉语的工作人员。她认为,尽管英语的使用非常普遍,也被很多国家列为官方语言,但“汉语是世界上使用人数最多的语言,中国是世界第二大经济体,学好中文,越南人可以更好地进入庞大的中国市场”。



材料来源:环球网、新华网、南方都市网等

图片来源:百度、人民网、国际在线、中新网等

 精彩回顾 

9月第1周

一周锋报丨26个字母解读B20,10种语言服务G20

9月第2周

一周锋报丨国家语委发布“十三五”规划

9月第3周

一周锋报丨教育部、国家语委发布《国家语言文字事业“十三五”发展规划》

9月第4周

一周锋报丨全国知识图谱与语义计算大会召开

8月第1周

一周锋报丨G20多语服务上线  白岩松获封“国家级段子手”

8月第2周

一周锋报丨“洪荒之力”席卷全球  西语官方翻译出炉

8月第3周

语言锋报丨游泳队神回复成新网红  乒乓球队领跑“反差萌”

8月第4周

一周锋报丨中译局发布重要术语6语译文 科学实验表明鸟类能学会语法结构





  
本期撰稿人:申镇纲




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存