其他
第二届语言数据科学与应用论坛(12.17)
为推动“语言数据科学与应用”学科的发展,活跃语言数据研究及语言相关人工智能研究,西安外国语大学外国语言文学研究院与上海外国语大学语料库研究院拟定于2022年12月17日举办“第二届语言数据科学与应用论坛”,诚邀各界学者拨冗参会。
会议时间
参会方式
特邀专家(按发言顺序排序)
赵铁军,哈尔滨工业大学教授、博士生导师,中国中文信息学会常务理事,中国中文信息学会自然语言生成与智能写作专业委员会(筹)主任,《中文信息学报》编委,中国计算机学会自然语言处理专业委员会副主任。主要研究方向为自然语言处理、人工智能应用。承担过多项国家项目,担任国家重点研发计划项目(2018YFC0830700)首席科学家(2018~2021);近5年发表学术论文50余篇,获得发明专利10余项,出版专著、译著4部;先后获省部级科技进步奖6项。
发言题目: 深度学习时代的机器翻译技术摘要: 深度学习与机器翻译的结合极大提升了自动翻译的性能,使得机器翻译开始走向实用。报告简要回顾了机器翻译的各种代表性技术以及评价方法,这些技术划分了机器翻译发展的不同阶段。重点介绍深度学习(深度神经网络)技术在机器翻译领域的应用,该应用开辟了机器翻译新阶段即神经机器翻译时代。报告概要介绍神经机器翻译的基本模型、注意力机制的应用、神经机器翻译各种新模型,最后介绍多语言神经机器翻译的进展。
梁茂成,北京航空航天大学外国语学院教授、博士生导师,南京大学应用语言学博士,北京外国语大学中国外语教育研究中心博士后,英国伯明翰大学访问学者。2008年人才引进入职北京外国语大学中国外语教育研究中心,2018年人才引进入职北京航空航天大学。担任国家社科基金通讯评审专家、教育部人文社科项目评审专家、国家留学基金委评审专家、中国博士后科学基金评审专家,国内外多家学术期刊审稿专家。多年以来主要从事语料库语言学研究和应用语言学研究,并设计开发多款语言分析软件,是iWrite英语作文智能评阅系统总设计人。发言题目: 文本向量化及其应用研究摘要: 自然语言处理中的文本向量化技术经历了几个不同阶段,其性能得到显著提高。如今,随着基于大数据和深度学习技术的BERT预训练模型得到有效利用,文本向量化达到了可与人工媲美的效果,对语言学研究具有十分重要的应用价值。本研究梳理文本向量化发展历程,分析BERT预训练语言模型的优势,并通过实例讨论了该模型在语言学研究中的可能应用。
李晶洁,上海外国语大学语料库研究院教授。研究方向主要为语料库语言学、计量语言学、学术英语研究等。上海交通大学外国语言学及应用语言学博士,英国利物浦大学“信息与语言系统研究中心”博士后。获批国家发明专利1项;在International Journal of Corpus Linguistics、《外语教学与研究》、《外国语》、《外语电化教学》、《外语与外语教学》等SSCI、CSSCI期刊发表研究性论文近20篇。主持国家社科、上海市社科等多项科研项目。
发言题目: 基于情感倾向分析的语义韵强度算法探析摘要: 将语言情感分析技术应用于语义韵强度计算,并在扩展意义单位的理论框架下,探讨语义韵强度更精细测量的可行性和操作性。现有语义韵强度测量方法多是基于频数的极性占比算法,其共性是默认同一极性范畴的搭配词具有等值的态度或情感强度,却无法深入语义韵极性范畴内部,对同一极性下的语义韵强度做更细致的差异化分析。辅以情感分析技术支撑的语义韵强度量值,能够更精细地展示不同节点词之间,以及同一节点词在不同搭配型式、语义趋向下的语义韵特征异同,帮助研究者更深入了解节点词共现语境的态度意义氛围,以及扩展意义单位构成元素之间的关联。
倪亦斌,上海外国语大学语料库研究院教授,英国伦敦大学学院博士,伦敦大学亚非学院进修中国艺术史,哈佛大学访问学者(2000-2001)。长期在新加坡国立大学英语系和卓越学院任教。参与撰写牛津大学出版社出版的《中国:帝国与文明》(China: Empire and Civilization)(2000)、华盛顿大学发行的《顺治瓷》(Treasures from an Unknown Reign: Shunzhi Porcelain)(2002)、《上海博物馆与英国巴特勒家族所藏十七世纪景德镇瓷器》(2006)、英国泰晤士-哈得逊出版社出版的《中国的七十个奇迹》(The Seventy Wonders of China)(2007)、卢森堡大公国《英国巴特勒家族所藏晚明瓷器》(Late Ming: Chinese porcelain from the Butler collections)(2008)、美国现代语言学会(Modern Language Association)出版的《<红楼梦>教学参考书》(Approaches to Teaching The Story of the Stone (Dream of the Red Chamber))(2012)、《文采若然:洁蕊堂藏康熙盛世瓷》(2017)、《鲤跃龙门–巴特勒爵士珍藏十七世纪中国瓷》(2021)。编辑英文版Dictionary of Chinese Ceramics(《中国陶瓷辞典》)(2002)。北京中华书局出版《看图说瓷》(2008)。在《艺术世界》、《紫禁城》等多种专业杂志开设专栏。在英国《东方陶瓷学会会刊》(The Transactions of the Oriental Ceramic Society,TOCS)、《东方艺术》(Oriental Art)和美国《古董与美术》等专业杂志发表多篇文章。曾应邀在哈佛大学、耶鲁大学、中国国家博物馆、复旦大学以及新加坡各大学等上百个国内外大学、机构团体作学术演讲。发言题目: 隔靴搔痒和指鹿为马:学界误读中国传统故事图像现状摘要: 明清换代使得中国故事图像传统遭受断崖式破坏。乾隆朝以后,大部分原来基于文学脚本的故事图像逐渐失传。二十世纪世事的剧烈动荡和世界所经历的全球化、后现代化过程造成传统的进一步断裂毁灭,使传统社会中妇孺皆知的图像生活教科书,变得与世人疏离隔膜。长期以来,国内外专业学者和世界各大博物馆及藏家展陈目录中误读中国传统故事图像的例子比比皆是,作为中华民族民族认同的集体记忆和民族精神的物质体现濒临失传消亡的危殆处境。认真整理各种具体案例、了解现状的严重性是我们更好地了解和弘扬中国传统故事图像这笔宝贵精神财富的基础。
雷蕾,博士,上海外国语大学语料库研究院教授、博士生导师。研究兴趣涉及语料库语言学、学术英语、计量语言学等领域。在剑桥大学出版社等出版专著5部,在Applied Linguistics, Language Teaching, Journal of English for Academic Purposes, International Journal of Corpus Linguistics等SSCI期刊发表研究性论文近40篇、书评10余篇,其中两篇论文入选ESI高被引论文;在CSSCI期刊发表论文及书评10余篇。主持完成国家社科基金等项目多项。Journal of English for Academic Purposes等期刊编委。发言题目: 语言数字人文:理论与方法摘要: 语言数字人文是采用数字技术和方法以提出或解决语言学及其相关问题的新兴研究领域,是数字人文这顶“大帐篷”下的“小帐篷”。语言数字人文具有天然的跨学科属性,在这顶 “小帐篷”下,语言学、文学、翻译、计算机科学、信息科学、社会学、心理学、新闻传播等学科的智慧和方法交叉碰撞以产生新知。本发言拟围绕语言数字人文的理论框架与研究方法展开,并认为,在当前发展阶段,我们需搁置学科还是方法的争议,尊重语言数字人文的实践属性,以应用研究和基础建设成果推动语言数字人文研究的发展,助力新文科建设。
米成刚,目前任职于西安外国语大学外国语言文学研究院,西安外国语大学语言大数据研究中心负责人,“西外学者”青年优秀人才。中国科学院大学计算机应用技术博士。主要研究兴趣为自然语言处理、机器翻译。2015年7月至2018年9月于中国科学院新疆理化技术研究所任助理研究员。2018年10月至2021年11月于西北工业大学计算机学院从事博士后研究。近五年来,在本领域学术期刊及会议Neural Networks,ACM TALLIP,IEEE TETCI,Machine Translation,COLING,ICTAI,LREC等发表论文二十余篇。主持国家自然科学基金青年基金,中国科学院“西部青年学者”B类项目各一项。作为骨干成员参与国家重点研发计划,科技部重大专项,国家自然科学基金重点项目等国家级项目多项。
发言题目: 资源稀缺语言神经网络机器翻译研究摘要: 近年来,神经网络机器翻译及相关理论得到了迅速地发展。一些方法在具有丰富数据资源语言对上的翻译质量也不断得到改善。然而,由于其性能依赖于大规模双语数据,因此在资源稀缺语言对上不能取得理想的翻译效果。作为目前机器翻译领域的重要研究热点之一, 资源稀缺语言神经网络机器翻译吸引了国内外学者的广泛关注。本报告从数据增广、模型优化等角度对资源稀缺语言神经网络机器翻译的最新研究进展进行介绍。另外,本报告也介绍了所在团队近期在语言选择及外来词识别等方向的最新研究成果。
会议议程
2022年12月17日(周六)下午
分论坛、闭幕式
组织单位
上海外国语大学语料库研究院承办单位西安外国语大学外国语言文学研究院
联系方式联系人:黄立波 米钰邮箱:wyzx@xisu.edu.cn咨询电话 13201673160 宋天祎 13339460045 邹更新 17719554805 米 钰