北京大学王选所学术论坛暨北大智能学科系列学术活动—— 2022自然语言处理日
北京大学王选所学术论坛暨北大智能学科系列学术活动之一“2022自然语言处理日”由北京大学王选计算机研究所、北京大学智能学院、北京大学人工智能研究院联合主办,将于2022年6月3日线上召开。本次学术活动聚焦于自然语言处理领域的前沿研究问题,以特邀报告和圆桌研讨的形式举行。北京大学邀请了多位知名专家学者,将带来精彩纷呈的学术报告和丰富多样的学术观点。
1
日程安排
本次学术活动的具体日程如下:
2
报告及讲者信息
特邀报告1:
语言认知:从NLP到NLU的桥梁
摘要:超大规模预训练语言模型的性能表现不断刷新着人们的认知,学术界和工业界研发机构所从事的研究越来越趋于同质化,不同模态、不同语言和不同任务处理方法的区别愈加模糊,而且越来越多的共享数据、技术和平台,让语言技术甚至整个信息技术领域的进入门槛变得不再高不可攀。那么,语言技术面临的瓶颈是什么?未来发展的出路在哪里?学术界从事这一领域研究的优势是什么?本报告认为,探索类脑语言表征体系,建立知识和推理驱动的语言认知计算模型,是从自然语言处理通向自然语言理解的必由路径和桥梁。报告将在简要阐述本人观点的基础上,介绍近年来团队在语言表征和编解码方面的部分研究工作,希望与大家讨论,并得到各位的批评和建议。
报告人:宗成庆,中国科学院自动化所研究员,博士生导师,ACL/ CAAI/ CCF Fellow。主要从事自然语言处理、机器翻译和语言认知计算等研究,发表论文200余篇,出版专著三部、译著两部。目前担任国际计算语言学委员会(ICCL)委员,中国中文信息学会副理事长,期刊ACM TALLIP 副主编和IEEE IS编委等。曾任亚洲自然语言处理学会(AFNLP)主席,国际一流学术会议ACL 2015和COLING 2020程序委员会主席、ACL 2021大会主席。荣获国家科技进步奖二等奖和多个省部级及国家一级学会的科技奖励,获得北京市优秀教师、中科院优秀导师和李佩教学名师等荣誉。享受国务院特殊津贴。
特邀报告2:
Trustworthy AI: From Principles to Practices
报告人:周伯文,清华大学电子系教授,系IEEE Fellow、中国人工智能学会(CAAI)会士, 多年来从事人工智能基础理论和前沿技术的研究、应用及产业化,研究领域包括语音和自然语言处理、多模态内容理解与生成、知识表征与推理、人机对话、可信赖AI,及其在产业化、数智化的应用。周伯文教授是2020年吴文俊人工智能杰出贡献奖获得者,历任京东集团高级副总裁、京东集团技术委员会主席、京东云与AI总裁、京东人工智能研究院创始院长;此前在IBM T.J. Watson Research Center工作,任IBM Research人工智能基础研究院院长、IBM Watson集团首席科学家(Chief Scientist)、IBM杰出工程师等;并于2021年创立了衔远科技。
特邀报告3:
What does a word mean in the human brain?
报告人:毕彦超,北京师范大学教授。北京师范大学认知神经科学与学习国家重点实验室、IDG/麦戈文脑科学研究院教授。2006年于哈佛大学心理学系获得博士学位。核心研究兴趣为语义记忆和知识表征的认知神经基础,即人脑如何存储知识、如何理解语言、感知信息等的意义。长江学者特聘教授、国家基金委杰出青年。任Cognition, Neurobiology of Language, Cognitive Neuropsychology, Elife等杂志编委。
特邀报告4:
浅谈序列生成模型中的随机性
摘要:近五年来,基于Transformer的序列生成模型在语言建模和其它任务上取得了显著性能提升,如机器翻译、摘要生成、代码生成等。训练阶段各种类型的随机性在这些序列生成模型所展现的强大任务适应性和取得的显著效果提升中起到至关重要的作用。主要的随机性类型可以简单概括为两类:1)模型优化所涉及的多粒度辅助随机性,如数据(word-drop)、神经元(dropout)、网络结构(layer-drop)等随机性;2)(条件)语言模型建模所基于的随机性,如随机掩码语言模型目标(MLM/CMLM)。针对以上两类随机性,本次报告介绍如何设计简单且高效的约束策略,包括模型输出空间的约束方法(R-Drop)和二次自适应掩码策略。相关方法已经在自回归(AT)和非自回归(NAT)两类主流生成范式、多个代表性序列生成任务(如语言模型、机器翻译、摘要生成、代码生成、NLU、图像)、数十个数据集上取得显著效果提升,部分成果成功应用于产业界。
报告人:张民,哈尔滨工业大学(深圳)教授。特聘校长助理,计算与智能研究院院长。国家杰出青年基金获得者,国家“百千万”人才,国家级有突出贡献中青年专家,鹏城孔雀计划A类人才,江苏省双创人才和双创团队首席科学家。长期从事自然语言处理、知识图谱和人工智能研究。发表论文200余篇,专著2部,主编英文论著(论文集)16本,获部级科技进步奖4项。IEEE/ACM T-ASLP、Computational Linguistics、Journal of Natural Language Engineering、SCIENCE CHINA Information Sciences、Journal of Computer Science and Technology (JCST)、Machine Intelligence Research (MIR)、《中国科学:信息科学》、《软件学报》和《自动化学报》编委。享受国务院政府特殊津贴。
特邀报告5:
信息提取的鲁棒性问题
摘要:信息提取主要包括命名实体识别及关系提取两大主要任务,旨在自动地从海量非结构化文本中抽取出关键信息,从而有效地支撑知识图谱构建和智能问答等下游任务。在深度学习时代,由于神经网络,特别是预训练模型已经能自动地提取高层语义特征,人们把更多的精力关注在如何构建预训练任务实现更完备的语义知识嵌入,以及如何高效使用这样的模型。然而,深度学习模型自动提取特征难以避免捷径学习问题,导致现实应用场景下的鲁棒性缺陷,对信息提取的下游应用带来了一些隐藏的危险,在低资源环境下尤为严重。本报告将围绕信息提取的鲁棒性问题展开深入分析,探究影响模型鲁棒性的深层原因,并介绍我们在弱样本、小样本、无标注、跨领域等场景上提升信息提取模型鲁棒性的研究成果。
报告人:黄萱菁,复旦大学计算机科学技术学院教授,博士生导师,主要从事自然语言处理、信息检索和社会媒体分析研究。兼任中国中文信息学会理事、社会媒体专委会副主任,中国计算机学会自然语言处理专委会副主任、学术工作委员会委员、中国人工智能学会女科技工作者委员会副主任、AACL执委,EMNLP 2021程序委员会主席。在高水平国际学术期刊和会议上发表了百余篇论文,负责的多个科研项目受到国家自然科学基金、科技部、教育部、上海市科委的支持。获2021年上海市育才奖,并入选“人工智能全球女性”、“AI 2000人工智能全球最具影响力提名学者”及“福布斯中国2020科技女性榜”。
特邀报告6:文档级关系抽取
摘要:文档级关系抽取(Document-level Relation Extraction DocRE)需要从多个句子中提取实体之间的关系。据统计,在Wikipedia的文档中,有超过40%的关系只能从多个句子中得到。因此,文档级关系抽取以其更切合实际应用的特点,近年来获得越来越多研究者的关注。文档级关系抽取面临着需要综合文本中多个句子之间的信息、涉及多种不同推理方式等各种挑战。同时,由于文档级关系抽取数据标注难度高,获取大规模标注数据成本高,如何充分利用已有数据是一个值得研究的问题。本文将从文档级关系抽取的模型优化、模型可解释性和数据增强等三个方面介绍我们的工作。
报告人:赵铁军,哈尔滨工业大学教授,博士生导师;中国中文信息学会常务理事,中国中文信息学会自然语言生成与智能写作专业委员会(筹)主任,《中文信息学报》编委,中国计算机学会自然语言处理专业委员会副主任。主要研究方向为自然语言处理、人工智能应用。承担过多项国家项目,担任国家重点研发计划项目(2018YFC0830700)首席科学家(2018~2021);近5年发表学术论文50余篇、获得发明专利10项;先后获部级科技进步奖6项,出版专著、译著4部。
圆桌论坛嘉宾
周明博士:创新工场首席科学家。2021年6月,他创立了澜舟科技公司。该公司致力于开发最先进的下一代认知智能技术,包括自然语言和多模态信息的理解和生成、机器翻译、知识图谱、问答和推理、行业搜索、知识服务等技术。周博士曾任微软亚洲研究院副院长、国际计算语言学协会(ACL)主席。现任中国计算机学会副理事长、中国中文信息学会常务理事。曾任微软-清华联合实验室主任、微软-哈工大联合实验室主任。他还担任哈尔滨工业大学、天津大学、南开大学、北航、中国科技大学等高校的博士导师。他也是首都劳动奖章获得者。
朱小燕教授:清华大学计算机系教授。曾任计算机系副主任,智能技术与系统国家重点实验室主任。从事人工智能领域相关工作30余年,主要研究领域为智能信息处理,包括人工神经网络、机器学习、自然语言处理、智能问答系统等。获得国家发明专利十余项,在国际刊物和会议上发表论文100余篇,其中包括IJCAI 2018杰出论文、COLING 2012最佳学生论文、ACL 2010最佳论文、NLPCC 2016最佳论文、NLPCC 2020最佳学生论文等。目前主要集中于新一代智能信息获取与人机对话/交互的研究,所研究的原型系统曾应用于多家知名企业。朱小燕教授在国内人工智能领域的影响力有目共睹,2019年获得吴文俊人工智能科技进步一等奖。位列“人工智能全球女性榜单”,“2019年度中国人工智能100人榜单”。同时,朱小燕教授在国际也上得到了广泛的认可,曾经于2009年被加拿大国际发展研究中心(IDRC)聘请为特聘教授(IRCI)。2012年获得Google研究奖,2014年获得日本大川研究奖等。
3
后续事宜
线上会议安排等相关信息敬请期待~
近期发布
release
2022年王选所校庆活动日程
新闻出版智能媒体技术重点实验室 被评为“2021年度出版业优秀科技与标准重点实验室”
苟向阳:以长期事业的态度对待科研
学习习近平总书记关于教育的重要论述、践行立德树人初心使命 —王选计算机所直属党支部举行主题党课
— 版权声明 —
本微信公众号刊载的所有内容,由北京大学王选计算机研究所微信自身创作、收集的文字、图片和音视频资料,版权属北京大学王选计算机研究所所有;从公开渠道收集、整理及授权转载的文字、图片及音视频资料,版权属原作者。