其他
第三期千言万语:篇章事件抽取中的要素组合问题
导语:篇章作为更丰富的信息承载形式,在带来更多上下文信息的同时,也带来了新的挑战。事件抽取作为实体抽取、关系抽取等信息抽取任务的复杂集合,在篇章单元中存在论元跨句分散及触发词缺失的问题,这使得篇章事件抽取无法被建模为一个简单的触发词中心树还原任务。本次分享将立足于事件要素组合问题,与大家一同探究相关的研究进展。
事件描述了动作和状态的转变过程。事件抽取任务作为一种典型的信息抽取任务,旨在从文本中总结发生事件的类别,并抽取出该事件的参与者,从而将冗余的信息结构化。事件抽取任务在事件预测(科学算命)和信息检索中有着广泛的应用,为常识抽取和知识推理提供了坚实的基础。
篇章作为一种常见的文本形式,比简单的孤立句子蕴含了更多上下文和丰富的语义信息。然而,篇章事件中的要素往往分布于文中的各个句子,为文档建模带来许多困难。此外,由于语料较长,事件的触发词被淹没在了茫茫文海中,因此篇章事件语料中的触发词往往存在标注质量问题或缺失的情况。
在传统的事件抽取中,一个事件实例可以被转化为一个以触发词为中心的树结构。而当要素连接的“桥梁”缺失时,事件要素的组合就变得异常困难。
针对触发词缺失的事件要素组合问题,一些研究者将篇章事件抽取转换为一个自回归式的有向无环图构建过程,每步分别预测事件参与者的不同角色。也有研究人员将要素组合转化为新型的结构化预测任务,从而减少了触发词缺失带来的不利影响。
本期千言万语邀请来自苏州大学的朱桐博士,将为大家分别介绍上述方案的建模方法和技术细节。
扫码进群,观看直播
参与抽奖,赢精美礼品
活动详情