技术动态 | 一文读懂事件知识图谱
转载公众号 | 普适极客
文章来源 | 中国科学院网络数据重点实验室
【导读】随着事件这类动态知识得到越来越多的关注,学术界涌现出许多事件知识图谱相关的概念。但究竟事件知识图谱是怎么发展而来的?什么是事件知识图谱?它和其他相关概念之间有什么关系?我们怎么构建它?它有什么用?带着这些问题我们一起来简单看看中科院计算所网络数据科学与技术重点实验室近期被TKDE接收的综述文章《What is Event Knowledge Graph: A Survey》(作者:官赛萍,程学旗,白龙,张付俊,李紫宣,曾宇涛,靳小龙,郭嘉丰)。
论文链接:
https://ieeexplore.ieee.org/document/9792280
https://arxiv.org/abs/2112.15280
【事件知识图谱是怎么发展而来的?】
事件知识图谱是自然语言处理和人工智能发展的产物。它的发展历程可以划分为四个阶段,追溯到事件、事件抽取、事件关系抽取、知识图谱、事件图谱、事理图谱等。
图1 事件知识图谱的发展历程
【什么是事件知识图谱?】
事件知识图谱以事件为中心,包括事件和实体两类节点,事件-事件、事件-实体和实体-实体三类有向边。第二类关系表示事件的论元,边为对应论元(实体)在所连事件中扮演的角色。
图2 事件知识图谱及其应用例子
【事件知识图谱 vs 其他相关概念】
目前有很多事件知识图谱相关的概念,比如:事件图谱、以事件为中心的知识图谱、以事件为中心的时序知识图谱、事理图谱(一开始叫Event evolutionary graph,后来演化为Event logic graph)。与事件知识图谱相比,事理图谱只关注本体层的知识,而且事件图谱和后来的事理图谱的节点是复合结构,难以处理。此外,这些事件知识图谱相关的概念都只考虑了特定有限的事件关系和事件论元。
表1 事件知识图谱相关概念的对比
【怎么构建事件知识图谱?】
如图2所示,事件知识图谱包括本体部分和实例部分。这里以事件知识图谱实例构建为例,简要介绍构建流程。完整的流程包括事件抽取、事件关系抽取、事件共指消解和事件论元补全这四步。其中前两步是基本和必须的,后两步是锦上添花的。
图3 事件知识图谱实例构建流程
事件抽取是最基本的步骤,旨在抽取出结构化的事件信息,包括事件触发词、事件类型、事件论元和对应的角色。事件抽取可以分为基于事件体系的和事件体系未知的,前者包括句子级和文档级两类,后者又称为开放域事件抽取。虽然事件抽取得到了广泛的研究,效果却难以令人满意,亟待提升该基本任务的效果。
图4 现有事件抽取做法
事件关系抽取抽取事件之间的关系,将事件关联起来,形成事件知识图谱。其中最重要的两类关系是事件时序和因果关系。方法从早期的基于特征的,到后来的基于神经网络的,到最近流行的基于预训练语言模型的。然而,现有方法只关注动词事件,未考虑名词事件,同时它们未将事件论元考虑在内。
图5 现有事件关系抽取做法
相同的事件常常被多处提及,因此需要事件共指消解将指向相同现实事件的那些事件组成一组。事件共指消解可以分为文档内和文档间的事件共指消解。方法包括无监督、半监督和有监督方法。其中有监督方法又分为建模事件对的和所有前序事件一起建模的。目前这些方法大多指定所有事件有固定的相同论元,未考虑不同事件往往论元不同。此外,一些方法只进行文档内的事件共指消解,未考虑文档间的事件共指消解。
图6 现有事件共指消解做法
原文本中的信息往往不完整,而事件抽取也会有遗漏,因此需要事件论元补全填充缺失的事件论元或角色。早期方法借鉴句子要素主题匹配方法。带有时间信息的事件知识图谱可以按时间组织成图序列,因此后来有方法利用基于图序列的事件要素向量表示进行事件论元补全。事件论元是典型的多元关系,多元关系补全的方法也可以应用过来。然而,现有方法只关注事件自身进行补全,未考虑事件-事件关系。此外,事件论元补全被简化为推理一个缺失的事件论元或角色,而往往事件论元和角色都是缺失的。
图7 现有事件论元补全做法
【事件知识图谱有什么用?】
基本的应用包括脚本事件预测、时序知识图谱预测、事件脉络生成等。下游应用包括搜索、问答、推荐、金融量化投资等。然而,由于事件知识图谱是一个相对比较新的概念,实际应用比较少,在实际应用中引入事件知识图谱将很有前景。
表2 事件知识图谱应用总结
【未来研究方向】
高性能的事件获取:事件抽取和事件关系抽取的精度尤其低,阻碍了高质量事件知识图谱的构建,并且现有方法通常未考虑复杂度的问题。因此,效果好并且效率高的事件获取研究是未来至关重要的研究方向。
多模态知识处理:在现实世界中,事件可能以文本、图像、音频和视频的形式呈现,不同模态的信息可以消除歧义,相互补充。因此,多模态信息联合利用是未来的重要研究方向。
可解释事件知识图谱研究:现有研究主要用深度学习方法拟合训练数据,缺乏可解释性,不知道它们为什么和如何起作用。在实际应用中知道最终结果的解释是友好而令人信服的。未来需要研究可解释的事件知识图谱方法。
实用的事件知识图谱研究:现有的任务和方法与现实场景相差甚远。一些任务的形式化过于理想化。对于方法而言,图神经网络被广泛用在简化的任务和数据集上,使用方法类似于其在知识图谱的用法。未来方法需要关注事件及其论元的原子性,事件-事件关系和实体-实体关系。
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。
点击阅读原文,进入 OpenKG 网站。