其他
终于有人把知识图谱讲明白了
导读:知识图谱的概念诞生于2012年,由Google公司首先提出。知识图谱的提出是为了准确地阐述人、事、物之间的关系,最早应用于搜索引擎。知识图谱是为了描述文本语义,在自然界建立实体关系的知识数据库。一般情况下,我们可以使用关系图来表示知识图谱。
在Web视角下,知识图谱如同简单文本之间的超链接一样,通过建立数据之间的语义链接,支持语义搜索。 在自然语言处理视角下,知识图谱就是从文本中抽取语义和结构化的数据。 在知识表示视角下,知识图谱是采用计算机符号表示和处理知识的方法。 在人工智能视角下,知识图谱是利用知识库来辅助理解人类语言的工具。 在数据库视角下,知识图谱是利用图的方式去存储知识的方法。
实体:又叫作本体(Ontology),指客观存在并可相互区别的事物,可以是具体的人、事、物,也可以是抽象的概念或联系。实体是知识图谱中最基本的元素。 关系:在知识图谱中,边表示知识图谱中的关系,用来表示不同实体间的某种联系。如图3-1所示,图灵和人工智能之间的关系,知识图谱和谷歌之间的关系,谷歌和深度学习之间的关系。 属性:知识图谱中的实体和关系都可以有各自的属性,如图3-2所示。
知识源:包括结构化数据、非结构化数据和半结构化数据。 信息抽取:就是从各种类型的数据源中提取实体、属性以及实体间的相互关系,在此基础上形成本体的知识表述。知识图谱的构建过程中存在大量的非结构化或者是半结构化数据,这些数据在知识图谱的构建过程中需要通过自然语言处理的方法进行信息抽取。从这些数据中,我们可以提取出实体、关系和属性。 知识融合:主要工作是把结构化的数据以及信息抽取提炼到的实体信息,甚至第三方知识库进行实体对齐和实体消歧。这一阶段的输出应该是从各个数据源融合的各种本体信息。 知识加工:知识加工阶段如图3-6所示,其中知识推理中重要的工作就是知识图谱的补全。常用的知识图谱的补全方法包括:基于本体推理的补全方法、相关的推理机制实现以及基于图结构和关系路径特征的补全方法。
更多精彩👇