查看原文
其他

中国知网基于知识图谱的行业应用与创新

CNKI政经法 广东知网 2020-02-12

随着移动互联网的发展,万物互联成为了可能,这种互联所产生的数据也在爆发式地增长,给人们有效获取信息和知识提出了挑战。知识图谱(Knowledge Graph) 以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。


知识图谱(Knowledge Graph)概念最早由Google 2012年提出,是人工智能的重要分支技术。起初是为了更好地服务于搜索。当你输入居里夫人时,搜索引擎会自动定位到玛丽·居里。右侧会显示她的出生死亡日期,研究领域,配偶、子女等信息。这些都是知识图谱的功劳。

如果说以往的智能分析专注在每一个个体上,在移动互联网时代则除了个体,这种个体之间的关系也必然成为我们需要深入分析的很重要的一部分。在一项任务中,只要有关系分析的需求,知识图谱就“有可能”派的上用场。

无论是学术界还是创投圈,不宣称自己懂一些或是有一些知识图谱的技术,仿佛就是远远落后于时代。本文以通俗易懂的方式来讲解知识图谱相关的知识,带您走进人工智能的最前沿,感受中国知网基于知识图谱的行业应用与创新。


一 、什么是知识图谱


从学术的角度,我们可以对知识图谱给一个这样的定义:“知识图谱本质上是语义网络(Semantic Network)的知识库”。从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图(Multi-relational Graph)。 


那什么叫多关系图呢?图是由节点(Vertex)和边(Edge)来构成,但这些图通常只包含一种类型的节点和边。多关系图一般包含多种类型的节点和多种类型的边。如下图,表示一个经典的图结构。

常见的知识图谱示意图主要包含有三种节点:实体、概念、属性。如下图所示,节点代表物理世界中的实体或概念,边则代表实体的属性或它们之间的关系。


二、知识图谱发展历程


知识图谱的概念演化可以通过下图来概括:

1960年语义网络(Semantic Networks)作为知识表示的一种方法被提出,主要用于自然语言理解领域。它使用图来表示知识的结构化方式。如下图。

1980年出现了本体论(Ontology),用来刻画知识的结构。下图以交通工具本体的局部为例。

1989年Tim Berners-Lee发明了万维网,实现了超文本间的链接。


1998年语义(互联)网 (The Semantic Web) 被提出,它从超文本链接延展到语义链接,搜索引擎可以直接对事物进行搜索,而不仅仅是对网页进行搜索。


2012年Google发布了其基于知识图谱的搜索引擎产品。据说目前实体的数据已经达到数十亿级,有达到千亿级的实例关系。


Google此前的搜索方式以文字为主,新上线的知识图谱集成于搜索页的右栏,可为用户提供地图、维基百科条目等各种各样的知识。

Google彩蛋:知识图谱利用万圣节卖萌

Google搜索[丧尸]、[木乃伊]、[骷髅]等关键词出现的万圣节彩蛋。比如上图:鬼的食物来源是“空气、人的恐惧、被人想起”,躲避的方法是“烧鼠尾草;切勿在墓地建水池;远离闹鬼的地方”,打败它们就要“ 打电话给捉鬼特工队”。


三、知识图谱构建流程


通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,而且提供了一种更好的组织、管理和利用海量信息的方式。那么从“知识”到“图谱”有几步呢?

1、知识表示与建模

将现实世界中的各类知识表达成计算机可存储和计算的结构。用知识图谱(本体)对各种类型的数据进行统一建模。

2、知识获取

利用实体识别与链接、实体关系识别、以及事件知识学习技术,对数据进行抽取和转换,形成知识图谱形式的知识,以及和知识图谱里面的结构化的知识进行链接。

3、知识融合

语义集成将不同的知识图谱融合为一个统一、一致、简洁的形式,为使用不同知识图谱的应用程序间的交互建立操作性。一个语义集成的常见流程主要包括:输入、预处理、匹配、知识融合和输出5个环节。

4、知识图谱查询和推理计算

知识图谱存储和查询研究如何设计有效的存储模式支持对大规模图数据的有效管理,实现对知识图谱中知识的高效查询。知识推理则从给定的知识图谱推导出新的实体跟实体之间的关系。


中国知网的知识图谱构建流程为例:

四、知识图谱的应用

如何根据业务需求设计实现知识图谱应用,并基于数据特点进行优化调整,是知识图谱应用的关键研究内容。其中知识图谱的典型应用包括语义搜索智能问答以及可视化决策支持三种。


以中国知网在知识图谱运用方面的实践为例:

1、语义搜索

利用知识图谱可以准确地捕捉用户搜索意图,进而基于知识图谱中的知识解决传统搜索中遇到的关键字语义多样性及语义消歧的难题,通过实体链接实现知识与文档的混合检索。下图以贵州省与中国知网联合打造的“贵州大数据智库平台”为例:


2、智能问答

问答系统(Question Answering,QA)是信息服务的一种高级形式,能够让计算机自动回答用户所提出的问题。智能问答系统被看作是未来信息服务的颠覆性技术之一。

如图所示,当地方方面面的信息,系统都能给你答案。



贵州大数据平台数据智能问答系统

3、可视化决策支持

可视化决策支持是指通过提供统一的图形接口,为用户提供信息获取的入口。如图,该平台通过节点探索、路径发现、关联探寻等可视化分析技术展示XX市经济运行的全方位信息。



五、 中国知网基于知识图谱的行业应用

01知识图谱应用分类

通过以上内容我们对当下知识图谱的整体应用有了大致的了解,下面我们按照分类具体看一下知识图谱的应用。

从领域上来说,知识图谱通常分为通用知识图谱和特定领域知识图谱:

通用知识图谱:一个面向通用领域的“结构化的百科知识库”,其中包含了大量的现实世界中的常识性知识。通常运用百科数据进行自底向上(Top-Down)的方法进行构建,下图展示的即是常识知识库型知识图谱。

领域知识图谱

领域知识图谱常常用来辅助各种复杂的分析应用或决策支持,在多个领域均有应用,不同领域的构建方案与应用形式则有所不同。

02 中国知网在领域知识图谱方面的应用

中国知网拥有多元、权威的知识型数据积累,以及深厚的领域知识图谱构建经验及队伍,庞大的高精尖领域专家库。知识图谱研究团队设计了一套框架来实现知识表示和推理,运用知识图谱技术驱动不同领域各行业应用高速发展。

知识型图谱

数据图谱

用户图谱

行业应用

人大法规审查系统

解决法规审查时下位法与上位法相同事项的一致性问题,通过对全国法律法规数据进行基于语义层面的检索与比对,对相同法律事项的条文进行语义提示并按效力级别分组,帮助工作人员从大量的法条搜集、检索、查找同类法条等工作中解脱出来,提高审查效率。

信访处理智能辅助系统

基于信访业务,整合信访历史积累的大数据资源,通过知识图谱等大数据分析技术,对信访形势进行实时监测与准确预测,既可以随时掌握信访形势发展动态,又能从源头上对信访未来发展的可能性做出预判,实现未雨绸缪,将信访矛盾冲突化解在萌芽状态。

人社智能问答服务平台

通过智能问答系统,支持人力资源和社会保障部门向社会公众提供高效咨询服务。可针对不同的问题进行精准的相关答案推送。平台既可以嵌入人社部门或政府官网,也可以安装在触摸屏、机器人上并放置在人社服务大厅供社会公众査询。


参考资料

①李文哲(人工智能、知识图谱领域专家):从零到一学习知识图谱的技术与应用

②清华大学人工智能研究院、北京智源人工智能研究院、清华-工程院知识智能联合研究中心联合推出的人工智能知识图谱报告




来源:CNKI政经法



推荐阅读:



如果觉得不错,请点好看哦↓↓↓

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存