对制造业了解不深的阿里,如何构建工业知识图谱?
▲点击上方 雷锋网 关注
2019年,知识图谱成为工业互联网领域中的香馍馍。
文 | 王金旺
工业互联网中,数字孪生讲了这么久,是时候讲讲与数字孪生强关联的知识图谱了。
于是,2019年,知识图谱成为工业互联网领域中的香馍馍。
工业互联网中的这块香馍馍渐渐浮现。
工业知识图谱要具备哪些能力?
企业如何构建自己的知识图谱?
制造业企业如何应用知识图谱?
就这三个问题,雷锋网在今年的杭州云栖大会上,找到了阿里给出的答案。
知识图谱对于互联网企业来说,其实不是一个新概念,包括百度的搜索引擎,淘宝的推荐引擎都已经在应用知识图谱。
互联网应用中的知识图谱是通过自下而上的方式构建的,通过业务数据的沉淀,大数据的积累,以一个持续构建、持续优化的过程逐渐构建起知识图谱。
然而,这样的构建方式在工业领域并不适用。
由于工业中包括检修、预测等要求高精准的应用,专业领域特定场景应用数据量小,决定了工业知识图谱的构建将是自上而下的一个过程——定义应用场景、定义问题、找到相应数据。
在杭州云栖大会上, 阿里云智能高级解决方案架构师刘志龙介绍称。
工业知识图谱需要具备怎样的能力?
知识构建能力、知识抽取能力、知识辅助能力。
具体而言,包括:
知识构建能力,指工业场景中的本体设计。工业领域中做知识图谱需要先设计本体,定义一个场景,需要定义知识本体,以及业务本体。
知识抽取能力。通过机器学习、深度学习、算法引擎等技术手段来进行知识抽取。
知识辅助能力。可以是智能搜索、辅助推荐等能力,一线作业人员、设备,包括辅助设备如何智能修复,辅助工作人员作业、检修、工厂盘点时解决具体问题。
刘志龙解释称,“在工业领域中的知识图谱,关键点不是刚开始数据量有多大,而是找到场景的本体,构建数据抽取方式,从而构建知识图谱体系,更关键的是如何让一线工作人员将这套产品应用起来。”
基于这样的理解,阿里构建了自己的工业知识图谱产品矩阵。
从图中可以看到,阿里这套产品体系有以下几个关键点:
阿里构建的工业知识图谱底层部署支持公有云、私有云、非云化部署;
知识沉淀过程中会沉淀两大内容,包括针对设备本体、故障图谱、案例图谱形成的知识库,以及针对同义词语、语料库、规则模板资源库;
图谱管理、信息抽取分别配备了前台和后台,后台配备了诸如本体构建器、图查询引擎、事件抽取、知识推理等算法引擎,前台配备了图谱可视化、图谱拖拽、导入审核、规则配置、打标工具、规则审核等数据标注能力;
阿里在数据标注上的特点是半自动化标注,即在数据达到一定量时,可以自动进行数据标注。
上层场景定义中,阿里与行业合作伙伴进行了诸如设备故障诊断、行业标准智能问答、设备信息查询助手等能力。
刘志龙也特别提到,“这些事情阿里不是只是自己在做,就业务角度而言,我们对业务的了解不如我们的生态企业、产业公司理解得更深入。”
知识图谱怎么建?
既然官方也指出,工业知识图谱自上而下的构建思路与互联网领域知识图谱的构建不同,作为脱胎于互联网时代的巨头企业,阿里又对制造业产业了解并不深入。
那么,阿里如何进行工业知识图谱的构建呢?
阿里云智能解决方案架构师古世相用一张架构图给出了这个答案。
从这张图中可以看到,整体架构分为三层:
底层是制造业企业中诸如设备、业务系统、人工经验、技术文档等各类数据源,这些数据源中的知识(高价值数据)通过图像识别、AI算法等相关工具抽取出来,并向上汇聚;
中间层是数据抽取形成知识图谱的过程,其中应用到了此前提到的各类算法引擎,并最终将专业知识、业务知识、运营知识等抽取出知识本体,以知识本体为框架,并通过规则引擎进行大数据的推理/挖掘,结合通用知识图谱,构建起领域知识图谱;
这一层也是阿里通过AI技术重点构建的部分,阿里为此打造了三个“底座引擎”,包括数据工厂、算法工厂、AI创作间,主要解决工业数据预处理与存储、汇聚生产、智能应用三方面的能力。
工业知识图谱的是为了企业数字化转型,为了企业或工厂实际应用而构建。因而,企业要首先发现自己现有业务问题,然后才是去考虑有什么新技术可以解决这样的问题。
现在的企业这方面做的还不好。
古世相在大会上表示。“很多传统企业现在还是技术驱动,而其实,如何做需求驱动、业务驱动才是现在需要考虑的问题。”
知识图谱的应用也是如此。
前文提到的工业知识图谱构建中,最上一层是阿里针对具体应用场景构架的四项能力,包括智能搜索与交互问答、精准数据处理、智能分析与决策、复杂关系挖掘推理。
以电力应用场景为例,
在制造业企业设备运维场景中,电力领域中最核心的资源是老专家,老专家积累了大量一线行业知识,将老专家的经验搬到线上,把老专家沉淀的非结构化知识数据以知识图谱串联起来,当某一类问题出现和发生的时候,新员工或对专业知识不熟的人就可以通过这样的知识图谱快速解决问题。
在故障检修应用场景中,老专家、老师傅将经验和案例沉淀成文档,阿里将这些知识搬到线上,构建了相应的知识图谱,实现了在线分享。检修人员可以通过手机APP在知识图谱上可以查询相关信息,包括什么时间发生的类似故障,解决方案是什么,甚至可以检索到成功解决这一问题的老师傅是谁。
具体可以通过现场巡检、在线监测、监控中心人工监测进行故障信息录入,这些录入的故障信息在AI决策工作台做故障判断,此前构建的知识图谱体系(包括案例和规则)都沉淀在AI决策中台,与此同时,还会通过试验人员对故障问题进行试验、测试,最终通过辅助决策,通过现场检修人员解决,甚至直接下发指令到设备,自动解决相关问题。
知识图谱从互联网领域迁移到工业互联网领域,由于两大领域场景差异较大,自下而上的知识图谱构建思路也转向自上而下。
就工业领域中构建的知识图谱来看,可以分为两类,一类是已有设备信息、生产信息的数字化知识图谱,诸如将设备维护手册、故障应用案例、一线专家经验数字化,并构建相应的知识图谱;另一类则是将设备信息、设备及数字化系统工作过程信息,甚至整个生产流程部分或全部数字化,并将其中不同垂直领域的数据关联起来,构建相应的知识图谱。
后者也正是当下数字孪生的概念。
由此也可见,智能制造、工业互联网,最终要实现的企业数字化转型、智能化转型关键仍是将企业中各类设备、系统、数据打通,以数据驱动当下企业转型升级。
在这个过程中,知识图谱、数字孪生等中间概念或技术形态都将在数据驱动下持续迭代,逐渐覆盖全流程、全生产要素,形成下一个时代制造业工厂的新形态。
推荐阅读▎余承东称小米概念机没有实用价值;苏宁收购家乐福;任正非:华为6G和5G技术并行开发▎阿里平头哥发布首款AI芯片
上新!「AI投研邦」现已上线CCF GAIR 2019峰会完整视频与各大主题专场白皮书, 包括机器人前沿专场、智能交通专场、智慧城市专场、AI芯片专场、AI金融专场、AI医疗专场、智慧教育专场等。「AI投研邦」会员们可免费观看全年峰会视频与研报内容,扫码进入会员页面了解更多,或私信助教小慕(微信:moocmm)咨询。