中国认知智能行业报告 | 爱分析报告
报告编委
报告指导人张 扬 爱分析 联合创始人&首席分析师李 喆 爱分析 合伙人&首席分析师报告执笔人姜凯燕 爱分析 分析师
特别鸣谢
点击文末左下角“阅读原文”,可下载完整版《爱分析·中国认知智能行业报告》。
目录
认知智能行业概览
1.1 AI行业图谱及认知智能定位
人工智能(AI)是研究、开发用于模拟、延伸和扩展人智能的理论、方法、技术及应用系统的一门新技术科学。人工智能领域的研究包括机器人、机器学习、图像识别、NLP和专家系统等。
人类基于视觉、触觉、听觉等具备对环境的感知,基于知识库和逻辑理解形成对世界的认知,并在此基础上展开相应的行动。人工智能对人的模拟也分为感知智能、认知智能 、以及行动智能三个层面,也是人工智能行业发展的三个阶段 。
人工智能对人智能模拟的实现,建立在数据、知识及其算法之上,因此数据是人工智能领域最重要的生产资料。从感知、认知到行动的三大发展阶段,也代表了数据处理的流程和深度。
感知智能主要是数据识别,只需要完成对大规模数据的采集,以及对图像、视频、声音等类型的数据进行特征抽取,完成结构化处理。
认知智能则需要在数据结构化处理的基础上,理解数据之间的关系和逻辑,并在理解的基础上进行分析和决策,即认知智能包括理解、分析、决策三个环节。
行动智能是在认知智能基础之上的执行,主要是人机协同。人机协同是在复杂的环境下,以知识(比如知识图谱)为支撑,进行数据推理,合理调度资源,使人类智能、人工智能和组织智能有效结合,打通感知、认知和行动的智能系统。
比如在公安场景下,知识图谱有16亿实体,数据比较全,是人工智能展现能力的绝佳场景。在做人物关系的二度或三度搜索时,其搜索复杂度与数据量是指数级关系,如果单纯靠机器来做,5个礼拜或者5个小时以后,才能做出空间的全景搜索,耗时相当长;如果人机协同,结合人类经验和洞察,看到哪一个点有线索就瞄准这一个方向调查,判断可能存在线索和可疑之处,进行深入探查,就能快速得出结论,高效解决问题。
1.1.1 感知智能—基于数据识别的场景应用
感知智能是指将物理世界的数据通过摄像头、麦克风或者其他传感器等方式进行采集,借助语音识别、图像识别等技术,映射到数字世界,并做标准化、结构化处理,一方面实现在特定场景的应用落地;另一方面可将数据提升至可认知的层次,即将信息翻译成及人类可理解、并用于分析和决策的数据,为认知智能提供数据基础。
在感知智能阶段,人工智能的核心价值在于进行数据的采集和处理,主要是图像、语音、和文字的识别,分别对应计算机视觉、智能语音和NLP三大技术。
计算机视觉主要实现产业应用中对图像或者视频内物体/场景识别、分类、定位、检测、图像分割等功能的需求,目前已被广泛应用于视频监控、自动驾驶、车辆/人脸识别、医学影像分析、机器人自主导航、工业自动化系统、航空以及遥感器测量等领域。
智能语音技术主要是指语音识别与合成、语音增强、声纹识别等,人机语音交互和语音控制中的主要部分是NLP中的人机对话部分。当前已广泛应用于智能音箱、语音助手等领域。2018年第一季度,谷歌和亚马逊的智能音箱出货量分别为320万台、和250万台,根据清华大学中国科技政策研究中心发布的《中国人工智能发展报告2018》,近几年智能音箱的年复合增长率超过30%。
感知智能阶段的NLP,主要是进行文本结构识别、关键词匹配等,完成文本识别类任务并给出反馈,属于NLP技术的初级应用。比如在检索中提取关键字并按照相关度为用户呈现检索结果,此时的机器并无法理解词语、以及句子所表达的意思。
而更高级阶段的NLP则能够基于词性标注、实体命名识别、关系抽取等功能,从各类数据源中提取特定类型的信息,将非结构化文本转化成结构化的文本,再通过语义分析掌握用户需求,并基于与知识图谱的融合,最终为用户提供分析决策。
比如检索“周杰伦的双截棍”,基于知识图谱的搜索引擎,背后有知识库支撑,能够自动将周杰伦识别为人名,将双截棍识别为歌名,我们就能理解用户的搜索意图是—歌手周杰伦的歌曲《双截棍》。
不管是从感知智能技术发展,还是行业应用普及来看,人工智能的第一阶段——感知智能已经到了行业发展成熟期。
斯坦福百年研究(AI 100)发布的全球“2018年人工智能指数”(AI Index)报告指出,计算机视觉领域的人工智能性能正在不断提升。
比如,通过测试广泛使用的图像训练库ImageNet的基准性能,启动按照最新精度对图片进行分类的模型的时间,已经从1小时下降至4分钟,意味着训练速度提升约15倍。MIT媒体实验室的数据也显示,在真笑和假笑的表情识别测试中,当前最优算法的成功率达到93%,表现大幅度优于人类。
在智能语音方面,百度、科大讯飞、搜狗等主流平台识别准确率均在97%以上。科大讯飞拥有深度全序列卷积神经网络语音识别框架,实验条件下语音输入法的识别准确率达到了 98%;阿里巴巴人工智能实验室通过语音识别技术开发了声纹购物功能的 人工智能产品。
感知智能的发展主要得益于计算机视觉和智能语音技术的渗透,以及硬件的进步,当前,感知智能应用已经在各行各业开始普及,实现多场景落地。
在各个场景应用中,智能安防是感知智能最大的场景应用,诞生了商汤、旷世、依图、云从等独角兽级别企业,此外,华为、海康威视等企业也在智能安防领域布局。
安防主要是基于对大量图像、视频数据的标注,训练出能够识行人、车辆、建筑等的模型,应用于治安防控领域,包含警用和民用两个方向。其中警用主要是实时分析图像和视频,及时从海量的视频端识别人员、车辆信息、或者直接追踪犯罪嫌疑人,极大的提升案件侦查、抓捕等工作的效率。民用领域主要是人脸门禁打卡、机场安检、发现盗窃等场景。
感知智能进入行业成熟期的另一个重要标志是,已经开始在工业、农业等传统领域渗透。
浙江正泰新能源是国内规模最大的民营光伏发电企业,企业在生产电池片过程中都是通过肉眼做产品质检,成本高、效率低。有了以计算机视觉为主的感知智能渗透,质检检出率和效率得以双双提升。
通过阿里云AI图像技术,企业可以通过深度学习与图像处理技术进行自动产品缺陷判定,令碎片率(瑕疵品)下降50%。而且,从图像拍摄到数据接收、处理,到数据上传MES系统做缺陷判定,再到MES系统下达指令给机械手臂抓取缺陷产品,整个过程无需人工干预,且耗时不到一秒,仅为原先的一半。
1.1.2 认知智能—基于行业知识图谱的深度应用
由于不同领域、不同场景应用的识别技术相差无几,因此感知智能阶段,可以提供各行业通用的识别解决方案。而认知智能则更注重与行业知识的融合,在各行各业的落地应用中需要有更细分的解决方案积累。
感知智能不具备理解和推理能力,从特征抽取和不断的学习训练中完成识别任务,机器解决的多是人类能够解决的模式识别类的问题,重在提升效率。
认知智能是感知智能的进阶,需要在感知智能的基础上,结合行业知识,理解数据之间的逻辑关系以及代表的业务意义,并在此基础上进行分析和决策。
在认知智能阶段,机器能够通过知识图谱挖掘隐性关系,洞察“肉眼”无法发现的关系和逻辑,用于最终的业务决策,注重行业知识图谱和关系挖掘,是AI在行业中更深层次的落地应用。
从数据处理流程和应用环节来看,认知智能可以分为连接、分析和决策三大环节。
连接环节完成业务数字化、以及数据结构化,即基于业务需要,将业务流程全部在线化、数字化,并加入行业知识和场景知识,完成实体、属性、以及实体之间的关系梳理,将不同数据进行分类、统一和结构化,构建知识库。
在人工智能第一阶段——感知智能的发展中,计算机视觉和智能语音是核心驱动技术,NLP则是小何才露尖尖角,完成触及的文本类数据标注和识别;当人工智能进入认知智能阶段的发展,NLP和知识图谱开始深度结合,在数据处理层面,其价值是将海量的、非结构化的、异构数据,转换为机器能够更好理解的数据,成为行业应用落地的技术支撑。
比如,在公安领域,连接打通跨警钟数据,可以建立基于知识图谱的一体化指挥作战平台,提升预警研判的准确度以及犯罪嫌疑人抓捕等行动效率。
其中,真正的“数据打通”并不是简单的系统连接和数据对接、查询等简单应用,而是实现“数据为元、全息获取”的公安大数据库,建立“人、事、地、物、组织”等动态信息数字化,并分别对应到受害人、犯罪嫌疑人、作案工具、作案规模等维度,确定数据属性及其相互之间的基础关系,构建公安数据知识库,实现业务数字化、数据结构化。
分析环节主要是根据提供的数据,基于行业知识图谱寻找到合适的结果,发现各种潜在的、隐性关系。
明略科技基于某全国股份制银行全行近十年全量数据构建成“企业、个人、机构、账户、交易以及行为数据”规模达十亿点百亿边的知识图谱数据库。通过采用复杂网络、图计算等知识图谱技术,实现海量数据和非结构化数据的分析和探索,加强对业务开展过程中的远程风险管控能力,深入挖掘只靠人力所不能发现的问题,加强业务过程中的操作风险、员工道德风险管理,提升银行整体风控能力和风控效率。
比如,基于生成的客户关系网络图谱,可完整展现对公客户“个人-企业-个人”的复杂关系,构建复杂的资金流转全貌,通过图挖掘技术,挖掘复杂的隐形关系和利益共同体,实现无死角的资金监控管理。
决策环节,主要是基于沉淀的行业Know-how和业务经验,形成解决方案,从而为客户解决具体问题提供辅助建议以及依据。
1.1.3 认知智能—基于知识图谱的隐性关系挖掘和推理
从实际行业落地层面来看,认知智能与感知智能最大的区别有两点。一是认知智能能够基于行业知识图谱,挖掘仅靠识别功能难以完成的隐性关系;另一方面,认知智能不仅能“知其然”,还能“知其所以然”,即具备推理功能。
这两点的核心支撑都是知识图谱。
比如,AI辅助诊断一般的模式为“理解病症—评定医学证据—选择治疗方案”三个步骤,分别对应认知智能连接、分析、决策三个环节。医学知识图谱是AI辅助诊断的基础支撑。
第一步,病症的获取包括患者自 述、医生检查、化验结果分析等,系统会提取其中关键的特征并结合患者的历史健康信息,通过NLP读取病历。
第二步,AI基于已有医学知识图谱分析患者病情,除了对病历上已有症状的分析,也注重可能的并发症等隐性关系的排查。要求患者或医生提供某方面的病症补充,或提示需做的检查、鉴别要点。
第三步,AI 结合从文献、诊疗标准、临床指南和临床经验等数据积累中学习的知识,通过知识图谱和推理假设将获取的病症信息联系起来,形成可能的结论、置信度及证据,并生成诊断结论和治疗方案建议。
最终,医生在权衡疗效、副作用、疾病转移及其他因素之后,给出诊断。
作为感知智能的进阶版,伴随认知智能而来的,是更高的技术要求、更广阔的市场前景、以及更高的行业进入壁垒。
这对提供认知智能解决方案的厂商提出了两个方面的要求。一是深耕细作,注重行业知识图谱的打磨和积累;二是将垂直行业业务经验,沉淀到平台,并转化为知识,服务于业务决策。
1.2 AI行业趋势—从感知智能到认知智能
当前,随着人工智能在安防、智能音箱等领域的大规模应用落地,整个人工智能行业已经走过感知智能阶段,进入认知智能时代。
体现在两个方面,一是人工智能行业的基础设施——数据的标准化,已经趋于成熟;二是行业实际需求的牵引,行业亟需机器基于行业Know-how、业务经验沉淀提供决策支持类应用。
在感知智能阶段,智能语音和计算机视觉技术的成熟,以及NLP技术在文本识别等场景的大规模应用,使得大量的多源异构、非结构化数据,成为可应用于知识库和知识图谱构建的标准化、结构化数据,完善了认知智能发展的基础设施。
比如,感知智能相关的机器视觉、语音识别、NLP领域,已有大量的通用数据库,应用于视觉、语音、文本等各类数据的识别训练。
感知智能在识别领域的行业应用也早已普及,比如语音识别、通用物体识别、人脸识别、目标跟踪、姿态识别等。人工智能的下一场,将进入认知智能的战场。
从行业应用角度来看,在感知智能解决数据采集和识别问题的基础上,各行各业的业务部门开始对认知智能带来的低运营成本(比如更高效节省时间成本、或者是直接的人力替代)、以及知识图谱驱动的业务决策有了越来越明确的诉求。
以认知智能渗透较为领先的金融行业为例,当前金融行业面临运营成本高,客户服务压力大;产品服务单一,无法很好的覆盖长尾客户;交易欺诈风险高等实际业务问题,这些都无法通过感知智能技术解决,而知识图谱驱动的认知智能则能提供相应的解决方案。
基于语义理解的智能客服能够与客户就简单问题进行人机交互,降低金融机构客户服务的成本,而且效率和客户体验都能大大提升。人工客服培训成本高、服务效果难以统一、而且流动性很大。智能客服能够依靠知识图谱回答简答的、重复性的问题,减少人工客服使用,提升银行等金融机构客服效率及效果。不仅仅是金融领域,全行业来看,根据德勤的数据,当前客服机器人已替代40%-50%的人工客服工作,预计到2020年,85%的客服工作将依靠人工智能完成。
在理财高端市场,理财规划师能够提供专属服务,但在中产之下的长尾市场,付费能力有限,单靠理财师也很难覆盖大众的个性化需求。利用大数据、人工智能技术开发的智能投顾,能够向更多客户提供个性服务,助力零售银行低成本覆盖广大长尾市场。比如,招商银行推出的“摩羯智投”可提供投资理财咨询,2016年户均购买金额为3.69 万元,机器在理财师很难覆盖的领域大显身手。
相比于人工信贷审核,人工智能不仅效率高,更重要的是能够进行更多维度的关联数据分析,将知识图谱应用于风控环节。例如蚂蚁金服推出的“蚁盾”、“芝麻信用”,网易金融推出的风控系统“北斗”,相比于比传统银行,这类解决方案能够基于更多维度的用户数据(知识图谱可以关联到用户职业、行为、社交等各类数据),开展更高效的信贷业务,同时也能降低交易欺诈等信贷风险。
在公安领域,行业应用也已经从最初的人脸识别、车辆识别等感知层应用,向情报研判等认知智能应用发展。
近些年公安大数据建设、各垂直系统的纵向业务拉通,各单位横向数据的融合和分层解耦奠定了公安业务数据规范化、标准化的基础,同时感知智能的快速发展,基于人脸特征的聚类、分类,一人一档、一车一档,视图库的建设,图像不仅能辨认人,更能连接人、管理人。视频网和公安信息网的内容融合趋势愈发强烈,构建全域感知图谱,并在此基础上构建公安知识图谱,驱动更多上层应用的时机日益成熟。
在这样大背景下,明略科技将海量感知数据纳入知识构建与积累,打造了认知力更强、时效性更快、更具行动力的全域知识图谱,让机器更好的进行推理与规划,从而从平台服务、数据服务到应用服务构建了由感知到认知再到行动的完整闭环,形成了基于AI技术的警务支撑体系和安全保障体系,目前已经广泛应用于专业研判、情指一体化、社区治安防控等场景中。
1.3 认知智能技术演进
知识图谱和NLP是认知智能两大关键性技术,两者在认知智能中的融合日渐紧密。
知识图谱既是一种语义网络,是认知智能中知识表示的最重要方式;同时也是一种技术体系,完成知识推理,实现对人类认知活动的模拟,其发展经历了三大阶段。
第一阶段(1955年—1977年),是知识图谱起源阶段,最先是从科学文献索引应用中衍生出知识图谱的概念。
第二阶段(1977年-2012年),是知识图谱发展阶段,知识图谱的前身——基于规则的专家系统登台亮相;知识表示、知识组织等知识图谱的关键技术开始发展;知识本体、知识推理等知识图谱关键要素开始大规模普及。
第三阶段(2012-至今),是知识图谱的繁荣阶段,知识图谱强调语义检索能力,关键技术包括从互联网的网页中抽取实体、属性及关系,旨在解决自动问答、个性化推荐和智能信息检索等方面的问题。
目前,知识图谱技术正逐渐改变现有的信息检索方式,如谷歌、百度等主流搜索引擎都在采用知识图谱技术提供信息检索。一方面通过推理实现概念检索(相对于现有的字符串模糊匹配方式而言);另一方面以图形化方式向用户展示经过分类整理的结构化知识,从而使人们从人工过滤网页寻找答案的模式中解脱出来。
NLP是认知智能领域的关键技术,分为语音分析、词法分析、句法分析、语义分析和语用分析五个层次。其中词法分析、句法分析和语义分析是认知智能领域构建行业知识图谱的重要性技术。
NLP的发展也经历了三个阶段。
第一阶段( 20 世纪 50 年代到 70 年代):1950 年提出的“图灵测试” 是NLP思想的开端, 当时的NLP主要采用基于规则的方法。但是由于硬件条件不足以支撑NLP的落地应用,因此并未得到充分的发展。
第二阶段:70 年代以后互联网高速发展,语料库丰富、硬件不断更新完善, NLP由理性主义向经验主义过渡,基于统计的方法逐渐代替了基于规则的方法。NLP基于数学模型和统计的方法取得了实质性的突破,从实验室走向实际应用。
第三阶段:从 2008 开始,深度学习逐渐开始被引入做NLP研究,此后深度学习与NLP的结合一度被推向高潮,并在机器翻译、问答系统、阅读理解等领域取得了一定成功。
在认知智能实现的过程中,知识图谱解决了两大核心问题——一是基于实体、属性及其实体间关系的显性关系的构建,二是基于图检索和图挖掘技术的隐性关系的挖掘。
其中,知识图谱和NLP技术的融合必不可少。
行业知识图谱的构建,是认知智能实现的前提,而在行业知识图谱构建的过程中,NLP技术必不可少。
随着大数据时代的到来,传统手工的方式对于知识图谱的构建可以说基本上是无法完成的任务,必须依赖NLP的技术在海量数据中自动化的抽取知识,有监督的构建知识体系以及可持续的补充完善知识图谱。
1.4 认知智能行业图谱
认知智能领域厂商可以分为两大类。
第一类是由于自身业务需要,实现认知智能在业务流程中的渗透,甚至是基于认知智能技术提供服务。比如阿里、百度、腾讯、美团、滴滴、头条等。
第二类是面向政府、金融、零售等行业客户,提供认知智能解决方案的厂商。其中,一部分是从感知智能向认知智能延伸的厂商,比如商汤、旷世、云从、依图等安防起家的厂商;还有一部分,是以认知智能应用为主的厂商,比如谷歌、今日头条、明略科技等。
认知智能的落地条件及挑战
从底层数据治理,到上层行业场景应用,认知智能业务架构可分为数据中台、AI中台、业务中台以及行业场景应用四层。
数据中台不但要将大数据处理技术(流计算、批量计算、实时采集、离线采集)封装起来,形成计算平台;同时进入数据中台的数据都将成为其核心资产——即按照规范的建模方法论将数据形成主题域模型、标签模型或者算法模型。其功能在于打通固有多业务系统之间的数据壁垒,融合各个不同业务系统间所产生的数据,通过数字化的运营和驱动来支撑前端业务的快速变化,从而产生更大的价值。
明略科技将知识图谱融入数据中台,用包含概念、实体、关系、事件、标签、指标的知识图谱统一视图来定义面向领域的数据模型,并将所有隐性的语义,全部以显性的形式放到知识图谱里进行呈现,将领域知识图谱作为数据中台的数据底座,从而实现面向业务领域数据组织方式的转变,为企业打造真正具有行业 Know-How的新一代数据中台。
AI中台本质上是AI应用的全生命周期开发和管理平台,用于数据分析与处理、模型训练与评估、模型应用与监控。提供统一的数据存储系统,和基于容器的异构计算资源管理系统、机器学习库与模型训练实验管理系统以及模型部署与运行监控系统,采用分布式模型训练,大幅提升数据和模型的性能、效果、目标。从实现功能角度来看,AI中台以实现业务智能为目标,为数据科学家团队提供服务,加速用户画像、推荐系统、图像识别、智能客服等智能应用开发。
业务中台多出现在认知智能应用相对比较成熟的领域,融合了行业或者特定场景的业务逻辑,其主要功能是实现业务能力的动态共享和服务复用。一般每个行业都能抽象出相应的业务中台,某些通用的场景也能抽象出业务中台,应用于各行各业。以明略科技构建的营销中台为例,抽象了约10个模块,应用于快消、美妆、家电、汽车等零售相关领域。
行业场景应用则是在业务中台的支持下,实现特定功能。比如金融领域,认知智能相关的场景应用有反欺诈、反洗钱等。
以明略科技在零售领域的具体落地实践为例,其认知智能解决方案包括数据中台、业务中台和上层场景应用。
数据中台由数据汇聚平台、数据治理和开发平台、数据存储、数据分析和数据共享服务五层结构组成。数据中台沉淀的数据源既包括业务系统中存储的结构化数据(数据中台与企业业务系统连接,可以通过网关中间件获取线上的订单、顾客等数据,以及线下的POS数据等,未来也将通过智能设备获取顾客行为感知数据),也包括明略科技补充的DMP数据。
零售行业的业务中台由组织中心、商品中心、库存中心、财务中心、会员中心、营销中心、订单中心、配置中心八个子模块构成。一般来说,业务中台具体模块的搭建往往是产生于客户的需求,比如业务中台下的订单中心,通过打通客户不同渠道的订单系统,制定订单处理规则,用API接口和前端对接或直接替代前端订单系统。
目前的场景应用包括供应链侧和营销侧,如供应链侧可以进行销量预测、存货布局、自动补货、自动调拨等,在营销侧可以对用户画像,对顾客进行个性化商品推荐,同时实现促销评估、动态变价等功能。
在认知智能的四层基本业务架构中,数据中台层的海量数据的治理、以及AI中台层基于行业知识图谱的关联关系挖掘,是认知智能落地的两大挑战。
2.1 基于大数据平台的海量数据治理
认知智能面对的是海量的数据,海量数据治理存在技术和业务两个维度的挑战。
技术维度的挑战主要是数据量大、多源异构,造成治理难度大。要求平台具备两大能力,一是将多源异构数据治理成可供算法模型使用的标准化数据的能力,二是分布式存储和计算能力。
从数据源角度来看,认知智能解决需要处理的数据来自视频、图片、音频等感知智能应用中采集的数据,业务系统已存储的数据、以及业务运行中时刻产生的数据,还有第三方补充数据、公开数据等所有与业务相关的数据;从数据结构来看,既有结构化数据,比如视频数据、金融系统的交易数据等,也有非结构化数据,比如各类文本数据,以及大量的半结构化数据。
多源数据的治理对认知智能业务架构(数据中台)性能提出了高要求,需要通过可扩展的数据源适配程序,将多源数据汇聚到一个知识图谱中,实现数据标准化、以及多源异构数据的关联融合。
海量数据存储层面,则要求数据中台实现知识存储和知识计算,以前的数据库多为矩阵结构、立方结构存储,认知智能时代需要图状结构的存储。借助图存储、列式存储等方式,以及Hadoop和Spark平台的分布式并行计算框架,达到每分钟导入和处理几百万数据量的数据库性能,实现海量数据图谱的高效存储和查询。
在实际的落地实践中,业务维度需要考虑两点,一是数据打通,涉及到系统互联,以及具体执行过程中的组织配合;二是数据清洗,即实现基于场景理解的数据资产化,将数据按照“实体-关系-属性”的三元架构进行分布式存储,以便构建知识图谱并实现关联分析和挖掘应用。
数据打通问题更多需要高层重视并牵头执行认知智能解决方案方案的落地,以“一把手工程”的思路引导业务、信息等部门积极参与,从数据采集和治理、业务逻辑梳理、以及场景应用落地等方面保证认知智能解决方案的顺利落地。
数据清洗要求认知智能企业有对行业的深入理解、对业务逻辑的深刻洞察,才能以终为始,按照最终场景应用的需求,定义和储存数据,使其成为能够为AI中台、业务中台等直接应用的数据资产。
2.2 基于知识图谱实现对关联关系的快速挖掘
知识图谱的构建分为两步,第一步是定义实体、属性及其实体之间的关联关系。
比如公安领域的人、物、地、事、组织;医疗领域的疾病种类、疾病症状、检查检验结果,都是各自领域知识图谱常用的实体定义。
明略在2017年与光大银行合作,帮助光大银行构建用于审计的知识图谱。在这次合作中,明略科技帮助光大银行建立了全行级别的知识图谱,仅支持审计的知识图谱有1亿个实体和10亿条关系链,全行级别的知识图谱会在其他领域带来更多的产出。
关于实体的定义、实体属性的归类、以及实体之间的关系构建,一般来说有两种方式,一是基于规则库进行调整和学习,成本较低,但后期维护成本较高;二是以人工标注的方式让机器来模拟和学习,成本相对较高,但因具备自适应能力,后期维护成本较低。实际操作过程中,一般是通过规则库和人工标注相结合的方式。
第二是基于知识图谱的关联关系挖掘。
知识图谱在实际业务落地中最大的价值,就是能够基于知识图谱实现隐性关联关系的挖掘,挖掘仅靠人的业务经验、或者一般数据分析模型难以发现的业务逻辑和线索。
比如,在公安日常工作中,主要面临嫌疑人是谁,嫌疑人在哪里,嫌疑人和谁在一起以及嫌疑人将去哪里等四大类问题,公安人员开展工作多数都是依赖现在信息化系统收集的轨迹工具而展开的,通过对轨迹数据的分析,锁定嫌疑人,发现嫌疑人行踪及团伙。而通过轨迹发现人与人之间,车与车等之间隐性关系,就是基于公安知识图谱图挖掘技术实现的,能够在公安破案的过程中为公安提供有力的线索。
隐性关系的挖掘主要是基于图挖掘技术,当前面临三大挑战。
一是图挖掘对数据查询的要求较高,开源数据库难以支撑,需要基于开源数据库做优化。
二是关联关系挖掘的最短路径、聚类分析等经典算法,也需要做并行化、分布式化处理,才能达到图挖掘技术的所需的性能要求。
三是以当前知识图谱和图挖掘技术所能找到的隐性关系,还存在很多无效的关联关系,也就是对实际业务来说没有任何意义和价值,需要结合业务经验做校验,找到真正能够适用于业务的隐性关系。
比如,将阿里云工业大脑应用到攀钢西昌钢钒转炉炼钢工艺后,打通炼钢全流程数据,通过建模分析获得炼钢工艺优化的关键因子,结合专家知识之后,成功定位提钒、脱硫和炼钢三个关键工序。
通过对这三个工序的深入建模分析,聚焦在脱硫工序,依靠脱硫仿真模型与参数寻优模型寻找最优参数。根据实际测算,通过优化的参数推荐,每生产一吨钢可以节省一公斤铁,对于年产值400万吨钢的攀钢来说,一年的成本节省就在700万以上。
其中,在建模获得关键因子的基础上,需要结合专家知识找到最关键的脱硫工序,才能最终挖掘到真正适用和解决业务实际问题的关联关系。
3.1 认知智能潜在市场规模
根据Gartner的预测,到2022年,中国对技术产品和服务的总支出会超过3.2万亿人民币,除去通信服务1.5万亿,IT硬件、软件、数据中心系统以及IT服务相关的总支出为1.7万亿。
爱分析认为,到2022年,认知智能相关的解决方案占比将达到5-7%,届时认知智能市场规模约为850-1200亿。
3.2 认知智能市场集中度分析
相对而言,认知智能行业市场集中度会高于信息化领域。主要是因为认知智能领域门槛较高,而且认知智能与行业、业务结合较紧密,头部企业在服务客户的过程中积累的模型会不断完善,先发优势明显。
AI行业集中度普遍较高。根据旷视科技招股说明书披露, 2018年,旷视科技的设备解锁与身份验证解决方案,在中国制造的搭载人脸识别设备解锁功能的安卓智能手机中,占据超过70%市场份额。信息化领域很少有单家供应商的某个产品或者解决方案能够达到如此高的市占率。
但认知智能领域行业集中度会低于感知智能领域。人脸识别、语音识别等感知智能类解决方案,能够跨行业、跨场景实现应用落地,即感知智能供应商更容易凭借技术优势,实现在不同行业之间的快速复制,以通用解决方案占领市场,集中度相对较高。
而认知智能解决方案在跨行业和跨场景层面则更具挑战,主要是由于行业知识图谱的构建和积累需要深耕细作,未来认知智能的落地将是行业性解决方案的输出,很难像通用类解决方案在不同行业快速复制,各个行业都有机会成长出小巨头。
因此,认知智能行业集中度不会太高。长期来看,会呈现百花齐放的竞争格局。
3.3 认知智能重要场景应用的市场规模
基于爱分析对各个行业技术渗透情况的了解和判断,认知智能渗透的核心行业包含智慧城市、自动驾驶、零售、公安、金融、工业、医疗和教育。其中,智慧城市和自动驾驶领域认知智能潜在市场规模较大,零售、公安和金融次之,工业、医疗和教育渗透空间最小。
智慧城市领域的市场内规模最大,仅住建部制定的十三五期间对智慧城市的投入就超过5000亿人民币。智慧城市整体规划中,业务架构也涵盖数据中台和业务场景应用,其中,数据治理和各类场景应用,认知智能渗透的空间极大。比如交通调度指挥与管理辅助决策、分布式能源调度中心等场景应用背后都是基于知识图谱的分析决策做背后支撑。
自动驾驶潜在市场规模较大,其产业链市场空间近千亿,未来考虑出行类服务,几近万亿市场。环境感知、路径规划和车辆自主决策是智能驾驶L5级要实现的目标,其中路径规划和自主决策均是认知智能能够深度渗透的领域。
零售、公安和金融也是认知智能重点渗透的领域,市场规模均在百亿级别。工业、医疗和教育领域也有部分渗透,相对而言,市场规模较小,约在几十亿级别。
渗透率与政策、行业ROI、以及技术应用成熟度密切相关。
其中智慧城市、公安和医疗领域,主要是政策驱动,比如公安领域,自2015年开始,公安部就陆续出台《关于大力推进基础信息建设的意见》、《公安科技创新“十三五”专项规划》,国务院发布《新一代人工智能发展规划》,不断推荐大数据以及人工智能在公安中的深度应用,为知识图谱驱动的认知智能解决方案在公安领域的渗透打下了基础。
而金融、零售、工业和教育领域认知智能渗透的驱动力是ROI,在技术成熟的条件下,行业以业务降本提效为出发点,采购并应用认知智能解决方案。
自动驾驶当前渗透率较低的核心原因是技术成熟度有限,行业距离L5级别的自动驾驶还很远,环境感知还有很多尚待解决的问题,认知智能应用的技术基础尚未实现。
市场集中度与行业本身的行业集中度、以及行业信息化市场集中度有关。
行业本身集中度越高,该行业认知智能市场集中度越高。比如自动驾驶行业集中度高,决定了自动驾驶领域认知智能市场大的集中度也会很高;零售、金融和教育本身行业集中度很低,因此零售、金融和教育领域认知智能市场集中度也很低。
行业信息化集中度越高,认知智能行业集中度也越高。根据IDC统计,2014年公共安全领域前五名解决方案供应商的市场份额为51.6%,而2017年,医疗领域前八家信息化上市公司的市场占有率仅有约14%。因此可以判断,公安领域认识智能市场集中度会大大高于医疗领域。对于认知智能供应商而言,市场集中度高、且渗透率高的领域,是当前值得重点投入的领域,比如公安、智慧城市。而金融、零售领域虽然市场集中度较低,但是市场规模可观,因此也是值得重点深耕的行业。
本章将以具体落地案例来介绍认知智能相关解决方案在各个行业的渗透。
4.1 公安
目前食药领域制假售假呈现网络化的发展趋势,包括通过在网络上发布信息,通过QQ、微信等聊天工具和网络支付平台交易,通过快递等方式送货等。由于网上、网下犯罪交织,传统、新型犯罪手段叠加,打击食药环领域犯罪已成为专业程度高、经营和侦破难度大的系统工程。
其中,线索核查是食药环支队日常的基础工作之一,主要是对全国范围内已破获案件涉及本地的购买人群进行核查。过去由于对物流数据没有有效的手段进行研判,且警力有限,很难在大量的普通核查线索中确定核查重点,核查工作往往收效甚微。
明略科技智慧警务模型应用平台能够很好的应对这些问题。
该平台主要实现两大功能。一是精准研判,提升核查效率。
某市局食药环支队通过积分模型运算相关线索数据,挖掘出高危人员、其关系网络及高危程度等重要线索,指导办案民警进行精准侦察,从而大幅度提升核查效率,快速精准锁定高危人员和高危团伙。
二是扩展经营,以点带面,大范围打击犯罪。
破获现行案件后,民警在对嫌疑人进一步深入侦查,发现该嫌疑人的大部分违禁产品均通过某一商户进行购买,民警立即对该商户进行侦查,发现该商户极可能是连接各大销售点与货源地的中间商。
运用明略科技智慧警务模型应用平台,某市局食药环支队通过数据分析和标签、模型综合研判,推演出疑似假药来源地和销售网络,后经过民警连续多日多地的深入侦查,发现了存放假药的仓库地点,并成功锁定嫌疑人,一举打掉该团伙。
最终取得成效较为明显,先后在全国多地共抓获涉嫌销售假药嫌疑人20余人,当场查获涉案假药1000余件,涉案价值5000余万元,显示了假药模型应用平台在精准研判、扩线经营中发挥的作用。
4.2 金融
明略科技为某全国大型股份制银行基于全行全量数据构建成“企业、个人、机构、账户、交易、以及行为数据”规模达十亿点百亿边的知识图谱数据库。并通过采用复杂网络、图计算等大数据算法,实现海量结构化数据和非结构化数据的分析和探索,搭建远程监控体系下复杂计算及非结构化模型建设的框架。
该项目中的知识图谱应用取得效果如下。
一是展现完整的客户关系网及资金流转全貌。生成客户关系网络图谱,完整展现对公客户“个人-企业-个人”的复杂关系,构建复杂的资金流转全貌,通过图挖掘技术,挖掘复杂的隐形关系和利益共同体,实现无死角的资金监控管理。
二是基于多元异构数据处理能力提升风控水平。通过搭建模型管理框架,引入图像识别、自然语言处理、情感分析等技术,具备多种非结构化数据处理能力,有效提高远程风控技术水平。
三是实现业务应用模型。建设监控预警、追踪查证为主的业务应用模型,体现大数据模型项目业务价值,提升非现场审计效率和能力。
四是为银行打下更多业务应用的基础。未来可以围绕基础能力对上输出的能力,建设更多在远程监控体系下的业务应用。
4.3 零售
近年来,线上购物场景随着新零售、多语态、线上线下相结合,显得愈加复杂。线上购物场景中,搜索体验是决定用户购物体验的关键。由于普通客户难以对想购买的商品具备清晰地了解和认知,故对搜索和推荐产生了一定程度的依赖。
但大部分搜索引擎难以有效认知客户的意图,难以快速地响应客户的需求。原因在于:眼下电商搜索需要的互联网数据超出了过往文本范围,同时互联网数据大多属于非结构化文本数据,且分散在各个源头难以统一。导致数据呈现多噪声、多模态、数据源分散、深度认知的缺乏等特质。
为了提升客户搜索体验,阿里基于认知智能技术打造电商认知图谱,以数据中台支撑KG Enigne,再通过阡陌数据管理平台,和图灵业务对接平台来优化用户搜索体验。
阿里推出的电商认知图谱在数据治理和认知层面的投入,最终在用户体验上得到了明确的收益。
首先,通过场景数据结构化,分散数据得以统一表示。
阿里内部大多是query、title、评论、攻略等,这些数据由于用户习惯和商家诉求,会存在非常不同于普通文本的语法结构,也会由于利益原因存在大量噪声和脏数据。
阿里首先对数据进行清洗,然后通过短语挖掘,信息抽取等方法把有效数据抓取出来,最后进行数据的结构化和层次划分。对于结构化后的数据,采用标准化的schema表示和存储方法进行概念数据融合,属性的挖掘和发现。
其次,通过提升数据认知度,获取客户关联需求
搜索引擎难以快速的响应客户的关键在于对于客户意图认知不明确,难以推荐合乎客户要求的商品以及关联需求的挖掘。
阿里依托电商认知图谱可以通过行为和商品本身的信息认知到用户购买商品的意图,再通过外部数据的输入和摘要得到常识类和商品体系之外的用户需求的关联,再经由图灵业务平台投放合适的商品,以达到精准营销和额智能推荐的目的。
最终效果斐然,阿里自2017年6月推进电商认知图谱的构造后,截至2018年9月已经完成pv top70的类目审核,增加了12W+的cpv对,实现能够被全识别的query占比从30%提升到60%。
4.4 餐饮
明略科技为某知名餐饮品牌该餐饮企业提供了基于认知智能的店长通解决方案。
该餐饮企业最初面临的主要问题有三个。
一是随着业务的不断发展和新店的持续扩张,水饺出品的品质管理难度持续增高,而饺子出品的品质又是决定门店经营状况和品牌形象的关键,所以客户希望通过创新的AI手段对各门店的出品品质做高频的持续的客观的评判,并形成统计报告,以实现对饺子出品品质的严格管控。
二是该餐饮企业有一套标准话术体系,覆盖到门店客户服务的各个环节。但日常服务人员的话术执行情况和服务的工作量都难以量化评估,所以管理者希望能够通过语音识别技术,量化评估每个服务人员的话术执行情况,用以评判每个人的服务积极性和工作量。
三是该餐饮企业门店店长每天面对繁重的管理任务,稍有不慎就会有疏漏,并且总部的各种管理制度要求都需要及时有效的推行和监管,如果执行不到位,可能被稽查巡店的监察员扣分罚款,甚至降级。所以需要一款智能高效的管理工具,能够帮助店长规划每日的管理任务,支持高效的客观准确的任务描述,并且可以自动化的汇总任务执行情况,提升门店管理的效率。
基于该餐饮企业的需求,明略科技针对性提供了店长通出品识别、服务评估和运用管理三大解决方案。
店长通解决方案实现的主要功能如下。
一是AI提升饺子出品品质。
店长通出品识别解决方案,在客户的出餐口部署安装集成的出品图像采集设备,自动抓取出品照片,通过云端的AI重点自动识别每个饺子的品质并量化打分,最终对每盘饺子做整体打分评判,并自动化的形成品质统计报告。对饺子出品的品质做全面的实时的管控。出品识别的模型会根据日常的判断结果,持续做训练优化,不断的自我完善。对饺子出品的品质做全面的实时的管控。
并且,出品识别的模型会根据日常的判断结果,持续做训练优化,不断的自我完善。
二是基于语音识别的服务积极性评估。
通过软硬件一体化的设计思路,为服务员提供可随身佩戴的智能语音识别设备,实时采集服务员话术,并将话术上传到云端的AI中台,对话术量,有效话术执行情况,菜品推荐情况做统计汇总,并沉淀有效的推荐话术,帮助该餐饮企业沉淀和优化服务话术知识。
三是提供门店管理辅助工具。
基于PDCA闭环管理模式,实现量自动的创建计划任务,智能描述式的任务交互,实时的结果检查汇总,以及自动化的问题跟进追踪,内置智能识别和判定AI,对每日任务的进展和描述做智能的分析和判定。帮助店长构建高效、实时、灵活、闭环的管理能力。
5.1 5G、边缘计算与认知智能
认知智能时代,数据是核心资产,在数据产生、传输、存储、计算、分析和应用的过程中,5G、边缘计算等技术将和认知智能相互融合,形成从终端、边缘到中央云的一体化数据处理流程和解决方案。
其中,爆炸式的终端增长将产生海量的数据;5G负责高效的数据传输;边缘节点和中心节点将共同协同完成数据的存储和计算;认知智能则在此基础上实现各类数据分析和应用。
边缘节点的存在,不管是在计算资源层面,还是本地化模型调用层面,都弥补了中心节点在反应速度上的不足,虽然有5G的加持可以更提供高速、稳定的数据传输,但边端计算类似于本地化计算和固化模型,其优势依然无可比拟。
其中,5G的价值在于,能够促进认知智能的渗透和落地。
5G有三大特性:大带宽高速率、低时延高可靠和海量连接。
对网络速度要求很高的业务能在 5G 时代被推广,例如,目前由于4G速度不足以支撑云 VR 对视频传输和即时交互的要求,用户需要依靠昂贵的本地设备进行处理。依托于5G 的高速率,云 VR 将能够获得长足发展。
5G 超低时延的特性可以支持敏感业务的调度,为车联网、工业控制、智能电网、远程医疗等垂直行业提供更安全、更可靠的网络连接,促进认知智能在这些领域的落地。
5G 网络每平方公里百万级的海量连接数使万物互联成为可能。5G 网络面向的不仅仅是个人用户,还有企业用户和工业智能设备,5G 将为 C 端和 B 端的用户或智能设备提供网络切片、边缘计算等服务,从而直接促进认知智能在当前渗透率尚在低位的领域实现应用落地。
比如,自动驾驶、智慧城市等已经发展了一段时间,但是当前尚未取得突破性进展,其中一大原因就是网络连接,自动驾驶和智慧城市真正实现落地的前提是万物互联,而当前阶段,由于功耗高、可用频段少和高时延等限制,硬件设备之间只是单独获得了连接能力,很难将所有硬件设备连接在一起,并没有实现真正的连动。5G的成熟将改变这一现状,未来,5G将成为认知智能在自动驾驶、智慧城市等大规模落地的基础设施。
边缘计算与云计算的协同,将优化认知智能解决方案的落地机制。
边缘计算是指在用户或数据源的物理位置或附近进行的计算。从云计算与边缘计算的关系来看,边缘计算是云计算概念的延伸,是云计算向终端和用户侧延伸。
边缘计算和云计算的协作,能够优化认知智能解决方案的更新和应用机制,在实际的落地过程中,同时顾及反应速度和模型更新。
边缘节点存储了认知智能模型,直接应用于终端设备;边缘节点和中心云之间存在交互,各个边缘节点处的认知智能模型在应用过程中的处理的数据结果会回传至中心云端,汇聚至中心云处的认知智能初始模型,并基于大量的数据和结果做模型更新,再将最新的认知智能模型下发至边缘节点。
整个过程类似于云边协同在华为IEF平台中实现方式。在该平台中,人脸检测、人流监测等模型就是以边缘计算和云计算之间的协作实现优化落地的。
5.2 认知智能的下一站—人机协同
人工智能分为感知智能、认知智能和行动智能三个阶段。当前正处于认知智能的起步阶段,展望未来,人工智能必然走向行动智能,这个过程需要人机协同来完成。
在感知智能和认知智能阶段,机器能够自主完成特定的任务,但有很多知识和管理复杂度高的领域,机器很难独立完成工作,人机协同是新一代AI技术在知识和管理复杂度高的行业中的落地,也是人类与机器和谐共处的开端。简单来说,人机协同的业务逻辑就是,在复杂任务中充分发挥机器和人的各自优势,创造性的完成特定任务。
人机协同可分人机互补交互、人机冗余交互和人机混合交互三种情况。其中,人机互补交互主要是人将机器能够完成的特定任务安排给机器来做;人机冗余交互强调人机在特定任务中的分工与配合,由机器完成能够完成的部分,其余由人来完成;人机混合交互的难度最高,要求机器基于动态知识图谱推演出相关线索和结论等,并且人相机介入,以求达到最好的效果。
比如,通过社交洞察分析解决方案,明略科技可以帮助公司评估广告投放的效果。具体操作流程是,需要基于小文章、评论、图片、以及视频等多元、海量、异构的舆情数据中,通过知识图谱的方式,为广告内容本身或者某个广告平台做画像,最终告诉客户广告效益到底如何,这中间就涉及到人机协同。
6.1 认知智能公司核心竞争力分析
认知智能厂商竞争力主要体现在以下四个方面:技术能力、产品能力、获客能力、以及场景应用理解。
技术能力主要体现在数据治理能力、知识图谱构建能力、以及项目实施中的工程化能力方面。
产品能力主要是产品完整性,厂商需要具备从底层数据采集、治理、知识图谱构建、到上层应用构建的整体能力。产品能力不仅影响项目交付周期,而且也影响认知智能厂商的利润率。
获客能力方面,由于认知智能在行业的渗透尚处于早期阶段,而早期阶段也是厂商打磨解决方案、积累竞争优势的重要阶段,获客能力既是先发优势的重要体现,也将决定认知智能厂商长期的竞争力。
场景理解能力决定了厂商是否有能力服务于行业头部客户,并在此基础上打磨知识图谱。
6.2 认知智能国内厂商代表——明略科技
明略科技是国内最早大规模布局认知智能的厂商之一,致力于探索认知智能技术在知识和管理复杂度高的行业中的落地。
基于多年的数据积累、数据治理经验积累、场景应用理解能力积累,明略科技将打通感知与认知智能,通过多模态人工智能和大数据技术,连接人、机器、组织的智慧,实现具有分析决策能力的高阶人工智能应用——即认知智能的大规模落地。
不同于传统软件解决方案,认知智能应用是具有反馈机制的动态解决方案,因此只有形成从业务数据化、到数据业务化的业务闭环,才能真正为生产和组织带来效率提升、价值创造等收益。其中,业务闭环的过程是——通过监管体系持续采集数据,自上而下产生数据;汇聚数据之后形成智能化解决方案,自下而上提供服务。
从认知智能厂商竞争力层面来看,明略科技在技术、产品、获客和场景理解方面都具备相当的优势。
知识图谱领域先发优势明显,具备服务省市公安局、长沙市大数据局、宝洁等标杆客户的技术能力,拥有约400人的数据科学家团队。产品能力主要体现在具备整体解决方案的能力。且通过数据治理和知识图谱产品,能够帮助提升项目中产品化率。但在实际的落地过程中,当前大型企业个性化需求较多,服务客户时需要提供必要的咨询服务。
明略科技获客能力较强,在各个领域已有行业标杆客户,公安领域已经服务了超过100个客户、金融领域服务人民银行、建设银行、光大银行、太平洋保险,轨交领域已服务上海地铁。
场景理解能力方面,头部标杆客户的数据治理能力积累和业务场景梳理将成为明略科技行业知识图谱构建和优化的长期竞争力。
6.3 认知智能国外厂商代表——Palantir
成立于2004年的Palantir是国外认知智能厂商的代表。Plantir起家于大数据分析,最初服务于CIA等美国政府机构,做情报人员提供辅助分析,通过几年与CIA的合作,Palantir的技术逐渐成熟,最后形成产品Gotham,这款产品也是Plantir的两大核心产品之一,主要面向政府,用于描述、探究、查询信息以及信息之间的联系,找到事物背后的关系,实际上其核心就是基于知识图谱的隐性关系挖掘。
从2010年开始,Palantir开始涉足商业领域,推出另一款产品Metropolis,为银行、对冲基金的分析师提供辅助量化分析,JP摩根是其第一个商业领域客户,将Palantir的技术用于反欺诈,寻找那些试图盗取他人账户的人。这款产品也是认知智能技术在金融反欺诈领域落地的典型代表。
从认知智能厂商竞争力维度来看,Palantir在技术、获客和场景应用理解方面都比较擅长,产品能力相对较弱。
技术能力主要体现基于知识图谱的隐性关系挖掘方面,技术优势明显。
产品能力一般,主要是Palantir基本做大客户的定制化项目,产品化能力较弱。且产品功能较为局限,覆盖场景比较有限。
Palantir能够顺利切入政府和银行大型客户领域,获客能力较强。
场景应用理解能力很强,公司起家于大数据分析,最初服务于CIA等美国政府机构,后服务于大型金融机构,以及可口可乐等大型企业,场景理解能力强。
关于爱分析
爱分析是中国领先的产业数字化研究与咨询机构,成立于中国数字化兴起之时,致力于成为决策者最值得信任的数字化智囊。凭借对新兴技术和应用的系统研究,对行业和场景的深刻洞见,爱分析为产业数字化大潮中的企业用户、厂商和投资机构,提供专业、客观、可靠的第三方研究与咨询服务,助力决策者洞察数字化趋势,拥抱数字化机会,引领中国产业数字化升级。
研究咨询服务
法律声明
此报告为爱分析制作,报告中文字、图片、表格著作权为爱分析所有,部分文字、图片、表格采集于公开信息,著作权为原著者所有。未经爱分析事先书面明文批准,任何组织和个人不得更改或以任何方式传送、复印或派发此报告的材料、内容及其复印本予任何其它人。
此报告所载资料的来源及观点的出处皆被爱分析认为可靠,但爱分析不能担保其准确性或完整性,报告中的信息或所表达观点不构成投资建议,报告内容仅供参考。爱分析不对因使用此报告的材料而引致的损失而负上任何责任,除非法律法规有明确规定。客户并不能仅依靠此报告而取代行使独立判断。
北京爱分析科技有限公司2020版权所有。保留一切权利。
注:点击左下角“阅读原文”,下载完整版《爱分析·中国认知智能行业报告》。
爱分析·产业数字化峰会正式上线,报名通道已开启,欢迎扫码报名!
爱分析·报告
联系我们