观点 | 探路关联图谱创新,推动投资研究智能化转型
欢迎金融科技工作者积极投稿!
投稿邮箱:newmedia@fcmag.com.cn
——金融电子化
文 / 中泰证券股份有限公司 李伟 叶科 叶勇 陈旭
对于金融行业的运作而言,研究与投资从来都是密不可分、高度一体的集合。唯有对行业和企业进行深入透彻的研究,才能精准把握投资的方向和脉络;唯有身处投资一线,才能真正从实践中理解行业的规律和价值。因此,从产业与行业的一线出发,基于行业发展的实践做好研究工作,是实现高收益、高回报投资的第一步,也是必不可少的关键一步。
在过去很长一段时间内,面对大量的上市公司,投研人员很难对所有的上市公司的经营情况与业绩预期分析的比较清楚且具备条理性。因此,投研工作在数字化时代更加需要数字化、智能化技术的加持,才能在强大算力的驱动下将信息和数据整合汇聚,形成一幅上市公司的“全息动态图”。由此而生的智能投研平台能够基于人工智能、大数据、云计算等现代科技手段,获取、处理、分析海量相关数据,显著推动了数字化技术与投研工作深度融合的重要动能,让基于数据的价值判断成为了优化投资决策的关键因素。
以知识图谱引领智能研投创新
智能投研平台的关键技术核心是对人工智能技术的深度应用,重点包括了自然语言处理(NLP)、知识图谱等技术。NLP能够让机器按照人类理解自然语言的方式,对其所处理的数据进行有效表达和处理,而知识图谱能以接近人类认知世界的方式,将真实世界中存在的各种实体或概念及其关系,构成一张巨大的语义网络图,便于按照人类的方式进行知识的表示、抽取、组织、检索与推理。而关联图谱则能够在知识图谱的基础上,基于一定的关系规则进行推理,信息经由关系(即知识图谱中节点之间的边)进行传导,从而挖掘出知识图谱中隐藏的信息。
在金融机构的实践中,关联图谱主要涉及了企业知识图谱、行业知识图谱、市场实时信息图谱三大业务体系。其中,企业知识图谱是将每一家上市公司的股权关系,企业主营业务及对外投资情况、专利技术以及控股股东企业等信息刻画清楚;行业知识图谱体现在产业链的研究上,能够汇聚行业的知识储备,提升公司的资产留存率及资产复用率;市场实时信息图谱能在前两个图谱的基础上,将经过验证、不同权重的市场信息进行推导、计算,洞察市场上所有的消息对相关企业产生的影响,并将影响以及影响力传导的路径及大小以图形的形式展示出来,极大提高了投研人员决策的效率与准确率。
解读知识图谱的构建之道
在具体的构建上,知识图谱的技术发展路线一般分为两种,自上而下的方式是从优良的数据里面找到本体和关系等信息,借助结构化数据源追加到知识基础上。自底向上的方法是使用特定方针,从公资源模型收集数据,获得高可靠性的信息来添加到基础知识上。本文重点探讨的基于已有的非实时数据与抽取的实时数据,以自下而上的方法构建的用于智能投研的知识图谱。
以自下而上的方式构建知识图谱主要分为三个步骤:知识抽取、知识融合以及知识加工。知识抽取指的是从各种类型的数据(包括结构化与非结构化数据)源中提取出实体、属性以及实体间的相互关系,并形成本体化的知识表达。由于知识的来源不同,同一个实体可能对应多种表达,或者同一种表达也可能对应着不同的实体,知识融合便指的是对多个来源的知识进行整合,消除矛盾和歧义。知识加工指的是对于融合后的知识,经过质量评估甚至人工评估环节后将符合条件的内容作为新增内容加入到知识库中。
通过自下而上方式构建的智能投研知识图谱主要分为三部分,最左侧部分是基于公司已有的非实时的数据所构建的基础架构的知识图谱,能够让投研人员看到上市公司(含非上市公司)与投研相关的信息以及各个公司之间的相互关系,同时配备了表示相关性的权重值。投研人员可以对图谱中数据进行查询与推导,并通过网状图的形式进行展示,便于投资人员进行投资决策。在中部,NLP能够对实时获取的股票、期货等交易所数据或者财经信息、社交平台舆情等数据进行分析处理,从而跟踪市场情绪变化,应对市场突发事件。
图 智能投研知识图谱
在右侧,专家知识库可以让行业专家或者投研人员进行知识补全,尤其对于国家宏观经济、行政政策、行业趋势、企业运营等信息的分析,需要专业人员来将结果汇集到专家库中。这三部分图谱完成后,金融机构可以采用相应的算法来发掘潜藏在数据中的业务价值,将最终结果持续反馈给顶层的数据处理过程或知识推理过程,还可以持久化到数据库,对于后续的投资研究与知识推理有一定的意义。
其中,图谱的构建和传导的过程是尤为需要注意的两个关键点。在图谱构建中,图数据库因为能够采用实体、关系、属性的形式来存储数据,更适合智能研投平台的建设,同时部分数据也更适合存放到关系型数据库中,便于数据查询与分析;在传导过程中,基于规则的传导计算目前在垂直领域的应用中占据主导地位,但随着数据量的增加以及方法论的提升,基于特征工程-AI算法-概率的方式来传导计算也将会逐步带来更大的价值。
深入场景,激活智能金融新价值
与传统研投方式相比,智能投研在数据的获取方式上拓展了自然语言处理数据等更多渠道,在数据源上增加了舆情、社交等多源数据,并能以NLP、知识图谱等更全面、深入地分析数据,以图表或者动画的形式进行展现。更为关键的是,智能投研系统可以帮助研究人员在短时间内完成相当多基础工作,充分发挥出人工智能在数据处理方面的优势,极大提高决策的效率,在海量的企业、产业及市场数据基础上,在知识推理、事件传导中交叉验证,将传导过程图形的形式展示给投研人员,给投研人员更多的信息,故产生的结论准确性相对更高。
目前,知识图谱已经在智能投研领域开拓出了一系列独具特色的应用场景。
在选股方向和价值推理分析上,部分成型算法已经能够根据关联图谱中的权重信息来判断某些股票的上涨是否会带动其他股票上涨,从而进行买入操作;
在投资组合风控方向-风险传播分析上,关联图谱能够根据舆情信息发现可能存在风险的股票,将更加实时等向投资经理进行提醒或者进行卖出操作。
在集团户的识别与构建上,关联图谱能够以股权关系数据为纽带,将企业集团以一个包含多级数据源的知识图谱的形式呈现出来,并整合为结构化数据,并将其应用于股权投资、债权投资、质押、同一客户授信等多个应用场景中。
在业务关联关系识别与预警上,通过上下游的供货、销售关系构建关联的知识图谱,可以通过每一个节点上的企业,快速检索其自身及其关联企业的上下游关联企业,在节点上企业出现突发事件时快速对该企业及上下游企业进行识别,并采取相应措施。
在市场走势归因上,关联图谱能够利用程序化方法对历史上相似的市场走势进行归因,寻找共同的驱动因素,并形成逻辑推演的知识图谱。在驱动因素再次出现时,可以依次验证各个逻辑节点上的驱动因素是否符合规律,并进一步推断市场走势。
长期的实践和应用表明,智能投研系统的构建无法一蹴而就,而是一个持久优化的过程。随着时间的推移,智能投研的节点、关系、属性都会随时变化的系统。面向未来,知识图谱将向更加集成化、智能化的方向发展,在走势归因的基础上,基于当前市场与走势判断,智能化提出投资操作建议,并根据策略进行业绩回测,真正实现智能投研,同时在算法层面,多信源信息推理和多语言知识图谱推理也在加速创新和应用。未来,基于知识图谱构建的智能投研平台将成为金融机构开展业务的有力平台,引领金融业务走向数字化、智能化的新征程。
(栏目编辑:张丽霞)
往期精选:
(点击查看精彩内容)
● 观点 | “大安全”理念下基层人民银行安保工作转型升级路径
新媒体中心:主任 / 邝源 编辑 / 傅甜甜 张珺 邰思琪