查看原文
其他

图谱应用剖析:智能投研代表系统Kensho介绍与核心部件简述

东吴证券 老刘说NLP
2024-10-05

智能投研是当前Fintech的重要方向,同时金融咨询行业也是该系统的一个重要出口。

金融咨询行的服务主要是为客户提供市场数据的分析、给出投资建议等,属于人力资源密集型行业,其服务的价值在于,受过专业教育的从业人员在与客户信息、知识不对称的情况下,能为客户提供信息与分析决策服务。

而在实际的工作中发现,由于多种复杂的因素,资产价格已经不像30年前一样受小类因素的影响,而是收到多种因素的影响,例如政治事件等。因此,Fintech系统很希望建立一个模型去分析资产是如何暴露在非传统因素影响下的,哪一类资产价格收到某件因素最敏感。

设想一下该场景,突发新闻报道叙利亚遭到袭击,投行的客户们一定纷纷打给他们的客户经理,询问该事件会对他们的资产组合造成什么样的影响。

客户经理的反馈模式是利用他们的自有知识和有限的记忆对这件事如何对某类资产造成的影响作出判断。如果打电话过来的是一位重量级客户,他们可能需要要求研究员对该问题进行一个系统的研究,出一份研报。

该模式的问题在于,如果反馈需要时间,则该交易机会可能会流失。以上的过程,如果交给一名传统金融分析师来做,可能要花上数天时间,总计40个小时左右。

因此,如何借助机器,来完成上述场景的快速解决,以知识图谱、事件关联分析挖掘的前沿产品被先后提出,本文主要介绍在智能投研角度下的知识图谱应用,并以Kensho-warren产品典型分析对象,进行实现思想进行介绍。


一、从知识图谱到智能金融

在金融领域,通过知识图谱相关技术,机器可以从招股书、年报、公司公告、券商研究报告、新闻等半结构化表格非结构化文本数据中批量自动抽取公司的股东、子公司、供应商、客户、合作伙伴、竞争对手等信息,并构建出公司的知识图谱。

1、智能投研与知识图谱

当某个宏观经济事件或者企业相关事件发生的时候,投资者可以通过知识图谱做更深层次的分析和更好的投资决策,比如在美国限制向中兴通讯出口的消息发布之后,如何构建最佳投资组合。

因此,随着知识图谱相关技术逐步发展并应用,不仅可以进一步完善数据的丰富度和准确度,还可以加速数据标准化、关联化的建立,进而促进搜索向投资观点的一步跨越。

其中,智能投研是智慧金融的一个阶段性形态,其终极目标实现搜索到投资观点的自动跨越。如上图所示,传统投研流程,可简化成四个步骤:

1)搜索:通过百度/谷歌、专业书籍、公告等寻找行业、公司、产品的基本信息。

2)数据/知识提取:通过万得、彭博等金融终端或者直接阅读公告、新闻获得数据/知识。

3)分析研究:通过Excel等工具和逻辑推演完成分析研究。

4)观点呈现:将分析研究的结果以PPT、word等形式呈现。

传统投研流程存在搜索途径不完善、数据获取不完整且不及时、人工分析研究稳定性差、报告呈现时间长等缺陷,而利用知识图谱等方法,可以帮助每一个步骤提高效率,如智能搜索和智能资讯增大有效信息来源,公告/新闻自动化摘要和上下游产业链分析提高数据知识提取效率,事件因果分析和大数据统计分析完善研究方法等等。

在这一需求的驱动下,国内外国外创业公司跃跃欲试,相较于智能投顾,智能投研技术难度更高,其发展态势初露雏形,还未成规模。

2、国外智能投研厂家路线

PalantirMetropolis平台整合多源数据,将不相干的多个信息置于一个统一的定量分析环境中,构建动态知识图谱;

VisibleAlpha通过设立专有的新数据集和工具套件以增强机构投资者对公司未来基本面的量化见解能力;

Trefis细拆公司产品/业务预测收入;

Alphasense获取专业且碎片化信息;

Dataminr收集Twitter等公共来源上的实时数据,并转化为可付诸行动的信号;

Kensho试图回答“当Netflix超出盈利预期,Amazon明天表现将如何?”、“Apple发布新产品前后的股票交易如何?”等投资问题。

3、国内智能投研厂家路线

通联数据的萝卜投帮助分析师提高处理信息、快速挖掘投资线索的能力,产品包括智能咨询、智能搜索、智能财务模型;

数库科技提供数据关联化、智能化服务;

天弘基金2015年建立了业内领先的投研云系统,其中的信鸽和鹰眼两大系统分别为股票和债券投研提供精准支持;

嘉实基金2016年成立了人工智能投资研究中心,构建可扩展的智能投研平台,为系统化的科学投资决策提供支持;

华夏基金和微软亚洲研究院战略合作,双方将就人工智能在金融服务领域的应用展开战略合作研究。

不过,需要注意的是,由于国内金融数据较于国外存在数据不丰富甚至残缺的致命缺陷,数据标准化、关联化的建立显得至关重要,因此国内数据服务商,如wind、东方财富、同花顺、恒生聚源等公司是推动智能投研发展过程中的重要组成部分

4、智能投研下的主要产品形态

现阶段智能投研工具与传统投研工具的本质区别在于交互体验、数据逻辑和自我优化学习能力。

1)交互体验:传统投研工具如万得、彭博均是非图形化的类EXCEL表格界面,而Kensho、数库科技等智能投研工具均是图形化界面,交互体验更强,比如可以在图形界面上随意点击一个节点进行相关查询,非常利于投研效率的提高。

2)数据逻辑和自我学习优化能力:由于传统金融数据服务商的数据是基于财务报表的逻辑关系,是静态存在的,因此没有自我学习优化能力,并且不能跨公司实现数据之间的逻辑关联;

例如,Kensho、数库科技所提供的数据服务,一方面具有静态基于会计逻辑的数据,另一方面可以实现数据的动态关联,并且这种动态关联可以跨公司和行业实现,通过海量数据、知识图谱和深度学习能力,机器可以发现事件与事件之间的关联关系,并通过知识图谱实现信息向决策的一步转化,并且这种转化过程是可以通过机器学习逐步自我优化的,甚至可以说会比人类做得更好。

智能投资、智能投顾、智能咨询、智能客服四大产品亮相:

1、智能投资:基于大数据分析、机器学习和推荐引擎等技术,打造以用户画像为依据,可以帮助金融机构为个人用户提供机会挖掘、交易陪伴以及精准服务的智能决策辅助系统。

2、智能咨询:通过强大的人机自然交互,投资者可获得关联的股票和资讯信息。

3、智能投顾:分为客户需求探索、资产优化模型、智能择市(量化投资策略)和资产智能管理四个环节。

4、智能客服:运用语音识别、智能语义、以及智能知识的核心技术,帮助金融机构提高客服效率,提供7*24小时不间断的快速服务,降低人工的运维成本。

二、Fintech的典型代表系统:kensho

Kensho公司属于金融咨询行业,是一个将云计算与金融咨询业务结合起来的科技型公司,主要产品是一个名叫“Warren”(沃伦)的金融数据收集、分析软件。

Kensho官网上声称“Kensho是一个先锋级的实时数据计算系统、一个可量化的数据框架,是全球化金融系统的新一代升级产品”。它拥有强劲的云计算能力、良好的人机交互界面和深度学习能力。

Kensho公司的目标是让此软件的功能取代现有的大量投资分析人员的工作,为客户提供更加优质、快速的数据分析服务。

两位创始人因禅结缘,创立Kensho,团队成员人才济济。自2013年起,公司累计融资超1亿美元,2017年4月获标普国际领投的B轮5000万美元融资,估值达5亿美元,目前已实现盈利。公司产品Warren试图通过构建事件数据库及知识图谱的综合图表模型,解决投资分析中“速度、规模、自动化”三大挑战。

Kensho客户主要包括两条业务线,1)利用历史数据帮助大型银行和其他金融机构分析诸如地理、天气等因素带来的风险敞口;2)帮助全球商业媒体承担事件分析业务。

目前,公司已经和谷歌、S&P等金融机构达成战略合作关系,它们不仅是Kensho的风险投资者,亦是合作伙伴,如B轮融资领投机构S&P将为Kensho分析平台提供全球市场情报数据,在此基础上双方将合作开展未来产品开发,将新的创新能力推向市场,此外S&P将拥有Kensho的一个董事会观察员席位。

与此同时,Kensho作为CNBC(美国NBC环球集团所持有的全球性财经有线电视卫星新闻台)的独家分析提供商,其数据可视化分析每天在CNBC上播放多次。当然,商业媒体的核心竞争力是某事件发生之后以最快的速度给出一个站得住的分析结论,该属性使得CNBC对Kensho的分析能力不会有过高要求,而会更加注重分析速度。

从谷歌、S&P、CNBC既是风险投资商也是商业合作伙伴的属性看,未来Kensho有望拓展至美国政府部门。

三、Kensho系统中的核心部件:Warren

Kensho主打产品,是叫“Warren”(沃伦)的金融数据收集、分析软件,拥有强劲的云计算能力、良好的人机交互界面和深度学习能力,试图通过构建国际事件数据库及知识图的综合图表模型解决投资分析的速度、规模、自动化“三大挑战”。

该产品类似于Google搜索引擎的金融分析软件,用户只需以通俗易懂的英文来询问Warren金融问题,比如“台风对建筑行业股票价格影响是怎样的”,随后便会将问题转换成机器能够识别的信息,并寻找云数据库与互联网中的各类相关数据与事件,运用大数据技术进行分析,并根据市场走向自动生成研究预测报告,回答投资者的问题。

据福布斯介绍,“在能够找全数据的假设下,对冲基金分析师团队需要几天时间才能回答的问题,Warren可以通过扫描超过9万项全球事件,如药物审批,经济报告,货币政策变化和政治事件及其对地球上几乎所有金融资产的影响,立即找到超过6500万个问题组合的答案。

具体的:

Warren的强大功能使得用户不再需要有专业的金融知识,也不需要设置复杂的参数和配置算法,就可以得到类似于金融分析师分析的结果,让更多的人能够以较低的门槛获得专业的分析结果。

1、寻找事件与资产的相互关系

Warren可实现,寻找事件和资产之间的相关性及对于其价格的影响、基于事件对资产未来价格走势进行预测。其中:

1)寻找事件和资产之间的相关性

a)寻找影响资产价格的关联事件: 例如输入Apple,Warren会显示一张Apple的股价走势图,在每一天的时间节点,从中可以得到具体哪些事件影响了Apple股价以及影响的百分比,还会展现相关事件对股价波动的P-Value,即显著性影响指数。

b)寻找某事件对某些资产价格的影响: 例如输入“美联储降低利率”,并自由选择时间段和投资的种类,比如道琼斯指数、油价等,Warren会以图表方式呈现该事件对资产价格走势的影响。

2)基于事件对资产未来价格走势进行预测

利用机器学习预测资产的价格,通过可能影响价格的相关因素去预测资产未来价格的走势区间。由于Warren的数据库已经包含了大量的数据源,包括政治事件、自然事件等,因此可能存在大量显著影响资产价格的变量,Warren需要判断哪些是可以用来预测价格的相关特征。在特征的选择上,Warren可以根据用户的建议输入相关的变量,也可以通过特征选择的算法去保留相关的特征。

最后,Warren会以股票价格概率分布区间的图表呈现其预测的结果,其中选择的算法去保留相关的特征。最后,Warren会以股票价格概率分布区间的图表呈现其预测的结果。

2、快速计算能力、良好人机交互、强大深度学习能力

Warren具有快速的计算能力、良好的人机交互性、强大的深度学习能力。

1)快速的计算能力: Warren搭建于纳斯达克OMX FinQloud,这是一个专门为金融服务部门设计的云计算平台,不仅可以加强云计算能力,还能够提供满足金融服务特殊安全和监管要求的技术支持。基于此,Warren能高效完成分析师难以快速做到的信息收集、挖掘等工作,Warren获得的信息可能是传统分析师的数倍多,分析速度是分析师的百倍。

2)良好的人机交互性: 只要输入直白正确的问题,Warren就会提供精确的答案。比如输入,当朝鲜试射导弹时,哪支国防股会涨得最多?(雷神公司、美国通用动力公司、和洛克希德马丁公司);当苹果公司发布新iPad时,哪家苹果公司的供应商股价上涨幅度会最大?(为iPad内置摄像头生产传感器的豪威科技股份有限公司)。

3)强大的深度学习能力: 根据各类不同问题积累经验,逐步成长,强大的学习能力让Warren越用越聪明,提出的问题越多,Warren学会的东西越多,这也是云计算系统与普通硬件计算系统的差别。

三、Kensho-Warren的优势、不足与挑战

1、优势:削弱不对称性,现代金融投机行为性质有望再次改变

Warren的出现有望如同电报、互联网诞生一样进一步削弱市场不对称性,加快信息传导速度。

1)削弱金融市场的不对称性: Warren将传统的专业分析师小范围独享的资产价格预测分享给更多普通人,削弱市场的不对称性,同时也削弱了专业金融机构相对于普通投资者的获利优势。

2)加快信息在金融市场的传导速度,从而使得金融市场更受信息影响: 由于Warren获取信息速度是专业人员的数倍多,分析速度是专业人员的百倍,因此Warren的出现如同电报、互联网出现一样,进一步加快信息在金融市场的传导速度。如同19世纪出现的电报,20世纪出现的互联网一样,极大改变金融投机行为性质,大幅降低具备信息优势的机构的获利能力,我们有理由相信,如果Warren可以使得资产价格以更快、更大程度反映“所有可以获得的信息乃至决策后的结论”,那么现代金融投机行为性质将再次发生改变。

2、缺陷:无法自我形成新因果关系,无法区分因果性/相关性

Warren人机交互有待提高,尚不能判别因果逻辑。尽管Warren具备基础问答能力,然而目前来看,还存在人机交互和因果逻辑混乱等致命缺陷。

1)无法自我形成新因果关系: 现阶段的Warren更像一个数据收集、图形化呈现的工具,并不能任意提供分析师决策。比如Kensho无法直接回答特朗普上台对股市产生的影响,这是由于过去的历史事件并没有包含特朗普的相关信息。即Warren只能做到变量延展,但却无法替用户去逻辑推理事件可能的影响因素,一切背后的关系还需要用户自己去发现。

2)无法区分因果性还是相关性: 假设我们发现比特币价格和黄金价格具有一定的相关性,并基于其关系去预测比特币未来的走势。但是我们没有发现,英国脱欧是驱动两种资产价格上涨的背后原因。即Kensho目前无法判断是因果性还是相关性。

因此,我们可以看到,Warren和金融分析师在相当一段长时间里是相辅相成而不是竞争的关系。Warren尚无法做到金融分析的完全自动化,未来很长一段时间也无法完全替代人类分析师。尽管Warren能搜集更全面、更详细的数据,并提供简单的分析和以图形化方式呈现,但是更高级的思考模式,比如理解事件和资产之间更深层次的因果逻辑,理解变量之间的相关性,Warren是不能办到的。

从某种意义上说,Warren和金融分析师在相当一段长时间里是相辅相成而不是竞争的关系,依靠Warren可以大量释放金融分析人员的生产力,能够让其有更多的时间去思考并决策。

3、挑战:自动触发时间对资产价格的影响是Warren终极目标

完善构建全球事件数据库是Warren下一步战略目标。因此,可以将事件之间的关系做成一张图,形成事件“连接图表功能”,机器会尝试识别事件的概念,关系和网络,逐步模拟金融分析人员的逻辑思考能力,比如试图解决上述无法判定事件因果性还是相关性的问题。

此外,如何将语音识别技术结合到Warren中、如何更新庞大的数据库、如何提高Warren的学习精度与分析速度、如何提高分析结果的准确性也是Warren未来发展的关键点,当然也是难点。

自动触发事件对资产价格的影响是Warren终极目标。如果未来能借助AI、语音语义、知识图谱等技术让Warren识别并理解变量的语义、变量之间的相关性、资产和事件内在的深层因果逻辑,那么Warren能真正做到对金融分析无所不能。

更进一步,如果Warren可以自动提取事件特征,真正理解语义内外在含义,自主构建并修改知识库和知识图谱,自动触发事件对资产价格的影响并对未来价格走势进行预测。

四、总结

本文主要介绍在智能投研角度下的知识图谱应用,并以Kensho-warren产品典型分析对象,进行实现思想进行介绍。

我们可以看到,在金融领域,通过知识图谱相关技术,机器可以从招股书、年报、公司公告、券商研究报告、新闻等半结构化表格非结构化文本数据中批量自动抽取公司的股东、子公司、供应商、客户、合作伙伴、竞争对手等信息,并构建出公司的知识图谱。

我们从中发现,无论是国内,还是国外,都在智能投研这个赛道中进行了布局,尤其是以kensho为例的产品,更以结构化知识、结构化金融数与事件分析作为当前以及未来挖掘的重要技术,这也是事件图谱与知识图谱技术在Fintech中的应用价值,我们可以加以关注

参考文献

1、http://p2p.daokoudai.com/2016089237.html

2、https://max.book118.com/html/2018/0504/164617090.shtm

关于我们

老刘,刘焕勇,NLP开源爱好者与践行者,主页:https://liuhuanyong.github.io。

就职于360人工智能研究院、曾就职于中国科学院软件研究所。

老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。

继续滑动看下一个
老刘说NLP
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存