当期荐读 2020年第3期 | 面向金融决策支持的知识获取研究综述
by图虫创意网
唐晓波1,2 谭明亮1 胡潇然3 石文萱1 周巧1
(1.武汉大学信息管理学院,武汉,430072;2.武汉大学信息资源研究中心,武汉,430072;
3.武汉大学经济与管理学院,武汉,40072)
摘 要
大数据时代,金融行业面临着容量巨大、动态变化和多源异构金融数据所带来的巨大挑战,从金融大数据中挖掘出对金融决策支持有价值的知识,形成各类面向金融决策支持的金融知识库,使其有序化地收敛于高效的金融知识服务,这对于投资决策、风险管理和金融监管等金融决策支持过程具有十分重要的意义。通过梳理面向金融决策支持的知识获取的相关研究,从事实性金融知识获取和规则性金融知识获取两个维度全面考察了该领域的研究现状,并重点调研了细粒度事实性金融知识获取的相关研究进展。结合国内外已有的研究成果来看,未来的研究应重点关注大规模金融知识的高效获取与挖掘、多源金融知识的融合与集成以及金融决策支持的个性化与智能化服务。
关键词
金融决策支持, 金融知识库, 知识获取, 知识服务, 数据挖掘
1 引言
作为大数据的重要生产者和消费者,金融业已经走在大数据浪潮的前沿。现代金融体系的运行每时每刻都在产生着大量的金融数据,金融业面临着容量巨大、动态变化和多源异构金融数据所带来的巨大挑战。与此同时,金融业又是一个典型的知识密集型行业,对数据、信息和知识有着巨大的需求,诸多的金融决策都需要大量的数据、信息和知识作为支撑[1];未来金融业的核心竞争力很大程度上依赖于从大数据中提取信息和知识的速度与能力。正如未来学家奈斯比特在其著作《大趋势》中所说:“人类正被信息淹没,但却饥渴于知识。”大数据时代,金融行业积累的丰富数据资源为金融知识服务带来了新的契机,但这也对数据处理和知识获取提出了更高的要求,如何从海量多源异构的金融数据资源中获取对金融决策支持有价值的知识,从而为金融决策支持提供个性化和智能化的知识服务成为了各级政府、金融机构、金融信息服务提供商和情报工作者所共同面临的重要问题。
各国政府高度重视各领域的大数据分析与挖掘以及金融知识的获取、整合与利用。美国政府于2012年投资两亿美金启动大数据研究和发展计划以提高从金融、医疗和能源等领域的大数据中获取知识的能力。英国紧随美国的大数据战略,于2013年投资1.89亿英镑来发展大数据。2015年,国务院印发的《促进大数据发展行动纲要》文件指出:“利用大数据、云计算等技术,对各领域知识进行大规模整合,搭建层次清晰、覆盖全面、内容准确的知识资源库群,建立国家知识服务平台与知识资源服务中心。”2017年,国务院印发的《新一代 人工智能发展规划》文件指出:“建立金融大数 据系统,提升金融多媒体数据处理与理解能力。创新智能金融产品和服务,发展金融新业态。”
作为一种典型的知识密集型行为,决策过程需要对相关数据信息进行充分的分析和知识挖掘,从而有效地分析问题的产生原因、发展趋势及影响要素的相关性[2]。知识获取是决策支持过程中的核心和关键环节,同时,能否获取丰富、有效的知识也直接影响着知识服务的质量[3]。针对大数据环境下存在的海量多源异构金融数据,运用知识获取的相关理论、方法和技术,从海量的数据资源中获取对金融决策支持有价值的知识,形成各类面向金融决策支持的金融知识库,并利用知识关联、知识检索和知识推理等技术对金融知识库进行运算,并将结果以知识导航、自动问答和知识检索等形式为决策者提供知识服务,这对于投资决策、风险管理和金融监管等金融决策支持过程具有十分重要的意义。本文对国内外金融知识获取的相关研究进行了系统的梳理,并分析了该领域未来的研究趋势,以期能为金融知识的获取、整合与利用等相关研究提供借鉴和参考。
本文获取文献的过程如下:首先,获取与金融知识获取、金融数据挖掘、金融知识组织和金融知识服务相关的权威综述文章,从综述文章中获取其重要的参考文献以及该领域的研究热点,如破产预测、股票预测、信用风险评估、财务欺诈检测等;其次,以中国知网、万方和百度学术作为中文文献的数据源,并以“金融知识获取”“金融数据挖掘”“金融数据分析”“金融知识发现”“金融知识挖掘”“金融知识组织”“金融知识服务”“金融信息抽取”“破产预 测”“股票预测”“信用风险评估”“财务欺诈检测”等为检索词进行检索,文献时间限定为2010—2019年,检索时间为2019年9月20日;然后,以Web of Science、ScienceDirect、 SpringerLink和 Google Scholar作为外文文献的数据源,并以 “financial knowledge acquisition”“financial data mining”“financial data analysis”“financial knowledge discovery”“financial knowledge mining”“financial knowledge organization” “financial knowledge service” “financial information extraction” “bankruptcy prediction” “stock prediction” “credit risk assessment” “financial statement fraud detection”等为检索词进行检索,文献时间限定为2010—2019年,检索时间为2019年9月20日。最终获得的总文献数超过了1000篇,我们逐篇阅读其摘要,并对文献进行归类和筛选。例如,有大量文献是关于改进破产预测算法的则将其归为一类。然后针对每一类文献进行总结,并选取各个类别中适合本研究的具有代表性的重要文献共计44篇。
2 金融决策支持与金融知识获取
金融决策支持需要根据金融领域中的各种具体的应用场景,从海量的多源异构金融数据与信息中获取对金融决策过程有价值的金融知识,从而有效地辅助和支持决策者的金融决策,更好地促进和提高投资决策、风险管理和金融监管等金融决策的效率与质量。金融知识获取是指通过知识工程师、智能编辑程序或者通过数据挖掘、信息抽取等技术,手动、半自动或者自动地从金融知识资源中抽取出金融决策支持过程所需要的各种知识,并以一定的形式表示和存储在计算机中,从而形成各类面向金融决策支持的金融知识库。
知识根据其作用及表示可以分为事实性知识、规则性知识、控制性知识和元知识[4]。事实性知识是指领域内的概念、事实、事物的属性、状态及其关系的描述;规则性知识是指有关问题中与事物的行动、动作相联系的因果关系知识;控制性知识是指有关问题的求解步骤、技巧性知识;元知识是有关知识的知识,包括怎样使用规则、解释规则、解释程序结构等知识。在当前的研究中,金融知识的获取主要包括事实性知识和规则性知识的获取;控制性知识以及元知识则被研究者隐式地加以获取和内化,并体现在整个研究的选题、框架设计、实验过程和结果分析等过程中。
知识具有不同的粒度,通过提供知识服务来解决用户问题的过程中,有时需要颗粒度较小的知识,有时需要颗粒度较大的整合型知识。粗粒度知识由众多相关的知识聚集在一起,而细粒度知识的组成则相对较为单一[5]。例如,一篇行业研报或财经新闻中包含了许多相关的知识,这表现为粗粒度知识;一个金融领域的概念或短语,则表现为细粒度知识。由于粗粒度知识与细粒度知识具有相对性,为了便于研究,本文将句子以上粒度(包括句子、段落、语篇等)定义为粗粒度事实性金融知识,将句子以下粒度(包括概念、概念关系、实体、实体关系、事件元素等)定义为细粒度事实性知识。同时,也将通过分类、聚类等技术将数值型金融数据简单地划分为几个大类的研究,纳入到粗粒度事实性金融知识获取的范畴。通过细粒度的方式进行知识获取和组织能够深入知识资源的内部,实现知识单元之间语义关系的充分揭示,能够满足用户精准化的知识服务需求[6]。因此,本文重点调研了细粒度事实性金融知识获取相关的研究进展。
3 粗粒度事实性金融知识的获取
粗粒度事实性金融知识的获取,主要通过知识发现中的分类、聚类、文本情感分析和文本主题分析等技术来对结构化和非结构化的金融数据进行分析和处理,从而形成一定类别和主题的粗粒度事实性金融知识集合。当前有关粗粒度事实性金融知识获取相关的研究文献较多,主要集中于对小样本的数值型结构化金融数据进行分类和聚类。随着移动互联网、社交网络、物联网和云计算等技术的飞速发展和广泛应用,金融数据的规模呈现出爆炸性增长的趋势。这些体量巨大、类型繁多、来源分散、格式多样且具有巨大应用价值的金融大数据为金融知识的获取提供了契机。因此,近些年来,国内外的研究者开始将目光聚焦于从海量的多源异构数据中获取金融知识[7]。
大数据分析是大数据研究领域的核心内容之一,金融大数据作为具有潜在价值的原始数据资产,只有通过深入分析才能挖掘出对金融决策有价值的知识。Lee等[8]基于美国证监会提供的包含35亿用户查询请求的证监会网站的海量访问日志数据,利用用户搜索日志中企业间的共现关系来识别相似企业,进而对企业进行有效的聚类;宋彪等[9]利用网络爬虫技术从新闻媒体、博客、论坛等信息源中爬取了7000万余条的网络信息,并使用文本情感分析技术对这些海量的网络信息进行分析和处理,研究结果发现,在引入网络在线的大数据信息后,能够更好地将陷入财务危机的企业分类出来;Bollen等[10]对近1000万条的 Twitter文本进行了六个情感维度的测度与分析发现,公众特定维度的情感可以显著提高道琼斯工业平均指数(DJIA)的预测准确率。
在金融领域,数据分析的对象大多是定量的结构化数据,如市场交易数据、企业财务数据、宏观经济数据等。由于金融领域的复杂特性,仅对结构化数据的分析往往很难得到满意的分析结果,比如股票价格可能会因为政府出台的新政策而发生剧烈的波动,如果只是分析股票以往的价格、成交量等定量的结构化数据,则很难进行合理而准确的分析预测。非结构化数据中含有大量有价值的信息,是结构化数据的有力补充,例如,新闻报道和公司年报等非结构化文本信息源中包含了大量有关公司当前经营状况和未来发展前景的补充信息[11]。对多源异构的金融信息加以分析和挖掘能够更加全面和多维度地理解和认识事物的本质,从而辅助管理决策者作出更高效、更正确的决策。
当前非结构化金融数据分析的对象主要是文本类数据,例如新闻报道数据、社交媒体数据、年报文本数据等。也有极少数的学者尝试将视频、音频等数据应用于金融知识获取中,例如,Hobson等[12]采用语音情感分析系统LVA对CEO在业绩电话会议上的讲话语音进行分析来实现财务错报的分类。从文本数据中获取金融知识的方法除了上文所提到的文本情感分析以外,还主要包括文本分类、文本聚类和文本主题分析等技术。Huang等[13]针对上市公司年报中描述企业风险因素部分的文本信息,提出了一种多标签文本分类算法来将上市公司分类到多个风险类别中;朱江[14]将WordNet本体库与传统的向量空间模型相结合形成基于语义的文本表示模型,来对金融新闻文本进行聚类,从而更好地探测和发现金融热点新闻;Pröllochs等[15]利用 LDA主题模型来对美国上市公司披露重大事件的8-K文件文本进行主题探测,以评估企业的内外部环境以及识别企业所面临的机遇与风险。
4 细粒度事实性金融知识的获取
细粒度事实性金融知识的获取主要通过手工、半自动或者自动地从金融知识资源中获取金融领域的概念和概念关系、实体和实体关系、事件及事件元素等细粒度金融知识元素,并构建金融领域本体、金融知识图谱、金融事件知识库、金融领域案例库、用户知识库以及金融情感词典等金融知识库,从而形成细粒度的金融知识集合。通过知识工程师与领域专家交流,或者阅读相关专业文献来手工获取细粒度金融知识的方式尽管准确率高,但是需要耗费大量的人力成本和时间成本。因此,在这里重点介绍利用知识抽取和知识发现等技术,半自动或者自动地获取细粒度的金融知识元素来构建金融知识库的相关研究。
4.1 面向金融领域本体构建的知识获取
本体是共享概念模型的明确的形式化规范说明,描述了特定领域内的概念以及这些概念之间的关系,其主要组成部分包括概念、概念之间的关系和实例。本体能够在语义和知识层次上对概念模型进行描述,并且在复杂知识建模和知识推理方面具有明显的优势。本体为多源知识资源的表示与集成提供了重要的方法和手段,被认为是大规模集成和访问不同来源的金融数据的有力技术[16]。如今,本体正逐渐成为企业、银行和监管机构之间进行互联互通和电子通信的开放标准[17]。当前的研究主要是通过知识工程师从领域专家处或者文献资料中手工获取金融领域的概念和概念关系等知识元素来实现金融领域本体的构建。例如,Mellouli等[18]通过手工的方式获取领域概念和属性来对金融新闻标题进行本体知识建模。
通过知识工程师手工获取知识元素来构建金融领域本体不仅周期长、而且还会耗费大量的人力和物力成本,因此,部分研究者开始尝试利用文本挖掘和知识抽取等技术,从结构化和非结构化数据中获取概念、概念关系和本体实例等知识元素来完成金融领域本体的半自动或者自动构建。对于数据库和网页中的表格等结构化和半结构化数据,主要通过解析和分析关系数据库模型以及网页表格模式中蕴涵的语义信息来获取概念、概念关系和实例。例如,García-Sánchez等[16]对网页中的表格数据进行有监督的解析,从而抽取出类的实例来实现本体实例的半自动填充。
除此以外,国内外的研究者还聚焦于从非结构化文本数据中抽取出领域概念和概念关系,来实现金融领域本体的半自动或者自动构建。对于本体概念的获取,主要的方法包括基于词典和规则的方法、基于统计机器学习的方法;对于概念间关系的获取,主要的方法包括基于语法模式的方法、基于概念聚类的方法、基于关联规则的方法、基于词典的方法、基于机器学习的方法、基于形式概念分析的方法或者这些方法的混和[19]。典型的研究如胡小荣等[20]基于多因素拟合的短语抽取技术,来获取上市公司年报文本中企业风险因素相关的概念;支良标[21]通过跟踪主题模型主题数的增加而导致的主题分裂以及术语间的非对称覆盖度,来发现文本中潜在的金融领域概念及其关系。
与此同时,Freebase、Wikidata、DBpedia、YAGO等知识库以及Folksonomy社会化标签系统也为金融领域概念及概念关系的获取提供了新的视角。Novalija等[22]基于金融领域的种子词汇,从Cyc等多领域知识库中抽取金融领域本体子集,并利用术语相似度算法来发现潜在的概念及其关系,最后通过领域专家对获取的概念及概念关系进行验证和调整;García-Silva等[23]利用Delicious系统中的Folksonomy标签来抽取金融领域的相关概念,并利用Dbpedia、OpenCyc等关联数据资源来确定概念之间的语义关系;唐旭丽等[24]通过复用国外现存的FIBO金融领域本体来实现概念以及概念间关系的获取。
4.2 面向金融知识图谱构建的知识获取
实体抽取的方法主要包括基于规则与词典的方法、基于统计机器学习的方法和混合方法[25],同时,金融领域的实体抽取非常注重人名与组织机构名的识别[26]。Xu等[27]将多个金融机构名称词典进行整合,并利用基于规则的方法和整合后的词典来识别住房抵押贷款支持证券说明书中的金融机构实体; 张悦等[28]基于隐马尔可夫模型来抽取招中标文本中的人名实体;Wang等[29]根据金融领域文本中命名实体特殊的表达规则与模式,将机器学习和信息论方法相结合来实现不同表达情况下机构实体的识别。
实体关系抽取的主要目的是识别实体之间的语义关系,如企业之间的竞争关系、合作关系、附属关系等。同时,由于实体的属性可以看成是实体与属性值之间的一种名称性关系,因此,可以将实体属性的抽取问题转换为关系抽取问题[30]。实体关系抽取的方法主要包括基于规则的方法、基于有监督的统计机器学习方法、基于半监督的统计机器学习方法和无监督的开放关系抽取方法[31]。近年来,深度学习技术取得了巨大的研究进展,深度神经网络可以自动从文本中学习到有效的特征,不需要复杂的特征工程。部分学者开始尝试将CNN、RNN、LSTM等深度学习模型应用于金融领域的实体关系抽取中。例如,孟蕾[32]提出了基于依存句法分析的注意力机制融合LSTM网络的方法,来识别公司实体之间的合作、附属、收购、合并等多种语义关系。
研究者们针对金融领域的具体应用场景,利用数据挖掘和知识抽取等技术,从结构化和非结构化数据中获取实体、实体关系和属性等细粒度金融知识元素,并构建相应的金融知识图谱来支持各类金融决策。Han等[33]采用命名实体识别、关系抽取和情感分析等技术来对新闻报道、社交媒体、财务报告和欺诈数据库等多源异构信息进行分析与挖掘,并通过构建目标实体的关系图谱和识别关于目标实体的情感倾向来辅助洗钱检测,从而有效地节省了洗钱检测30%左右的时间和成本;Burdick[34]在Hadoop、MapReduce等大数据平台和计算框架基础之上,构建了一个知识处理系统Midas,该系统针对美国证监会和联邦存款保险公司发布的结构化和非结构化数据源,利用知识抽取、知识链接和知识集成等技术,对金融机构、关键人员、贷款等实体及实体之间的关系等知识元素进行抽取、解析、映射和融合,从而为金融领域的系统性风险分析等决策分析过程提供了全面综合的语义视图。
4.3 面向金融事件知识库构建的知识获取
作为当前细粒度金融知识获取中的重要研究方向,金融事件知识库的构建主要利用知识抽取和数据挖掘等技术,从新闻报道、年报文本等非结构化文本中抽取出合并、收购、破产等金融领域的重大事件,从而形成金融领域的事件知识库。金融事件知识库构建的核心是金融领域重大事件的抽取,金融事件抽取任务包括事件类别的识别以及事件元素的识别[35]。事件类别的识别主要是根据事件触发词和相应的事件特征从文本中检测出事件句,并判断其所归属的类别;事件元素的识别主要是从众多命名实体、时间表达式和属性值中识别出真正的事件元素,并给予其准确的角色标注。事件抽取的方法主要包括基于模式匹配的方法和基于统计机器学习的方法。
罗明等[36]基于有限状态机驱动的层次化词汇-语义规则标注模式,从金融新闻文本中抽取出事件类别、参与人、时间、地点和交易金额等金融事件的语义要素信息,并且针对预先定义的26类金融事件达到了93.9%的微平均识别准确率;Liang等[37]构建了一个包含1200多家中国上市企业年报文本的语料库,并基于该语料库分析了企业年报文本中关于金融事件披露的特征和模式;汪奕丁[38]对金融事件与股市时序数据的关联关系进行了实证分析,并将股市时序特征用于金融事件类型的识别和热点金融事件的发现;Han等[39]利用词嵌入和语义词典对事件触发词进行扩展,并将触发词特征引入机器学习算法,以更好地从财经新闻中识别事件的类型。
4.4 面向其他金融知识库构建的知识获取
为了更好地实现个性化和智能化的金融知识服务,除了需要获取概念、实体和事件等细粒度金融知识来构建金融领域本体、金融知识图谱和金融事件知识库以外,还需要获取用户知识、案例知识和领域情感词等细粒度知识元素,来构建用户知识库、案例知识库和金融情感词典等多种知识库。其中,用户知识是实现个性化金融知识服务的重要基础,主要包括用户背景知识、用户需求等显性和隐性知识[40]。用户知识可以通过数据接口的形式从金融机构的信息系统中获取,也可以通过问卷调查、Web服务器日志挖掘等多种方式来识别和获取用户的各种特征和需求,从而构建用户知识库。金融案例知识主要包括金融机构和监管部门长期积累下来的投资案例、风险预警案例以及监管合规案例等,主要通过数据接口的形式从金融机构和监管部门的信息系统中获取。Musto等[41]利用包含用户特征和风险偏好等信息的用户知识库和金融投资组合案例库,采用基于案例的推理来实现投资组合的个性化和多样化推荐。
现代行为金融理论的研究表明,投资者在进行投资决策时,容易受到自身的情绪和心理等因素的影响和限制[42]。文本情感分析是信息处理领域中最为活跃的研究课题之一,其目的在于分析人们在定性文本信息中所表达的观点、情感和态度等[43]。文本情感分析的最 常用方法包括基于词典的方法和基于机器学习的方法。基于词典的文本情感分析方法具有简单直观、易于解释和易于使用等优点,已经被广泛应用于金融领域的文本分析中[44]。情感词典的选择是基于词典的情感分析方法中的关键,传统的通用情感词典包括大连理工大学情感词汇本体、哈佛 GI情感词典和 HowNet情感词典等。以往的研究通常使用通用情感词典来对金融领域的文本进行情感分析,但通用情感词典往往不适用于金融文本的情感分析。
Loughran和McDonald研究发现,哈佛情感词典中几乎有75%的负面情感词汇在金融文本中并没有负面的情感[45],例如,在企业年报中所频繁使用的税收、负债和折旧等词。他们针对通用词典在金融文本情感分析中的缺陷,构建了一个金融情感分析词典—LM情感词典,LM情感词典主要包括积极词汇、消极词汇、诉讼词汇、不确定性词汇、约束性词汇和模态词汇等六类情感词。研究者们还根据当前已有的情感词典和语料库来构建和扩展面向金融领域的情感词典。Tsai等[46]将LM词典中的情感词作为种子词,利用连续词袋(CBOW)模型从包含大量上市公司年报文本 的语料中获取和发现新的情感词;Oliveira等[47]基于统计方法从大量已标注的微博信息中获取金融情感词;胡家珩等[48]根据现有的中文情感词典以及构建的财经语料库,使用基于深度学习方法来获取面向金融领域的情感词。
5 规则性金融知识的获取
金融规则性知识的基本形式为 P→Q 或者IFPTHENQ,其中 P是前提,Q是一组结论或操作。当前的很多机器学习模型是缺乏透明性的黑箱,这些黑箱模型难以对输入和输出之间的交互提供易于理解的解释,这很容易引发决策者对算法和模型的不信任,出现这个问题的根源在于没有将决策知识进行显式化的获取并对其进行有效的表示。规则性知识的获取能够为决策者提供含有显式决策知识的规则,从而有效地提高决策支持系统决策逻辑的可理解性和透明性。管理决策者还可以利用他们的领域知识来验证规则知识的合理性以及对规则知识进行优化与改进,从而降低潜在的决策风险[49]。
对于规则性金融知识的获取,可以通过知识工程师与领域专家交流或者通过阅读文献资料来获取。例如,Rajput等[50]从反洗钱指南文件中获取可疑交易检测相关的专家规则知识。由于通过知识工程师手工获取金融规则知识的方式存在着效率低、成本高以及获取的规则知识主观性较强等问题,因此,部分研究者开始尝试使用决策树、关联规则等知识发现技术,从数据资源中自动抽取出金融规则知识。Tang等[51]利用C4.5决策树算法,从平衡数据集中抽取出用于财报欺诈检测的IF-THEN规则知识; Paranjape-Voditel等[52]利用关联规则算法挖掘股票间存在的规则知识来实现投资组合的推荐,从而更好地辅助股票市场交易者、个人投资者和基金经理的投资决策。
针对客观世界中存在的不精确、不完整、不一致以及不完备的知识,研究者们尝试将粗糙集、模糊集等不确定性数学理论应用于金融规则知识的获取中。Fasanghari等[53]通过问卷调查和模糊德尔菲法,从领域专家处获取关于证券投资组合推荐的规则知识;Chen等[54]利用粗糙集方法,从数据集中抽取出面向银行信用风险管理决策的规则知识。除此之外,部分研究者也尝试将遗传算法、粒子群算法等优化算法用于获取更优的金融规则知识。Kim等[55]将遗传算法用于优化粗糙集分析中的数据离散化和属性约简过程,从而能够从期货市场历史数据中抽取出更优的期货交易规则。
6 总结与展望
面对庞大繁杂和急剧膨胀的金融大数据,如何从中提取出对金融决策支持有价值的知识,形成面向金融决策支持的金融知识库,使之有序化地收敛于高效的金融知识服务,这对金融知识获取提出了巨大的挑战。国内外的研究者们针对投资决策、风险管理和金融监管等决策支持过程中各种具体的应用场景,利用分类、聚类、文本情感分析和文本主题分析等技术来自动获取粗粒度事实性金融知识。针对手工获取细粒度事实性金融知识和规则性金融知识效率低、人力与物力成本高的问题,近年来的研究尝试使用数据挖掘、信息抽取等技术来实现金融知识的半自动或自动获取。
结合国内外已有的研究成果来看,未来的研究应重点关注这几个方面:①大规模金融知识的高效获取与挖掘。面对多源异构的金融大数据,运用自然语言处理、深度机器学习和语义自动标注等技术,从海量的金融数据资源中高效地获取和挖掘大规模的金融知识是今后的重要研究方向。②多源金融知识的融合与集成。从来源广泛、质量不一的金融知识资源中获取的金融知识可能存在重复、语义不一致和语义关联不够明确等问题,今后的研究需要利用实体对齐、语义映射等技术将获取的多源金融知识进行融合与集成,从而形成同一框架规范下的金融知识库。③金融决策支持的个性化与智能化服务。通过金融知识获取所形成的各类金融知识库是面向金融决策支持的知识服务的前提和基础,未来的研究需要关注于如何根据决策者的特征和需求,运用知识检索、知识推理等技术对金融知识库进行运算,并以知识导航、知识检索和自动问答等形式为决策者提供个性化和智能化的金融知识服务。
作者简介
唐晓波,男,教授,博士生导师,研究方向为知识组织与情报研究。
谭明亮,男,博士研究生,研究方向为知识组织与商务智能, Email:tanml@whu.edu.cn。胡潇然,男,本科生,研究方向为金融数据分析。石文萱,女,博士研究生,研究方向为语义分析与商务智能。周巧,女,硕士研究生,研究方向为知识组织与情报研究。参考文献
*原文载于《信息资源管理学报》2020年第3期,欢迎个人转发,公众号转载请联系后台。
* 引用格式
唐晓波,谭明亮,胡潇然,等.面向金融决策支持的知识获取研究综述[J].信息资源管理学报,2020,10 (3):27-35.制版编辑 | 王小燕