深度学习在财务风险管理中的应用——预测高风险投资者（一）【学术前沿】

洪振瀚智能财会联盟 2023-02-24

在2020年《European Journal of Operational Research》上发表了一篇关于深度学习支持财务决策的文章《Can deep learning predict risky retail investors? A case study in fifinancial risk behavior forecasting》。来自柏林洪堡大学、南安普顿大学、伦敦大学的A.Kim等人进行了该项研究。

该文研究了深度学习如何支持财务风险管理决策。研究团队开发了一个深度学习模型来预测个体价差交易者是否能从未来交易中盈利。而这一任务是风险和行为预测建模曾经面临的典型挑战。传统的机器学习需要与目标相关的特征变量数据，这些特征变量都需要手工开发、维护和修订，而这些开发、维护和修订的成本通常很高。因此，想要对交易者行为这种具有高度不确定性与易变性的模式进行建模非常困难，而深度学习可以很好地解决这一问题，它可以自动学习数据的分层分布与表示，并且它能够自动生成特征变量(例如交易人员的盈利能力)，避免了由人工来生成特征，并且机器生成的特征在不同的条件下(例如动态市场条件)有着更好的适用性。这一研究的结果验证了深度学习的特征学习能力，为设计合适的网络架构提供了指导，并展示了深度学习相对于机器学习和传统方法的优越性。（以下来自：《Can deep learning predict risky retail investors? A case study in fifinancial risk behavior forecasting》）

1 绪论

本文应用最近开发的深度学习(DL)方法来预测价差交易市场中散户投资者的行为。做市商依靠对交易员未来成功的准确预测来管理金融风险。我们通过DL开发一个预测模型并确定基于模型的对冲策略的盈利能力，证明了DL生成的DL风格的特征可以推广到零售金融和决策支持中。

深度神经网络(DNN)以分层的方式运行。每一层都会接收来自前一层的输入，并且将输入数据特征化，再输出到后面一层到后续层。人脸识别就是这种方法的例证，为了在图像中检测人脸，首先DNN从原始像素中抽取低层次的概念，如线和边界。较深的层次将较低层次的输出泛化为更复杂的概念，如正方形和三角形，最终形成一个面。决策支持中的一个类似的例子是企业信用风险建模。破产预测模型根据会计变量(如总资产/总负债)的比率来估计违约概率。而在DL框架中，这样的比率是低级别的表示。使用资产负债表数据作为输入，DNN的低层可以关联报表变量并以数据驱动的方式计算信息比率。更高层次的数据表示可以包括财务比率的趋势或比率变量之间的相互依赖关系。具体的表示是自主计算的。不同复杂性表示的层次组合使DNN能够学习抽象概念，如拖欠借款人的概念。这种学习方法还能较为有效的提取训练数据中没有很好地在模型中表示的部分模式的能力，而机器学习(ML)模型很难做到这一点。DL方法在计算机视觉、语言处理等应用中取得了优异的效果。这一成功确立了基于DL的特征学习在依赖非结构化数据的程序中的有效性。

传统的ML可以应用于许多方面。营销模型可以支持客户商业周期的所有阶段，包括响应建模、交叉/升级销售(Chen,Fan，&Sun,2016)和客户流失预测(Verbeke, Dejaeger, Martens,Hur，&Baesens,2012)。金融机构使用ML预测金融市场发展(Oztekin, Kizilaslan,Freund，&Iseri,2016a)，预测企业借款人的偿付能力(du Jardin,2016)，或通知信贷审批决定(Lessmann,Baesens,Seow，& Thomas,2015)。这类应用程序依赖于结构化数据，如过去的客户交易、价格变化或贷款偿还情况。DL在非结构化数据处理方面的成功能否推广到结构化数据占主导地位的决策支持应用程序还不能确定。因此，本文的目标是检验DL在决策支持方面的有效性，检验其特征学习能力是否能推广到该领域中常见的结构化数据集，并为如何建立基于DL的决策支持模型提供指导。

我们要在财务风险管理的背景下达成我们的目标。利用价差交易市场的数据，我们预测了个体交易者的盈利能力。模型的目标是识别对做市商构成高风险的交易者，并建议套期保值政策，使做市商的利润最大化。交易员风险预测除了可以实际使用于价差交易公司，还代表了基于ML的决策支持中经常遇到的挑战。

第一个挑战是比例问题。发生借款人违约等不良事件的人只代表少数群体，这阻碍了ML的发展(Verbeke et al.，2012)。第二个挑战是在动态环境中出现的概念转移。ML模型从过去的数据中学习主题特征(例如客户以前的交易)和目标(例如交易员盈利能力)之间的函数关系。环境的变化使这种关系更加不稳定，也更难推断。维度是另一个建模挑战。企业数据仓库提供了关于建模主题(如交易员)的大量信息，在存在大量特性的情况下很难学习可归纳的模式(Hastie, Tibshirani，& Friedman,2009)。最后，ML的成功取决于信息特征的可用性。特征工程是由领域专家手动进行的。考虑到高昂的劳动力成本、缺乏熟练的分析师以及应对外部变化时，这些特征要通过手工修改，手工特征工程降低了ML的效率，并成为基于ML的决策支持的障碍。

这些挑战的共同点是它们降低了训练数据的代表性。ML作为一种数据驱动的方法非常依赖其数据的代表性，所以这些挑战会降低数据驱动的ML模型的有效性和效率。以我们的应用为例，DL的学习能力让其能够比手工建立特征更好地识别高风险交易者。特征-目标关系的泛化程度越高，对交易行为的外部变化的适应性也越好（例如由商业周期、市场状况、公司运营等变化引起的变化）。取代昂贵的人工特征工程也将提高基于模型的决策支持系统的效率。

考虑到深度数据挖掘克服决策支持中常见建模挑战的能力，本文做出了以下贡献。首先，它是第一批检验DL与结构化的、个人层次的行为客户数据结合的有效性的研究之一。在预测个体交易者的冒险行为时，我们关注的是零售金融，这是运算学的一个关键应用领域(Crook, Edelman，&Thomas,2007)，据我们所知，之前的DL研究没有考虑到这一点。实证结果证明DL方法的预测比ML方法更加准确。其次，我们展示了DL自动从操作数据中学习信息特征的能力。之前的研究已经证实了对非结构化数据的这种能力(LeCun et al.，2015)。我们将之前的结果扩展到客户的交易与行为数据。这一发现在管理上是有意义的，因为许多企业使用结构化数据来支持决策。第三，本文有助于金融风险承担预测实务，因为它提出了一种基于DNN的方法，以有效管理风险，并为投机金融市场的对冲决策提供信息。

我们在论文中使用的DL方法并不是什么新方法。然而DL及其组成概念(如分布式表示)很少在商业语言中被提及。理解DL概念可以帮助商业用户获益，使他们能够在知情的基础上与数据科学家和顾问进行交流。更好的理解还可能导致对正式的、数学模型的更多欣赏，并帮助克服组织惯性，众所周知这是对决策支持的阻碍(Hsinchun, Chiang， & Storey, 2012;Lilien, 2011)。在此背景下，本文的最后贡献是，通过证明DL的潜力，并为如何建立、培训和实施基于DNN的决策支持方法提供具体方案，提高了企业对DL的认识。为了实现这一点，我们详细阐述了数据挖掘的方法基础和我们设计的交易者风险分类决策模型。我们注意到，Kraus、Feuerriegel和Oztekin(2020)在最近的一篇相关论文中也独立地提出了类似的目标。

2 相关研究

关于DL的文献的数量正在快速增长。我们主要关注DL在金融领域的应用。表1分析了不同预测设置、基础数据和神经网络拓扑等不同维度上的对应研究。为了明确论文的选择，我们承认DL在金融领域除了预测还有其他应用，包括指数跟踪(Heaton, Polson，& Witte,2017)或在有限订单数据中进行状态动力学建模(Sirignano,2016)。DL还被应用于从文本数据生成财务预测(Kraus & Feuerriegel, 2017)。表1不包括这些研究，因为它们的关注点并不是预测，也不怎么考虑不同的数据来源。最后，人们可能会认为递归神经网络(RNN)在定义上就是DNN，因为递归单元表现出时间深度。随着DL的发展，门控神经网络如LSTM(长短期记忆)越来越受欢迎，通常被称为DNNs (Fischer & Krauss, 2018)。对于他们的前辈们来说，他们并不一定算是真正的DNNs，但他们中的一些已经被用于金融领域。表1分析了使用当代门控神经网络的研究，并忽略了早期类型的RNN。

表1：

表1显示，大多数(约60%)之前的研究都预测了金融市场的发展，如价格变动(Deng, Bao, Kong, Ren，& Dai,2017)，波动(Xiong, Nichols，& Shen,2016)或市场崩溃。风险分析中的应用也很受欢迎，比如财务困境预测(Addo, Guegan，&Hassani,2018)或信用评分(Sirignano, Sadhwani，&Giesecke, 2016)。当我们对比预测的目的时，第二和第三栏显示，以往的研究没有考虑到预测人类行为，这是本文的重点。

输入数据的类型是之前大多数研究与本文的第二个不同之处。预测金融市场价格的DNNs通常会使用滞后价格作为输入。例如，Deng等人(2017)和Fischer和Krauss(2018)使用每日的价格回报作为输入。相比之下，我们面临的风险建模任务是由不同类型预测变量组成的动态回归问题(见5.1节)。从表1中的特征列可以看出，以前很少有研究将数值输入变量和离散输入变量混合使用。

DNNs的一个核心特征是从输入数据中自动提取预测特征的能力(Montufar, Pascanu, Cho，& Bengio,2014)。本文的一个目标是在风险管理环境下确认特征学习能力。输入数据类型的实质性差异对特征学习有影响。在时间序列中观察到的结果推广到具有不同输入变量的动态回归中并不明显。关于风险管理，我们从表1的列利润模拟中观察到，大多数以前的工作没有检查基于DL的风险管理方法的经济影响。

除了应用和输入数据之外，之前大多数工作和本研究之间的第三个区别与DNN的架构有关。表1在最右边的三列中描绘了以前网络的拓扑。鉴于我们关注的是预测研究，每个网络都包含一个监督学习机制，这意味着网络中的权重通过最小化训练数据集的经验损失来进行训练(Bengio, Goodfellow，& Courville, 2016)。这通常是通过完全连接的输出层来实现的。这一层只需要一个具有线性或softmax激活函数的单元来分别解决回归和分类问题。从表1可以看出，纯监督学习网络在之前的研究中占优势。从这一现象我们得出结论，对具有监督层和非监督层网络进行更多的研究是可取的。

总共有九项无监督学习的研究考虑了预先训练。大多数都使用一个深度网络进行预先训练。早在预训练普及之前，一项开创性研究提出了用于无监督时间序列模式提取的自组织映射(Giles, Lawrence，& Tsoi,2001)。堆叠去噪自动编码器(SdA)是我们使用的特征学习方法，它很少受到关注，而本文第一个给出了它们在风险分析中的有效性的证据。

总之，我们对已有文献的贡献来自于我们对预测项目，数据输入等一系列模型特征的综合，以及我们使用最先进的方法来设计与评估基于DL的预测模型。与我们的工作最相关的研究是(Sirignano et al.，2016)。作者的DNN预测数据集包括超过35亿的月贷款观测和272个有关贷款特征和地方经济因素的变量，以支持投资组合管理。为此，Sirignano等人(2016)建立了单个贷款在不同延迟支付状态之间的转换概率模型，范围从当前不同的延迟付款状态到丧失抵押品赎回权。我们的研究与Sirignano等人(2016)的研究的主要不同在应用和DL方法方面。

Sirignano等人的DL模型包括多达7层的前馈网络(及其集成)。深度前馈网络是之前工作中广泛使用的三层网络的一般化(Oztekin, Kizilaslan, Freund， & Iseri, 2016b)。而我们提出的DNN架构是不同的，它使用多层不同类型的单元，依靠无监督的预训练来提取预测特征。预先训练的要素具有独特的优势，并且在金融领域被发现非常有效(Heaton et al.，2017)。因此，我们进一步推进了(Sirignano et al.，2016)的方法。

抵押贷款风险建模(Sirignano et al.，2016)和信用评分总体上与交易者风险预测有很大差异。信用产品可以被认为是看跌期权。贷方有权给予信贷，但并非一定要这样。信用也可以由抵押品担保，最重要的是，它可以在对冲风险的同时还能从佣金中获利。但在价差交易环境中下，做市商必须接受客户的指令。这些指令类似于任意执行日期的期货合约。不像在信贷行业，客户是有信用额度的，在利差交易市场，知情的交易者或内部人士可以从做市商那获得无限的利润。与此同时，做市商需要非常有选择性地对冲风险，因为对冲会迅速将收入降至零。因此，我们的预测任务就是识别那些对做市商构成重大风险的交易者。

内容转载自智能财会研究院

执笔人丨洪振瀚

推荐阅读

“智能财会联盟”共同发起单位邀请函

【学术前沿专题回顾】

（按住蓝色区域上下滑动可查看更多内容）

清华大学领衔，99 页报告揭秘人机交互的发展状况及未来发展趋势

2019中国企业数字化/智能化研究报告

人们对未来的不确定与对灾难的担忧在市场上的量化反映（一）

人们对未来的不确定与对灾难的担忧在市场上的量化反映（二）

人们对未来的不确定与对灾难的担忧在市场上的量化反映（三）

基于MD&A的支持向量回归（SVR）法在解释应计项目时的有效性检测（一）