查看原文
其他

深度学习在财务风险管理中的应用——预测高风险投资者(二)【学术前沿】

洪振瀚 智能财会联盟 2023-02-24

往期回顾:《深度学习在...预测高风险投资者(一)》


 3  绪论


如今价差套利交易的规模越来越大,伦敦股票交易所每年1.2万亿的交易额中40%与金融衍生品相关,这其中25%与价差交易相关。我们的研究集中在与差价零售合约(CFD)相关的价差交易形式上。在这个市场中,散户投资者和做市商签订一份与特定金融工具(如股票、商品或指数)有关的合同,在合同结束时,他们交换该金融工具的收盘价和开盘价之间的差价。因此,投资者根据金融工具的运动方向和幅度进行交易。例如,客户可能会在标准普尔500指数下一笔长期订单,每点10美元。如果标准普尔500指数上升一个特定的增量,客户赚取10美元乘以上升点数的利润,如果价格反向变动,那么他也会损失。做市商对可交易工具发出买入价和卖出价。与帮助客户与其他投资者进行交易的经纪人不同,做市商用自己的库存买卖金融工具。只要客户满足保证金要求,他们可以在任何时候开仓和平仓。做市商有义务接受这些指令,并面临逆向选择的风险。


对做市商来说,预测哪些交易者风险最大并决定在市场中对冲哪些风险非常重要。消息灵通的交易者可能会利用内部信息,给做市商留下不利的头寸。理论上,做市商在一笔交易中的潜在损失是无限的。例如,英国最大的零售金融服务提供商IG集团,由于风险控制不足和对冲策略不灵活,最近损失了3000万英镑。全球现货外汇市场最大的做市商FXCM也是由于类似的问题破产。


买入价和卖出价之间的价差是做市商收入的主要来源。对于流动市场,如标准普尔500指数或美元/英镑,利差交易市场的利差大于基础市场。然而,对于流动性较差的金融工具(如DAX或FTSE100指数),利差会低于基础市场提供的利差。当价差交易公司需要在基础市场进行大量交易以获得流动性较差的金融工具时,经常会遇到这种情况。如果做市商对一笔交易进行套期保值,无论套期保值是否必要,他们都将失去价差带来的潜在利润。做市商还面临对冲头寸的交易成本,包括佣金以及在某些市场对冲大额交易量时较高的价差。因此,设计一个预测分类模型来区分A类客户(即对做市商构成最大风险的客户)和B类客户(即风险较小的客户)至关重要。做市商将对A客户的头寸进行对冲,以防止损失,并承担B客户头寸的风险,以增加利润。通常,90%的总收入会来自B客户。


我们研究是否对交易进行套期保值。这个任务将转化为一个分类问题,我们通过开发一个DNN来预测高风险(A类)交易者来解决这个问题。如果DNN从观察到的交易行为中学习到有助于准确预测交易者未来成功的模式,它可以通过推荐对冲决策和加强日常操作中的风险管理来帮助做市商。图1给出了DNN的套期保值策略。



3.1、交易者分类与对冲战略


A类客户的定义非常主观,取决于做市商的商业策略。提供数据的公司想要保持匿名(我们将其称为STX),它是英国价差交易市场的一个大玩家。通过采访STX从事日常风险管理的前台交易员,我们发现如果客户在前20笔交易中获得了超过5%的回报,那么STX在研究时将会将该客户定义为高风险交易者,STX的策略是对冲这些客户的交易。


对冲策略的布置是动态的,STX会根据客户前20笔交易的表现来决定客户的状态(A类或者B类)。客户状态可能会因为一次交易而改变。因此,我们经常能够观察到STX吃下某客户的I交易,但选择对冲该客户的I+J交易。在投机市场中,交易者过去的交易表现与他未来的交易盈利能力可能并不相符。例如,一个熟练的交易者,遵循一致的策略,表现出很高的交易纪律,经常使用和更新止损限制等,他也可能会由于环境的随机性而经常亏损。同样地,一个糟糕的交易者,如果违反了以上所有原则,偶尔也会获利。这表明,交易者过去的表现并不一定是他们真实能力的可靠信号。因此,开发客户分类模型的目标是通过考虑数据中所有其他可用特征来生成一个更好的对冲决策信号。


我们开发一个DNN模型,可以从过去的交易数据中模拟潜在的交易者的性质。交易者能力这个目标概念是高度可变的,非常容易被干扰,并且很难为它预定义一个静态的交易者特征集。因此,对于DNN来说,从商业数据中提取目标概念的高级分布式表示非常重要,它能够捕捉导致交易行为变化的潜在生成因素。因此,成功的交易者分类将证明DL自动提取信息特征的能力。


3.2、交易行为预测与决策支持


特征学习在风险管理中的效果还不是很明显。信用评分、客户流失预测或交易者分类等应用程序都涉及对人类行为的预测。人们期望在行为预测模型中所能达到的最大精确度比在人脸检测等方面要低。例如预测目标定义会更加模糊(STX使用了5%的阈值,但这只是主观设定),还包括特征-目标关系通常很弱。我们的交易者行为预测研究旨在阐明特征学习和深度学习在决策支持中的潜力。


我们认为,预测任务是决策支持中一系列建模挑战的代表,因为它显示了在数据驱动预测模型的企业应用中经常出现的几个特征。更具体地说,我们面临着减少训练数据代表性的挑战。首先,交易者为了应对以前的得失和宏观环境的变化,他们的行为是可变、不稳定的和动态的。第二,关于个体交易者、资产价格和他们的基本原理以及更广泛的市场情绪指标(如经济增长)的详细的、按时间顺序的信息很容易获得,这导致了高维性。第三,变量之间相互关联并控制交易者利润的具体方式是复杂的、非线性的,而且可能会随着时间的推移而演变。自动特征提取如果成功,将是一个应对这些挑战的很有前途的方法。第四,价差交易模式显示出阶层不平衡,只有少数交易员成功地确保了5%以上的系统性正回报,而绝大多数客户都在赔钱。最后,有效的风险管理需要对单个交易者做出准确的预测。准确性是预测决策支持的必要要求。



 4  方法


DL在风险分析中的应用还很稀少。我们重新讨论了DL的原则,并详细说明了如何配置DNN来对价差交易者进行分类。

4.1、深度学习的原则

DL的目标是从数据中提炼不同层次的表示。更高的层次代表更抽象的概念。与传统的浅层ML方法相比,这种多层的深层体系结构及其学习分布式表示的能力有几个优势。

深层结构是ML变量之间的函数关系,它也代表了观测数据和预测目标之间的关系。它的高可变性使ML方法复杂化,并可能导致较差的泛化。高变异性的来源包括对决策模型所处环境的外部冲击。学习理论表明,为了表示函数关系,深度为k的学习比深度为k + 1的学习需要增加的计算单位是指数上升的(Montufar et al,2014)。常用的机器学习方法的深度如下(Bengio,2009):线性回归和逻辑回归(深度1);增强和叠加集合;决策树、一隐层人工神经网络、支持向量回系统(深度2);人脑的视觉系统(深度5-10)。

DL方法从数据中提取分布式表示。一个分布式表示的例子是主成分分析(PCA)。PCA根据特征向量对变化的贡献对数据集进行排序,从而使数据集向特征向量的方向重新定向。这种分布式表示中原始变量协作生成一个主成分。在预测性ML中,主成分可以替代原始变量。那么要学习的函数关系就是目标变量和主成分之间的函数关系。这可以简化学习任务,提高预测的准确性,推动所需的特征量减少。然而,ML方法学习的是局部的、非分布的表示。使用数据集中的原始变量,它们将输入空间划分为相互排斥的区域。例如,支持向量模型从彼此最接近的相邻类的局部训练例子中推断出一个决策边界。

ML的目标是对不属于训练集的新样本进行分类,但是训练数据可能缺乏代表性(例如由于环境的变化)。分布式表示能够更好地适应这一情况。以我们的交易者分类问题为例:交易者表现出不同的交易风格;他们使用不同的策略,遵循不同的止损规则等等。假设交易者被分成5个不同的群体,在同一个群体中的交易者拥有相同的交易风格。使用非分布式表示,我们需要5个不同的特征来单独表示每个集群,而分布式表示只需要三个特征(具体方法见原文)。通过使用三种分布式特征,这种表示还可以容纳一种新类型的交易者(例这名交易者可以使用另外一种新的交易策略)。这说明了分布式表示法的一个优点,即该表示法能够区分的模式数量随特征数量呈指数级增长。然而,对于非分布表示,这个数字最多是线性增长的。

4.2、构建深度神经网络

DL方法由具有多层非线性变换的多个分量组成。具有多个隐层的神经网络就是一个典型的例子。训练一个DNN需要解决一个非凸优化问题,由于消失梯度问题,这非常困难。梯度消失阻止了错误信息从网络的上层向下层传播,使得下层的连接权值无法适应。因此,优化往往会在较差的局部极小值处终止。该问题的补救措施包括无监督的预先训练、参数化整流器单元和批处理归一化等方法。我们利用这些技术开发了一个交易者分类DNN系统用于风险管理。下面,我们将介绍预训练方法,感兴趣的读者可以在原文在线附录中找到对其他概念的类似描述。

无监督的预训练:
预培训的目标是找到不变的、可生成的因素,这些因素可以解释数据中的变化,并放大这些变化,而这些变化对随后的辨别很重要。通过一系列非线性转换,预训练创建了不需要数据标签的固有特征检测器层。这避免了错误信息通过网络的多层传播,有助于克服梯度消失问题。叠加多层逐渐复杂的特征检测器,DNN可以初始化为合理的初始值。在发现数据中的结构关系之后,可以在预先训练过的网络上添加监督学习技术(例如逻辑回归),并使用反向传播来调优参数。在无监督的预培训中,目标标签的使用被推迟到微调阶段,这在管理决策支持中尤其有用,因为阶级不平衡是一个常见的问题。

两种经典的预训练方法是DBN和堆叠去噪自编码器(SdA),前者由受限玻尔兹曼机预训练,后者由自编码器预训练。这两种策略都最小化生成模型的对数似然值的近似值,因此,通常表现出相似的性能。再加上DBN已经在风险分析文献中得到了一些关注(见表1),故我们使用了堆叠去噪自动编码器的框架。

去噪自动编码器(dA)从输入样本中学习分布式表示(即“代码”)。假设我们有N个样本,每个样本有p个特征。接收到输入x后的学习过程包括五个步骤:

第一步:dA首先会对输入的x进行分解。
第二部:将分解的x编码映射到更高层次的表示中,形成y。
第三步:解码,高层次代码y被重新映射回与初始输入x有相同形式的重构z中。
第四步:训练,优化dA的参数。
第五步:叠加。训练了一个dA后,就可以把另一个dA进行叠加。各层以前馈方式组织。第二个dA将前一个dA的编码输出作为新的输入x。通过迭代,可以将多个dA堆叠在一起,从而构建堆叠去噪自动编码器(SdA)。每个dA的编码权值可以作为下一步网络的初始化处理。图2给出了dA的工作流程。


有监督的微调:
SdA可以通过前馈、分层的方式进行训练。为了使用网络进行预测,网络训练将与有监督微调一起继续,这能够告诉DNN哪些类型的交易行为可以识别A类客户。为此,我们在SdA之上添加了softmax回归。通过这种方式,我们使用原始输入的分布式表示作为特征解决了一个监督学习问题,并使用一个表示交易是否需要对冲的二进制指标变量作为目标。

使用丢弃正则化防止过度拟合:
DNN容易发生过拟合。为了避免强调训练数据特征样式的模型,我们的DNN在每个隐藏层后面都包含了一个dropout“丢弃”层。图3描述了dropout的概念。在训练过程中,将隐含层神经元及其对应的连接权值从DNN中去除。这是在一次迭代中对每一批训练样本执行的。这批样本产生的梯度也绕过了反向传播过程中被丢弃的神经元(关于DNN训练的详细解释,请参阅在线附录)。丢弃隐神经元的概率遵循给定丢弃率的伯努利分布。


DNN架构:
除上面介绍的几种方法外,我们还使用了其他几个DL概念来防止过拟合和简化网络训练过程,包括Xavier的初始化、批处理归一化层和使用ReLU作为激活函数。已有的DL工作已经详细阐述了这些概念并建立了它们的实用程序(Bengio,2016),我们在在线附录中详细介绍了它们。图4勾画了DNN的架构。

我们所采用的技术可在DL软件包中使用,它有助于定义DNN的拓扑结构,提供训练DNN的数值优化例程,并提供应用训练模型进行预测的功能。我们使用的Python库Theano是一个基于gpu的可扩展计算库。实验使用的gpu为Nvidia Tesla K20m, 2496核,5GB GDDR5高带宽内存。我们观察到,与使用传统cpu进行DNN训练相比,这种基础设施的速度提高了10-15倍(相当于将运行时间从一周多减少到1-2天)。值得注意的两点是(1)运行时间是由数据集的大小造成的。(2)训练复杂的ML模型可能同样昂贵。



内容转载自智能财会研究院

执笔人丨洪振瀚




      推荐阅读      

“智能财会联盟”共同发起单位邀请函


【学术前沿专题回顾】

(按住蓝色区域上下滑动可查看更多内容)


清华大学领衔,99 页报告揭秘人机交互的发展状况及未来发展趋势

2019中国企业数字化/智能化研究报告

人们对未来的不确定与对灾难的担忧在市场上的量化反映(一)

人们对未来的不确定与对灾难的担忧在市场上的量化反映(二)

人们对未来的不确定与对灾难的担忧在市场上的量化反映(三)

基于MD&A的支持向量回归(SVR)法在解释应计项目时的有效性检测(一)

基于MD&A的支持向量回归(SVR)法在解释应计项目时的有效性检测(二)

基于MD&A的支持向量回归(SVR)法在解释应计项目时的有效性检测(三)

基于文本分析的新行业划分方法(一)

基于文本分析的新行业划分方法(二)

当客户用上大数据,审计行业该如何应对(一)

当客户用上大数据,审计行业该如何应对(二)

当客户用上大数据,审计行业该如何应对(三)

会计与金融中的文本分析(一):研究背景,文本结构与可读性

会计与金融中的文本分析(二):几种典型的分析方法

会计与金融中的文本分析(三):文本相似度、实操、展望与总结

会计欺诈预测的AUC法与NDCG法

更高效的会计欺诈预测模型——集成学习与基于会计原始数据的回归模型预测会计欺诈行为

大数据时代对会计与审计标准的新要求

大数据审计:五大趋势与五大挑战

内部审计的新方法——流程挖掘(Process Mining)

当在线学习(online learning)遇上元学习(meta learning)

大共享助推中小企业恢复运营的应急管理研究

德勤全球机器人卓越中心调查:战略、架构和实践启示

AI驱动算法成功预警武汉肺炎,背后的支撑是哪些?

阿里达摩院发布2020十大科技趋势

AI人机交互趋势研究(2019)

新一代人工智能产业白皮书(2019 )





【人才&实务专题回顾】

(按住蓝色区域上下滑动可查看更多内容)


财务转型的路径

万科集团数字化转型:数字赋能 智能司库

务机器人案例专题(一)

财务机器人案例专题(二)
财务机器人案例专题(三)
国网青海电力构建智能化财务系统,助力疫情防控

加快企业数字化转型,中国核电财务共享中心的智能化升级之路

硬核:企业财务智能化转型实施路径--人大会计系主任张敏独家分享

各大高校纷纷开启智能财会专业建设与人才培养,智能财会浪潮已来

【浙江大学】新设学霸班--“智能财务班”!跨界培养,只为“最强大脑”

【中国人民大学】资产评估专业开设《智能财务共享与云计算》课程

【南京理工大学】面对信息技术新挑战,开启智能化改革新征程-南理工开展“智能会计”人才培养

【山东财经大学】山东财经大学“智能会计”诞生记

数智战“疫”,智能财务在行动--线上课堂专题

智能财务助力千亿级国企山东高速集团战疫情保复工

人工智能迎来重大机遇!三部委发文:扩大“双一流”高校人工智能研究生培养规模

180所高校新增人工智能专业,“人工智能+X”复合型人才未来有多稀缺?




【会议动态专题回顾】

(按住蓝色区域上下滑动可查看更多内容)


上海国家会计学院第二届智能财务高峰论坛成功举办上海国家会计学院刘勤:智能财务时代已来临 “人机共生”协作模式或将出现元年科技李彤:智能财务的关键在认知智能和生态协同


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存