查看原文
其他

最全: 深度学习在经济金融管理领域的应用现状汇总与前沿瞻望, 中青年学者不能不关注!

计量经济圈 计量经济圈 2021-10-23

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于机器学习在计量分析中的应用,各位学者可以参阅如下文章:1.Python中的计量回归模块及所有模块概览2.空间计量软件代码资源集锦(Matlab/R/Python/SAS/Stata), 不再因空间效应而感到孤独3.回归、分类与聚类:三大方向剖解机器学习算法的优缺点(附Python和R实现)4.机器学习第一书, 数据挖掘, 推理和预测5.从线性回归到机器学习, 一张图帮你文献综述6.11种与机器学习相关的多元变量分析方法汇总7.机器学习和大数据计量经济学, 你必须阅读一下这篇8.机器学习与Econometrics的书籍推荐, 值得拥有的经典9.机器学习在微观计量的应用最新趋势: 大数据和因果推断10.机器学习在微观计量的应用最新趋势: 回归模型11.机器学习对计量经济学的影响, AEA年会独家报道12.机器学习,可异于数理统计13.Python, Stata, R软件史上最全快捷键合辑!,14.Python与Stata, R, SAS, SQL在数据处理上的比较, 含code及细致讲解15.Python做因果推断的方法示例, 解读与code16.文本分析的步骤, 工具, 途径和可视化如何做?17.文本大数据分析在经济学和金融学中的应用, 最全文献综述18.文本函数和正则表达式, 文本分析事无巨细

前面,我们引荐了机器学习方法出现在AER, JPE, QJE等顶刊上了!”,前沿: 机器学习在金融和能源经济领域的应用分类总结,③Lasso, 岭回归, 弹性网估计在软件中的实现流程和示例解读”,④回归方法深度剖析(OLS, RIDGE, ENET, LASSO, SCAD, MCP, QR),⑤高维回归方法: Ridge, Lasso, Elastic Net用了吗,⑥Lasso回归操作指南, 数据, 程序和解读都有,⑦七种常用回归技术,如何正确选择回归模型?,⑧共线性、过度/不能识别问题的Solutions,⑨计量经济学与实验经济学的若干新近发展及展望,⑩计量经济学新进展,供参考等,在学术同行间引起巨大反响。

机器学习方法逐渐在经济管理等社科类顶刊,如AER,JPE,QJE,JOF等期刊上出现了。为了进一步了解机器学习在国外最新应用动向,我们为各位学者奉上“深度学习在金融领域的现状汇总与前沿瞻望”。对机器学习方法感兴趣的学者,建议认真研读这篇非常重要、全面的文章。
正文
关于下方文字内容,作者:陈庆冲,东北财经大学金融工程,通信邮箱:yukichen1213@163.com

《深度学习在金融领域的现状汇总与前沿瞻望》

Deep Learning for Financial Applications : A Survey

引言

机器学习(Machine Learning,ML)发展至今,已在金融领域发光发热。而深度学习(Deep Learning,DL)由于其优越的表现,现阶段受到广泛关注,金融领域正是深度学习的新兴领域,且处于活跃状态。这篇文章除了对深度学习的算法原理进行介绍外,主要关注以下几个问题:1.深度学习在金融领域的应用包括哪些?2.目前在各领域的研究进度如何?3.还有哪些有潜力的应用领域?4.哪一种深度学习模型更被青睐?5.深度学习与机器学习相比,哪一个更适合用作研究?6.深度学习的未来方向是什么?

深度学习算法介绍

深度学习(DL)是一种特殊类型的机器学习(ML),它由多层神经网络复合而成,属于复杂度较高的模型。我们对将介绍其中改的七种分支:深层感知器(Deep Multilayer Perceptron,DMLP)、卷积神经网络(Convolutional Neural Networks, CNN)、循环神经网络(Recurrent Neural Network, RNN)、长短期记忆网络(Long Short-Term Memory, LSTM)、限制玻尔兹曼机(Restricted Boltzmann Machines, RBMs)、深度信念网络(Deep Belief Networks, DBNs)、自编码器(Autoencoders, AEs)。
  1. 多层感知机(DMLP)

深层感知器与多层感知器(MLP)类似,由输入层、隐含层和输出层组成,但层数较多。对于每层的神经元,都有对应的输入项x、权重w和偏差b。神经网络中的一个神经元输出如式(1):
(1)
此外,每个神经元都有一个非线性激活函数,该函数通过对前一层神经元的输出加权求和产生该层神经元的输出。常用激活函数包括:Sigmoid函数、双曲正切函数(hyperbolic tangent)、Relu函数(Rectified Linear Unit)、Leaky Relu函数、Swish函数和Softmax函数。
深层感知器与多层感知器相比,具有更好的分类和回归性能。深层感知器的学习过程通过反向传播实现,输出层神经元的输出误差会反映到前一层神经元上,并对其进行修正,而随机梯度下降法(SGD)是最常用的更新权重的方法。
  1. 卷积神经网络(CNNs)

卷积神经网络(CNN)是一种深度神经网络(DNN),主要在图像分类及识别领域运用。整个图像由1x1、3x3、5x5等尺寸的过滤器扫描,并由不同类型的层形成架构:输入层、卷积层、池化层(平均值或最大值)、全连接层与输出层,是一种常用的前馈型神经网络。
  1. 神经网络(RNN)

递归神经网络处理的数据规格较为特殊,常限定于序列数据:如时间序列、音频和语音数据、文字等,常被用于手写文字识别、语音识别等。
与前馈型网络不同,递归神经网络使用内部存储器对输入进行处理。存在不同类型的递归神经网络结构,如一对一、多对一与多对多。RNN对每个输入进行处理,隐含层中的神经元将输入项的历史信息包含在“状态向量”(state vector)里。训练方法常使用时间反向传播法(BPTT),原理为:t时刻损失函数的微分反映了前一时刻的权值。但该类神经网络的训练比前馈神经网络更困难,且周期较长。
  1. 长短时记忆网络(LSTM)

长短时记忆网络是处理序列数据的深度学习算法。优势在于可以对网络中的短期值与长期值同时进行记忆,因此广泛使用于语音识别、语音翻译、手写字符识别、时间序列数据预测等领域。LSTM网络由LSTM神经元组成,LSTM神经元又由三扇门构成:遗忘门(forget gate)、输入门(input gate)、输出门(output gate)。这三扇门对信息流进行控制。通过这些结构特征,每个神经元可以在任意的时间间隔内记住所需的值,若干个LSTM神经元又组成了神经网络层。
  1. 限制玻尔兹曼机(RBMs)

RBM可以对输入集的概率分布进行学习,主要用于降维、分类和特征学习。RBM是一个两层(可见层与隐含层,两层间不连接)的二部无向图模型,每层的神经元互不连接。每个神经元都具有对输入进行计算的能力,并随机决策是否执行计算。在计算时,输入值使用特定的权重加权,再添加特定的偏差,并通过激活函数传递计算值。随后,在重构阶段,输出的结果作为输入重新进入网络,再作为输出从可见层退出,最后比较前一个输入的值和处理后的值。RBM的缺点是训练过程较为复杂,尽管有对于对数似然梯度进行估计的好方法,但对于对数似然本身的估计并不容易。
  1. 深度信念网络(DBNs)

DBN由一组RBM层组成,由潜在变量组成的概率生成模型。DBNs用于使用非监督方法在输入集中寻找独立特征。DBM可以在训练过程中学习以概率方式重构输入集。随后,网络中的各层开始检测鉴别特征,在学习过程完成后,对分类进行监督学习。
  1. 自编码器(AEs)

自编码器常用于特征提取和降维,通过重新对输入进行映射,是输入更能对分类起到作用,换而言之,该算法在执行一个无监督的特征学习过程。AEs包含编码器和解码器两部分,结构与前馈型神经网络相似,由输入层、输出层和一个(多个)隐含层组成,且输入层和输出层所包含神经元个数相同,呈对称状态。特征提取与降维后会损失掉原有的数据内部关系等信息,是AEs的一个缺陷。
  1. 其他模型

DL模型除了包括上述7个模型外,较常用的还有深度强化学习(Deep Reinforcement Learning, DRL)、生成式对抗网络(Generative Adversarial Networks, GANs)、胶囊网络(Capsule Networks, Deep Gaussian Processes, DGPs)。但除了DRL外,其他两个模型暂未被学者们投入金融的研究中,但仍可以对其潜力进行期待。

DL在金融领域中的应用

在已有的文献中,深度学习与金融领域的结合较多。与此同时,还有很多领域未被充分挖掘,目前已有的研究领域可分为以下几类:
  1. 算法交易(Algorithmic Trading)

算法交易是仅由算法模型,不通过人类的决策做出的买入与抛售决定。这些决策不仅可以基于简单的线性规则与数学模型,也可以使用ML/DL来对交易策略进行优化。随着网上交易平台的引入,算法交易在过去20年几乎接管了金融行业,而基于深度学习的algo(algorand)交易模型开始受到大量关注。
Algo-trading应用程序通常与价格预测模型进行结合,对市场的时机进行迅速选择,其本质在于对买卖信号的价格/趋势进行预测;也可以通过优化交易参数(包含买卖价差、
订单簿分析、头寸规模),来关注交易本身的动态。高频交易(HFT)的研究人员对深度学习的应用十分感兴趣,并运用于高频交易研究中。
本文将学者们对基于DL模型的Algo-trading 研究的过去与现状进行了梳理,主要分为3个板块:1嵌入时间序列预测模型的算法交易2基于分类(买卖信号、趋势预测)的算法交易模型3其他的独立研究或算法交易模型(配对交易、套利等)。
1.1 时间序列预测与算法交易
大多数的算法交易研究都集中在对股票或指数价格的预测上,而长短时记忆网络(LSTM)是其中最受欢迎的模型。而LSTM常常与其他算法进行结合使用,包括且不限于小波变换WT(Wei et al.,2017)、卷积神经网络CNN(Liu et al.,2017)等。除了LSTM外,对于股票价格预测的模型各有千秋,Zhang et al.(2017)提出了可处理多种频率交易的股票价格预测模型SFM;Deng et al.(2017)使用了FDDR模型,可以预测股价和生成交易信号。此外,学者们选取了不同国家的股票数据,增强了深度学习模型的泛用性,其中包括希腊、新加坡、中国等地。与此同时,以比特币为首的加密货币的交易也受到学者们的广泛关注,汇总表格如表1所示:
表 1 嵌入时间序列预测模型的算法交易
注:以下表格都可以往右滑动,这样就能看全所有表格内容。
编号数据集时间段特征集算法性能指标运行环境
1土耳其担保银行2016OCHLV、价差、波动性、换手率等PLR、Graves改进的LSTMMSE、RMSE、MAE、RSE、相关系数和R2Spark
2沪深300、印度Nifty50、恒生指数(HSI)、日经225、标普500、道琼斯指数2010-2016OCHLV、技术指标WT、Stacked autoencoders、LSTMMAPE、相关系数、THEILU-
3中国股市2007-2017OCHLVCNN+LSTM年化收益率、最大回撤Python
4纽交所50个股票2007-2016价格数据SFMMSE-
5芬兰股市5只股票的市值2010要价/报价、成交量WMTR、MDA准确率、精确率、召回率、F1分数-
6300支深交所股票2014-2015价格数据FDDR、DNN+RL利润、回报、SRKeras
7标普500指数1989-2005价格数据、成交量LSTM回报、STD、SR、准确率Python、TensorFlow、Keras、R、H2O
8希腊银行股票(ETE)2009-2014FTSE100、道琼斯指数、GDAX交易所、日经225、欧元美元汇率、黄金GASVR、LSTM回报、波动性、SR、准确率TensorFlow
9中国IF-IH-IC股指期货2016-2017价格变动MODRL+LSTM收益与亏损、SR-
10新加坡股市指数2010-2017过去十天指数的OCHLDNNRMSE、MAPE、利润、SR-
11英镑/美元2017价格数据RL+LSTM+NESSR、下偏比、总利润Python、Keras、TensorFlow
12商品、外汇期货、ETF1991-2014价格数据DNNSR、CP值、回报C++、Python
13美元/英镑、标普500、英国富时100(FTSE100)、石油、黄金2016价格数据AE+CNNSR、波动性、平均回报/交易量、回报率H2O
14比特币(Bitcoin)、达世币(Dash)、瑞波币(Ripple)、门罗币(Monero)、莱特币(Litecoin)、狗币(Dogecoin)、未来币(Nxt)、域名币(Namecoin)2014-2017移动平均线(MA)、布林线(BOLL)、CRIX回报、欧洲银行同业拆借利率、OCHLVLSTM、RNN、MLP准确率、F1分数Python、TensorFlow
15标普500、韩国KOSPI指数、恒生指数和欧洲斯托克50指数1987-2017200天股票价格深度Q-Learning、DNN总利润、相关性-
16标普500包含的股票1990-2015价格数据DNN、GBT、RF平均回报、MDD、Calmar比率H2O
17基础数据、技术数据与经济数据-基础、技术和市场信息CNN--
注:
1.特征集:OCHLV表示开盘价(Open)、收盘价(Close)、最高价(High)、最低价(Low)、成交量(Volume),OCHL同理。
2.算法:PLR(Piecewise Linear Representation):分段线性表示;WT(Wavelet Transforms):小波变换;SFM(State Frequency Memory):状态频率存储器;WMTR(Weighted Multichannel Time-series Regression):加权多通道时间序列回归;MDA(Multilinear Discriminant Analysis):多线性判别分析;FDDR(Fuzzy Deep Direct Reinforcement Learning):模糊深层直接强化学习;RL(Reinforcement Learning):强化学习;GASVR(GA with a SVR):遗传算法+支持向量回归机;MODRL(Multi-objective Deep Reinforcement Learning):多目标深层强化学习;NES(Natural Language Processing):自然进化策略;DNN(Deep Neural Network):深度神经网络;RF(Random Forest):随机森林;GBT(Gradient Boosted Trees):梯度提升树
3.性能指标:MSE(Mean Squared Error):均方误差;RMSE(Root Mean Square Error):标准误差;MAE(Mean Absolute Error):平均绝对误差;RSE(Relative Squared Error):相对平方误差;STD(Standard Deviation):标准差;SR(Sharpe-ratio):夏普比率;MDD(Maximum Drawdown):最大浮动亏损
1.2 分类与算法交易
除了上述算法交易外,启发式算法与深度学习算法的结合也被学者们进行开发,并多用于股票的技术层面分析,Sezer et al.(2017)采用遗传算法(GA)对技术指标进行优化,并用作提高预测的精度;此外,MACD也被用来预测股票的价格走势(Troiano et al.,2018)。除股票价格预测外,分类算法也是深度学习与算法交易结合的一个重要领域。如,由于CNN在图像分类问题上运用广泛,其被用来将财务输入数据转换为图像(Gudelek et al.,2017)。除了对图像的转换外,Sezer et al.(2019)将条形图图像作为CNN的输入,并预测了图像中的点未来会买进、持有还是卖出,并开发了相应的算法交易模型。表2对算法交易中的分类算法进行了汇总:
表 2 基于分类的算法交易模型
编号数据集时间段特征集算法性能指标运行环境
1道琼斯30指数中的股票1997-2017RSI遗传算法修参的DMLP年化收益率Spark MLlib、Java
2标普500ETF,十只来自标普500的股票2014-2016价格数据FFNN累计收益MatConvNet、Matlab
3道琼斯30股票2012-2016收盘价和若干个技术指标LSTM准确率Python、Keras、Tensorflow、TALIB
4所有高频交易记录2014-2017价格数据,订单与交易LSTM准确率-
5纳斯达克交易所2010LOB中的价格与交易量LSTM精确率、召回率、F1分数、kappa系数-
617个ETF2000-2016价格数据,技术指标CNN准确率、MSE、利润、AUROCKeras、Tensorflow
7道琼斯30股票和9个最大交易量的ETF1997-2017价格数据,技术指标CNN+图像特征召回率、精确率、F1分数、年化收益率Python、TensorFlow、Keras、Java
8英国富时1002000-2017价格数据CAETR、SR、MDD、平均回报-
9纳斯达克交易所2010价格,交易量,10个LOB中的订单CNN精确率、召回率、F1分数、kappa系数Theano、Scikitlearn、Python
10土耳其Borsa Istanbul 100指数中的股票2011-201575项技术指标与OCHLVCNN准确率Keras
11ETF和道琼斯30指数1997-2007价格数据CNN+图像特征年化收益率Keras、Tensorflow
128项债券/衍生品市场中的实验资产-资产价格数据RL、DNN、遗传算法学习误差与遗传算法误差-
1310只来自标普500的股票-股票价格TDNN、RNN、PNN遗失率、虚警率-
14伦交所2007-2008订单簿、交易、买/卖订单,删除订单CNN准确率、kappa系数Caffe
15加密货币,比特币2014-2017价格数据CNN、RNN、LSTM累计投资组合价值、MDD、SR-
注:
1.特征集:RSI(Relative Strength Index):相对强弱指数;LOB(Limit Order Book Data):订单簿
2.算法:FFNN(Feedforward Neural Network):前向反馈神经网络;CAE(Convolutional Autoencoder):卷积自编码器;TDNN(Timedelay Neural Network):时延神经网络;PNN(Probabilistic Neural Network):概率神经网络
3.性能指标:AUROC(Area Under the Receiver Operating Characteristics):接收机的工作面积;TR(Total Return):总回报
1.3 算法交易的其他领域模型
除了股票的价格预测外,看涨期权和看跌期权的价格预测也受到了学者的关注(Tino et al.,2001)。对于文本数据的挖掘也有助于算法交易,Bari et al.(2018)利用文本挖掘从金融新闻中提取信息,并利用LSTM、RNN、GRU三种算法生成交易信号。表3介绍了其他领域的汇总:
表 3 其他算法交易模型
编号数据集时间段特征集算法性能指标运行环境
1德国DAX、英国富时100指数、看涨/看跌期权1991-1998价格数据马尔科夫模型、RNN日利润的均值和标准差-
2台湾股指期货、迷你股指期货2012-2014图像中的价格数据可视化方法+CNN累计利润、准确率-
3标普500中的能源部门/核心公司2015-2016文本与价格数据LSTM、RNN、GRU回报、夏普比率、精确率、召回率、准确率Python、Tweepy API
4芝商所信息2016订单簿、时间戳、价格数据RNN精确率、召回率、F1分数Python、TensorFlow、R
5台湾股指期货(TAIFEX)2017价格数据RL+CNN预处理准确率-
6标普500中的股票2010-2016OCHLVDCNLPCC、DTW、VWLPytorch
7来自今日新闻网、苹果日报、自由时报、理财网中的关于18只股票的新闻2013-2014文本、观点DNN回报Python、Tensorflow
8来自标普500的和纳斯达克100的489只股票2014-2015订单簿空间神经网络交叉熵误差NVIDIA’s cuDNN
9实验数据集-价格数据由CNN、LSTM、GRU和MLP组成的深度强化学习平均利润Python
注:
1.算法:GRU(Gated-Recurrent Unit):门控循环单元;DCNL(Deep Co-investment Network Learning):参与投资的深度学习网络
2.性能指标:PCC(Pearson’s Correlation Coefficient):皮尔森相关系数;DTW(Dynamic Time Warping):动态时间规整;VWL(WL Kernel-based Method):核函数方法
  1. 风险评估(Risk Assessment)

深度学习研究还作用于风险评估领域,它对于给定资产、公司、个人、产品与银行等的风险进行识别与评估。细分方向包括:破产预测、信用评分、贷款/保险承保、债券评级、贷款申请、消费信贷确定、企业信用评级、抵押贷款选择、财务困境预测等,在这些领域中,风险状况的识别至关重要。若未进行合适的风险评估,后果严重性不可想象:如2008年房地产泡沫的破裂就是一个较为有代表的例子。
信用风险评估大多集中在1信用评分和银行困境分类,也有部分论文研究2抵押贷款违约的可能性、风险交易检测与危机预测。
2.1 信用评分与困境
信用评级一直是一个热门话题,由于其所涉及维度较多,且主观性较强,目前常出现于各大数据竞赛中(Kaggle、天池等)。深度学习在此方面表现良好,Yu et al.(2018)采用DBN+SVM,将预测准确率达到了80-90%。除了对评级得分这种连续型数值外,信用风险分类的运用也较为广泛,如Neagoe et al.(2018)利用DMLP和深度CNN对信用评分进行分类,详情如表4所示:
表 4 信用评分与困境分类
编号数据集时间段特征集算法性能指标运行环境
1信用违约掉期2016回收率、传播路径、部门和地区DBN+RBMAUROC、FN、FP、准确率WEKA
2德国、日本信贷数据集-个人金融变量SVM+DBN加权准确率、TP、TN-
3来自Kaggle平台的信贷数据-个人金融变量DNN准确率、TP、TN、G-mean指标-
4澳大利亚、德国信贷数据-个人金融变量GP+AE优化DNNFPPython、Scikitlearn
5澳大利亚、德国信贷数据-个人金融变量DCNN、MLP准确率、虚警、漏警-
6来自中国金融公司的消费者信贷数据-使用Relief算法选择50个最重要的维度CNN+ ReliefAUROC、K统计量、准确率Keras
7来自UCI 机器学习repo的信贷数据集-UCI信贷数据集双曲正切函数、maxout函数、Rectifier函数-AWS、EC2、H2O、R
注:
1.性能指标:FN(False Negative):假阴性;FP(False Positive):假阳性;TN(True Negative):真阴性;TP(True Positive):真阳性
2.2 财务困境预测
银行和企业的财务困境预测,一直是比较难以解决的问题,而深度学习的出现对此问题产生了一定的攻克。Lanbouri and Achchab(2015)将DBN与SVM混合,用于财务困境预测,取得了较高的准确率;Ronnqvist and Sarlin(2015)对文字信息进行提取,并根据语意向量表示银行压力,对阈值进行分类,识别银行的财务困境,更多类似研究如表5所示:
表 5 财务困境、破产、银行风险、组合风险与危机预测研究
编号数据集时间段特征集算法性能指标运行环境
1966家法国公司-财务比率RBM+SVM精确率、召回率-
2883家来自EDGAR的银行持股公司2006-2017代币、加权情感极性、杠杆率和ROACNN、LSTM、SVM、RF准确率、精确率、召回率、F1分数Keras、Python、Scikitlearn
3大型欧洲银行的事件数据集、路透社的新闻文章2007-2014单词与句子DNN+NLP预处理相对实用性、F1分数-
4欧洲银行的事件数据集、路透社的新闻2007-2014文本与句子句子向量+DFFN实用性、F1分数、AUROC-
5路透社的新闻、财务数据2007-2014财务指标和新闻文本doc2vec+NN相对实用性Doc2vec
6宏微观经济变量、来自银行持股公司的银行特征/绩效变量1976-2017宏观经济变量和银行绩效CGAN、MVN、MV-t、LSTM、VAR、FE-QARRMSE、对数似然值、贷款损失率-
7法国公司的财务报表2002-2006财务比率DBN召回率、精确率、F1分数、FP、FN-
8来自证券价格研究中心的美国上市公司股票回报2001-2011价格数据DBN准确率Python、Theano
9几个来自日本股票市场的公司财务报表2002-2016财务比率CNNF1分数、AUROC-
10包含当地和全国经济因素的投资组合数据集1995-2014与特征有关的投资组合ANN负对数似然值AWS
11来自挪威金融集团的投资组合数据、挪威银行2012-2016个人财务变量CNN准确率、敏感性、特异性、AUROC-
12私人经纪公司的真实风险交易数据-订单详情等250个特征CNN、LSTMF1分数Keras、Tensorflow
13由几个数据集拼合而成1996-2017指数数据、10年期债券收益率、汇率Logit、CART、RF、SVM、NN、XGBoost、DNNAUROC、KS、G-mean值、似然比率、DP、BA、WBAR
注:
1.特征集:ROA(Return on Assets):总资产回报率
2.算法:NLP(Natural Language Processing):自然语言处理;DFNN(Deep Feedforward Neural Network):深层前馈网络;NN(Neural Network):神经网络;CGAN(Conditional GAN):有条件的GAN;GAN(Generative Adversarial Networks):生成式对抗网络;MVN(Multivariate Normal Distribution):多元高斯分布;MV-t(Multivariate t Distribution):多元t分布;VAR(Vector Auto Regression):向量自相关;FE-QAR(Fixed Effects Quantile VAR):基于VAR的固定效应分位数回归;CART(Classification and Regression Trees):分类树和回归树;XGBoost(eXtreme Grandient Boosting):XGBoost算法
3.性能指标:KS(Kolmogorov-Smirnov):KS检验形成的指标;DP(Discriminant Power):判别力;BA(Balanced Accuracy):平衡精度;WBA(Weighted Balanced Accuracy):加权平衡精度
  1. 欺诈预测(Fraud Detection)

随着金融中介规模的不断扩大,金融欺诈如今成为各国政府和当局拼命寻求解决办法的领域之一。信用卡诈骗、洗钱、消费信贷诈骗、偷税漏税、银行诈骗等金融诈骗案件层出不穷。这类研究大多是异常检测,通常划分为分类问题。Roy et al.(2018)使用LSTM模型进行信用卡欺诈检测,Wang et al.(2018)利用LSTM从信用卡交易序列中检测出信用卡诈骗,并用精度与其他算法进行了比较,研究如表6所示:
表 6 反欺诈研究
编号数据集时间段特征集算法性能指标运行环境
1印度尼西亚一家当地银行的借机卡交易记录2016-2017在若干时间段中的交易量CNN、叠加LSTM、CNN-LSTMAUROC-
2来自零售银行的信用卡交易2017交易变量和几个衍生特征LSTM、GRU准确率Keras
3银行卡的消费记录2014-2015每个国家目前/起始的欺诈概率、其他欺诈相关特征ANNAUROC-
4欧洲持卡人的信用卡交易记录2013对个人财务变量进行PCAANN、RF召回率、精确率、准确率-
5信用卡交易记录2015交易特征与银行特征LSTMAUROCKeras、Scikitlearn
6巴西联邦税收秘书处对外贸易数据库2014出口贸易、税、交易、员工、发票等8个特征AEMSEH2O、R
7众议院公开数据、来自巴西联邦税收秘书处的公司数据2009-2017巴西国家开支、当事人、支出类别等21个特征深度自编码器MSE、RMSEH2O、R
8被标记为骗保的汽车保险公司真实数据-汽车、保险和事故相关特征DNN+LDATP、FP、准确率、精确率、F1分数-
9来自一个巨大的在线支付平台的交易记录2006个人财务变量GBDT+DNNAUROC-
10金融交易-交易数据LSTMt-SNE-
11来自希腊公司的实验数据--DQL收入Torch
注:
1.算法:LDA(Latent Dirichlet Allocation):文本主题模型;GBDT(Gradient-Boosted-Decision Trees):梯度下降树;DQL(Deep Q-Learning):深度Q学习
2.性能指标:t-SNE(t-distributed stochastic neighbor embedding):t-分布领域嵌入算法
  1. 投资组合管理(Portfolio Management)

投资组合管理通常指在预先确定的时期内,构建一个投资组合选择各种资产的过程。主要关注以下领域:投资组合优化、投资组合选择、投资组合配置。投资组合管理实质上是一个优化的过程,许多模型应运而生。Takeuchi et al.(2013)根据预期收益将股票分成低动量与高动量两组,使用了深度RBM网络,获得了较高的收益。除此之外,深度强化学习(DRL)被选为主要的深度学习模型,被广泛运用,文献综述如表7所示:
表 7 投资组合管理研究
编号数据集时间段特征集算法性能指标运行环境
1加密货币、比特币2014-2017价格数据CNN、RNN、LSTM累计投资组合价值、MDD、SR-
2来自纽交所、美交所、纳斯达克交易所的股票1965-2009价格数据自动编码器+RBM准确率、混淆矩阵-
320只标普500中的股票2012-2015技术指标MLP准确率Python、Scikitlearn、Keras、Theano
4中国股票数据2012-2013技术指标与基本指标逻辑回归、RF、DNNAUC、准确率、精确率、召回率、真正例率、反正例率Keras、Tensorflow、Python、Scikitlearn
5标普500中最大的5个公司-价格数据与财务比率LSTM、自动编码器、智能索引CAGR-
6纳斯达克生物科技交易所基金2012-2016价格数据自动编码器、校准验证回报-
7台湾股票市场-价格数据Elman神经网络、RNNMSE、回报-
8外汇(EUR/USD)、黄金2013价格数据RNN回报Python
9纽交所、美交所、纳斯达克交易所的股票日内交易数据1993-2017价格、15种公司特征LSTM+MLP月回报、SRPython、Keras、Tensorflow in AWS
10标普5001985-2006月度和日度的对数回报DBN+MLP检验误差Theano、Python、Matlab
1110只标普500中的股票1997-2016OCHLV、价格数据RNN、LSTM、GRU准确率、月回报Keras、Tensorflow
12东京和大阪证券交易所的分析报告2016-2018文本LSTM、CNN、Bi-LSTM准确率、R2R、Python、Matlab
13中国/美国股票市场中的股票2015-2018OCHLV、基本面数据DDPG、PPOSR、MDDKeras、Python、MeCab
14对冲基金月度回报数据1996-2015回报、SR、STD、偏度、风度、欧米茄比率、基金中的alphaDNN夏普比率、年回报、累计回报-
1512种交易量最大的加密货币2015-2016价格数据CNN+RLSR、投资组合价值、MDD-
注:
1.算法:Bi-LSTM(Bidirectional LSTM):双向LSTM ;DDPG(Deep Deterministic Policy Gradient):深度确定性策略梯度;PPO(Proximal Policy Optimization):深度增强学习
2.性能指标:AUC(Area Under the Curve):曲线下方面积;CAGR(Compound Annual Growth Rate):复合增长率
  1. 资产定价与衍生品市场(Asset Pricing and Derivatives Market)

资产的准确定价与估值问题是金融学的一个研究领域。机器学习在银行、企业、房地产、衍生品产品中的运用很广泛,但深度学习还没有广泛应用到该领域。深度学习模型可能在这个领域发光发热,但目前研究仅有少数几项,如表8所示:
表 8 资产定价与衍生品市场研究
编号数据集时间段特征集算法性能指标运行环境
1东京和大阪证券交易所的分析报告2016-2018文本LSTM、CNN、Bi-LSTM准确率、R2R、Python、MeCab
2模拟一系列看涨期权价格-价格信息、执行价格、期限、股利、无风险利率、波动性DNNRMSE、平均定价误差百分比Tensorflow
3台湾指数(TAIEX)2017OCHLV、基本面分析、期权价格MLP、使用斯科尔斯期权定价模型的MLPRMSE、MAE、MAPE-
4纽交所、美交所和纳斯达克交易所的回报1975-201757个公司特征Fama-French n因子模型R2、RMSETensorflow
  1. 加密货币和区块链研究(Cryptocurrency and Blockchain Studies)

加密货币在过去几年一直被人们津津乐道,因为它们可以在短时间内完成难以置信的价格涨跌,而区块链作为一个分布式的账本系统,很好地适应了加密货币,两者高度耦合。学者们使用深度学习模型,对加密货币算法交易模型与价格预测做出了尝试:Lopes et al.(2018)将市场与加密货币交易的价格预测相结合,使用CNN和LSTM进行文本挖掘,并以OCHLV的价格、技术指标和情绪分析作为特征集,类似研究如表9所示:
表 9 加密货币和区块链研究
编号数据集时间段特征集算法性能指标运行环境
1比特币、达世币、瑞波币、门罗币、狗币、未来币、域名币2014-2017MA、BOLL、CRIX日回报、欧洲银行同业拆借利率、EURO/UK、EURO/USD和US/JPY的OCHLVLSTM、RNN、MLP准确率、F1分数Python、Tensorflow
2加密货币、比特币2014-2017价格数据CNN累计投资组合价值、MDD、SR-
312种交易量最大的比特币2015-2016价格数据CNN+RLSR、投资组合价值、MDD-
4比特币数据2010-2017哈希值、比特币地址、公钥/私钥、数字签名TS模糊模型、模糊认知图层次分析法-
5比特币数据2012,2013,2016交易ID、买入/卖出地址、时间戳启发式图嵌入算法、拉普拉斯映射、深度自编码器F1分数-
6比特币、莱特币、推特2015-2018OCHLV、技术指标、敏感性分析CNN、LSTM、状态频率模型MSEKeras、Tensorflow
7比特币2013-2016价格数据贝叶斯优化后的RNN、LSTM敏感性、特异性、精确率、准确率、RMSEKeras、Python、Hyperas
注:
1.特征集:MA(Moving Average):移动平均线;BOLL(Bollinger Band):布林线;CRIX(The Cryptocurrency Index):加密货币指数
  1. 财务情绪分析和行为金融学(Financial Sentiment Analysis and Behavioral Finance)

投资者情绪是行为金融学的一个重要组成成分。文本挖掘技术的崛起为社交媒体情绪的提取做出了良好的铺垫。学者们也对该领域较为感兴趣:Kearney et al.(2014)基于调查,使用文本数据对情绪进行了挖掘,此类研究数量较多且方向类似,如表10所示:
表 10 财务情绪的文本挖掘与预测
编号数据集时间段特征集算法性能指标运行环境
1东京、大阪证券交易所的分析报告2016-2018文本LSTM、CNN、Bi-LSTM准确率、R2R、Python、Mecab
2新浪微博、证券市场记录2012-2015技术指标、句子DRSEF1分数、精确率、召回率、准确率、AUROCPython
3来自路透社和彭博的关于标普500股票的新闻2006-2015财经新闻、价格数据DeepClue准确率Dynet software
4路透社和彭博新闻,历史股票安全数据2006-2013新闻、价格数据DNN准确率-
5上证综合指数价格2008-2015变化率的OCHL、价格情感分析+LSTMMSE-
6上证综合指数价格2013-2016文本数据和价格数据LSTM准确率、F1分数Python、Keras
7谷歌、微软和苹果公司的股票2016-2017推特情感和股票价格RNN-Spark、Flume、Twitter、API
830支道琼斯股票、标普500、道琼斯指数、路透社新闻2002-2016价格数据、新闻和文章的特征LSTM、NN、CNN和word2vec准确率VADER
9沪深300指数的股票及OCHLV2009-2014情感帖子、价格数据朴素贝叶斯+LSTM精确率、召回率、F1分数、准确率Python、Keras
10标普500、纽交所、道琼斯、纳斯达克交易所2009-2011推特情绪、指数数据DNN、CNN错误率Keras、Theano
注:
1.算法:DRSE(Deep Random Subspace Ensembles):深度随机子空间集成
  1. 金融文本挖掘(Financial Text Mining)

随着社交媒体和实时媒体/推文的迅速传播,基于文本的即时信息检索成为金融模型开发的可用工具,因此,近几年来金融文本挖掘变得非常流行,有仅用于预测的,也有仅用作情绪分析的,同时存在其他类型。
8.1 以预测为目的
Huynh et al.(2017)利用路透社、彭博社的财经新闻和股价数据对未来的股价走势进行预测;Dang et al.(2018)利用Stock2Vec模型与两流GRU模型,从金融新闻和股票价格中生成输入数据,对股票价格进行分类,类似研究如表11所示:
表 11 以预测为目的,不含情感分析的文本挖掘研究
编号数据集时间段特征集算法性能指标运行环境
1标普500中的能源部门/核心公司2015-2016文本和价格数据
回报、SR、精确率、召回率、准确率Python、Tweepy API
2来自路透社和彭博的新闻2006-2013财经新闻、价格数据Bi-GRU准确率Python、Keras
3来自新浪网的新闻、ACE2005中文标注语料库2012-2016一系列新闻文本独特算法精确率、召回率、F1分数-
4德国CDAX股票市场数据2010-2013财经新闻、股票市场价格LSTMMSE、RMSE、MAE、准确率、AUCTensorFlow、Theano、Python、Scikit-Learn
5来自路透社和彭博的苹果、空中客车公司、亚马逊新闻、标普500股票价格2006-2013价格数据、新闻、技术指标TGRU、stock2vec准确率、精确率、AUROCKeras、Python
6标普500指数、15只标普500股票2006-2013路透社和彭博新闻CNN准确率、MCC-
7来自路透社的标普500指数新闻2006-2013财经新闻标题、技术指标SI-RCNN(LSTM+CNN)准确率-
810只日经225成分股和新闻2001-2008文本信息和股票价格段落向量+LSTM利润-
9印度NIFTY50指数、银行/汽车/互联网/能源行业指数、新闻2013--2017指数数据、新闻LSTMMCC、准确率-
10价格数据、指数数据、新闻、社会媒体数据2015价格数据、来自文章和社交媒体的新闻耦合矩阵和张量准确率、MCCJieba
11沪深3002015-2017社交媒体新闻、价格数据文档生成模型与RNN-Boost准确率、MAE、MAPE、RMSEPython、Scikitlearn
12新闻和中国股票数据2014-2017新闻中的选词HAN准确率、年回报-
13新闻,来自港交所的价格数据2001价格数据和来自新闻的TF-IDFELM、DLR、PCA、BELM、KELM、NN准确率Matlab
14台湾TWSE指数、4只TWSE成分股2001-2017技术指标、价格数据、新闻CNN+LSTMRMSE、利润Keras、Python、TALIB
15Tsugami公司的股票2013价格数据LSTMRMSEKeras、Tensorflow
16新闻、Nikkei股票的均值、10个Nikkei成分公司1999-2008新闻、MACDRNN、RBM+DBN准确率、P值-
17ISMIS2017矿业竞争比赛数据-专项标示符、分类LSTM+GRU+FFNN准确率-
18路透社和彭博新闻、标普500指数价格2006-2013新闻和句子LSTM准确率-
19标普500、来自路透社的新闻2011-2017输入新闻、OCHLV、技术指标CNN+LSTM、CNN+SVM准确率、F1分数Tensorflow
20日经225指数、标普500指数、来自路透社和彭博的新闻2001-2013股票价格数据和新闻DGM准确率、MCC、利润率-
21标普500成分股2006-2013文本(新闻)和价格数据LAR+新闻、RF+新闻MAPE、RMSE-
注:
1.特征集:TF-IDF(Term Frequency-Inverse Document Frequency):词频-逆文档频率
2.算法:Bi-GRU(Bidirectional GRU):双向门控循环单元 ;TGRU(Two-stream GRU):双流门控循环单元;HAN(Hybrid Attention Network):混合注意力网络;ELM(Extreme Learning Machine):极限学习机;DLR(Deep Learning Representation):深度表征学习;PCA(Principal Component Analysis):层次分析法;BELM(Basic Extreme Learning Machine):基础极限学习机;KELM(Kernel Extreme Learning Machine):核极限学习机;LAR(Linear Auto-regression Predictor):线性自回归预测;
3.性能指标:MCC(Matthew Correlation Coefficient):马修斯相关系数
8.2 以情感分析为目的
Yoshihara et al.(2014)提出了一种新的方法,将RBM、DBN和词嵌入相结合,为RNN-RBM-DBN网络创建词向量预测股票价格;Cristo et al.(2015)将股票价格和词嵌入都用于股票价格预测,取得了较好的效果,相关研究如表12所示:
表 12 金融情绪研究与不含预测的文本挖掘
编号数据集时间段特征集算法性能指标运行环境
1883家来自EDGAR的银行持股公司2006-2017代币、加权情感极性、杠杆率和ROA、CNN、LSTM、SVM、随机森林准确率、精确率、召回率、F1分数Keras、Python、Scikitlearn
22017年SemEval数据集、金融文本、新闻、股票市场数据2017博客中的情感、新闻标题集成SVR、CNN、LSTM、GRU余弦相似度、等级得分、赞同得分Python、Keras、Scikitlearn
3来自路透社的金融新闻2006-2015词向量、词汇与语境输入Tree-LSTM累计超额收益率(CAR)-
4来自推特的股票情感分析2015Stock-Twits中的信息LSTM、Doc2Vec、CNN准确率、精确率、召回率、f得分、AUC-
5新浪微博、股票市场记录2012-2015技术指标、句子DRSEF1得分、精确率、召回率、准确率、AUROCPython
6来自今日新闻网、苹果日报、自由时报、理财网的关于18只股票的新闻2013-2014文本、情感-回报Python、Tensorflow
7推特2008-2016句子、Stock-Twits中的信息CNN、LSTM、GRUMCC、WSURTKeras、Tensorflow
8日本公司的财务报表-句子、文本DNN精确率、召回率、F得分-
9推特文章、新闻标题-句子、文本Deep-FASP准确率、MSE、R2-
10论坛数据2004-2013句子和关键词递归神经网络精确率、召回率、F得分-
11金融时报中与美国股票相关的新闻-新闻标题中的情绪SVR、双向LSTM余弦相似度Python、Scikitlearn、Keras、Tensorflow
注:
1.性能指标:WSURT(Wilcoxon Sum-rank Test):Wlicoxon和秩检验
8.3 其他文本挖掘研究
文本挖掘研究还可以用作许多其他领域,如Wang et al.(2018)利用文本挖掘和DNN模型对汽车保险诈骗进行检测,Sarlin et al.(2015)通过提取新闻语义,确定银行压力,并将其与相关事件进行分类,更多研究如表13所示:
表 13 其他文本挖掘研究
编号数据集时间段特征集算法性能指标运行环境
1来自今日新闻网、苹果日报、自由时报、理财网的关于18只股票的新闻2013-2014文本、情感-回报Python、Tensorflow
2大型欧洲银行的事件数据集、路透社的新闻文章2007-2014单词与句子DNN+NLP预处理相对实用性、F1分数-
3欧洲银行的事件数据集、路透社的新闻2007-2014文本与句子句子向量+DFFN实用性、F1分数、AUROC-
4路透社的新闻、财务数据2007-2014财务指标和新闻文本doc2vec+NN相对实用性Doc2vec
5被标记为骗保的汽车保险公司真实数据-汽车、保险和事故相关特征DNN+LDATP、FP、准确率、精确率、F1分数-
6金融交易-交易数据LSTMt-SNE-
7台湾居民养老保险2008-2014保险人ID、地区编码、性别等RNN准确率、所有误差Python
8Stock-Twits2015-2016句子、Stock-Twits信息Doc2vec、CNN准确率、精确率、召回率、f得分、AUCPython、Tensorflow
  1. 理论与概念研究

除了上述对于算法的实际运用外,还有一些论文对模型的理论概念进行了关注,并具有其独特的价值,如表14所示:
表 14 其他理论与概念研究
编号主题数据集时间段特征集算法性能指标运行环境
1AE、SVD的分析纳斯达克生物科技交易所基金指数的成分股、安进股份中的股票2012-2014价格数据AE、SVD--
2银行中的反欺诈风险管理/反欺诈--DRL--
注:
1.算法:SVD(Singluar Value Decomposition):奇异值分解
  1. 其他金融应用领域

此外,还有一些研究与上述领域没有包含关系,但同样具有较大的意义,这些研究包括社会保险支付分类、银行电话营销成功率预测、逃税与洗钱检测等,具体描述如表15所示:
表 15 其他金融应用
编号主题数据集时间段特征集算法性能指标运行环境
1促进成交决策标普500、韩国KOSPI指数、恒生指数和欧洲斯托克50指数1987-2017200天股票价格深度Q-Learning、DNN总利润、相关性-
2确定地下经济的最大交易者论坛数据2004-2013句子和关键词递归神经网络精确率、召回率、F得分-
3预测支付习惯台湾居民养老保险2008-2014保险人ID、地区编码、性别等RNN准确率、所有误差Python
4加速45个芝商所的上市产品和外汇期货1991-2014价格数据DNN--
5基础预测纽交所、纳斯达克交易所或美交所的股票1970-2017来自资金平衡表的16个基本指标MLP、LFMMSE、年收益、SR-
6预测银行的电话销售银行市场数据中的电话记录2008-201016个金融相关变量CNN准确率-
7公司绩效预测22家美国股票市场中的药物公司2000-201511个经济变量、4个其他变量RBM、DBNRMSE、利润-
注:
1.算法:LFM(Lookahead Factor Models):前瞻因素模型

金融领域深度学习应用的现状

本文回顾了144篇来自不同金融应用领域的论文。每篇论文根据其主题、类型、方法、数据集、特征集和性能指标进行分析,下面我们将提供当前金融+深度学习的摘要统计信息。
如上图所示,我们将相关领域研究中的各种主题聚集到一起,快速浏览图片后可以发现:在美国,金融文本挖掘和算法交易是研究人员研究最多的两个领域,风险评估、情感分析、投资组合管理和欺诈检测则紧随其后。与此同时,该领域的研究成果大多来自于近三年,汇总图片如下所示,这表明了该领域的时效性与活跃性。值得一提的是,2013年的所有研究都是用了RNN模型。
当我们对模型进行分组汇总时,结果如下图所示。我们观察到,不管是所有年份还是近三年,RNN一直是深度学习中的主流算法,而DMLP和CNN算法也具有自己独到的优势。
我们通过词云图(Wordcloud)对最常用的模型实现框架与运行环境进行了汇总,并使用扇形图对所占百分比进行了详细解读,结果如下图所示。我们可以从左侧扇形图中得知,Python占了所有运行环境中的80%,R则占了10%,其他10%分配给其他各语言;右侧扇形图表示开发人员使用Python实现深度学习时使用的库和框架,Keras、Tensorflow目前在各类库中占据优势地位。

顶级期刊列表如下图所示,近3年发表论文最多的期刊包括:Expert Systems with Applications、Decision Support Systems、Applied Soft Computing、Neurocomputing、Knowledge-based Systems和European Journal of Operational Research.
此外,目前来看,DMLP一般适用于分类问题,是目前金融领域对于分类问题的首选,但由于它是MLP的拓展,所以它的历史比其他深度学习模型更长。而CNN最近开始受到更广泛的关注,且近三年的应用突飞猛进,其在未来可能会超越其他模型。

一些对于现状的思考

  1. 对于模型的讨论

LSTM模型目前在金融时间序列数据预测方面,是大多数研究人员首选的深度学习模型。这是由于金融的数据大多具有时变性,这非常适合LSTM系列的算法,因为它们具有很好的适应性。与此同时,在过去的两年里,CNN系列模型受到研究人员的更多青睐。与LSTM不同,CNN对于分类问题的解决能力较强,适合静态数据或非时变数据,这在金融领域的应用并不是非常合适。但一些研究人员发现,一维时变金融数据可以金融创新变换,将其转换为二维,静态的类图像数据,并使用CNN解决问题。这在复杂的财务模式中非常有效,而未来的走向需要时间给我们答案。
另一个关注度逐渐走高的模型是DRL系列,特别是与其他算法结合时,效果较好,但复杂模型的解释能力需要进行考虑。
与此同时,由于目前DL库处于开源状态,框架也在不断完善,其在金融领域的新型应用并不是难事。值得注意的是,DL相对于ML性能较高,性能评价结果也较好,这些改进中受益最大的是算法交易模型和文本挖掘研究,在每年增加的论文中我们可以找到相关依据。
  1. 对于应用领域的讨论

在所有已应用的领域中,价格预测和算法交易模型受到更广泛的关注。而作为已在机器学习领域尝到甜头的风险评估和投资组合管理,在深度学习中表现也不错。
在金融文本领域逐渐扩大的今天,金融新闻、博客等媒体的流行为金融界开辟了一个全新的世界,对于文字信息的解读,可以更好地提高性能,已有很多研究人员在这个方向不断进行尝试,提高模型的精度。
另一个深度学习中的热点领域是加密货币和区块链,两者通常一起使用。加密货币价格是最具吸引力的细分领域,而更多的细分领域正在进行探索。
  1. 待解决的问题和未来的工作

目前,虽然深度学习已为金融领域注入了新的活力,但仍有问题需要解决。我们将通过对现状的梳理,从模型开发和研究主题的观点提出对现存问题的见解:
3.1模型开发角度:
  • CNN作为新兴算法,在各个金融领域具有适应性,它为很多问题的解决提供了机会;图卷积网络(Graph-CNN)与CNN密切相关但具有差异,它并没有被广泛运用,这一算法仍有发展的空间。

  • 最近开发的深度学习模型,如GAN、胶囊网络等,为现有的实现提供可行的替代方案。它们逐渐出现在各种非金融研究中,这是一种比较好的态势。

  • 由于金融文本挖掘正在迅速发展,可以对Stock2Vec等新的数据模型进行增强,以获得更好的模型。此外,基于NLP的集成模型或许可以与图像相结合,提高现有模型的准确性。

  • 混合模型比独立模型更受欢迎,且这个趋势很可能持续下去。研究人员需要引入更多通用的或非常规的模型来获得更好的结果,可能是研究人员找寻正“alpha”的一个有效手段。

3.2 应用领域角度:
  • 算法交易、投资组合管理、风险评估可能会继续在金融研究领域占据主导地位。与此同时,一些新兴领域开始得到更广泛的关注,这对金融界的影响值得思考与关注。

  • 加密货币和区块链技术具有可能性。它为研究人员提供了一个很好的机会,可以塑造未来的新金融世界,充满着创新的希望。

  • 投资组合管理也是一个新的受益领域。机器人咨询系统在世界范围应用越来越多,这些系统依赖于高性能的自动决策系统,而深度学习模型很适合此类工作。我们有理由相信,深度学习对于此领域的运用是未来可期的。

  • 在衍生品市场,深度学习的应用并不够。衍生金融产品具有极强的灵活性,对计算的性能要求极高,深度学习可以进行更多的尝试。其中,期权策略优化、期货交易、期权定价、套利交易等都可以从深度学习中受益。

  • 情感分析、文本挖掘、风险资产定价可能是未来的发展方向,它们已受到研究人员的关注,但仍未充分利用。

  • 高频交易领域由于需要进行快速的运算,仍未从机器学习领域得到有效的提高。而深度学习可以研究更多硬件方面,为高频交易助力。

3.3 对未来研究的建议
  • 把握区块链和加密货币领域,目前来看是具有必要的

  • 注意文本挖掘、金融情绪分析与行为金融学的耦合,其中隐藏着大量的机会。行为金融学的研究并未使用深度学习,这可能是由于难以量化行为金融学的投入与产出。但随着文本挖掘、NLP的不断完善,未来可以进行尝试。

  1. 对引言中提出问题的回复:

通过上述分析,我们对引言提出的问题有了更深刻的理解,Q&A如下所示:
Q: 深度学习(DL)在金融领域的应用包括哪些?
A: 金融文本挖掘、算法交易、风险评估、情感分析、投资组合管理和欺诈交易是其中最受关注的领域。
Q: 目前在各领域的研究进度如何?
A:虽然深度学习模型已经在几乎所有领域取得了比传统模型更好地成绩,但仍然具有很好的发展前景,研究人员们的热情高涨。
Q: 还有哪些有潜力的应用领域?
A:加密货币、区块链、行为金融、高频交易和衍生品市场。
Q: 哪一种深度学习(DL)模型更被青睐?
A:RNN模型系列(特别是LSTM)目前发展较好,CNN和DMLP也被广泛使用。其中LSTM更适合时间序列预测,DMLP和CNN更适合分类问题的解决。
Q: 深度学习(DL)与机器学习(ML)相比,哪一个更适合用作研究?
A:在大多数研究中,DL模型比ML模型表现更好。但在一些特定情况下,ML具有更好的解决办法。总的来说,DL比较优质。
Q: 深度学习(DL)的未来方向是什么?
A:在不久的将来,NLP、空间数据、语义和基于文本挖掘的混合模型可能会逐渐变得重要。

结论

金融行业和学术界已经开始意识到,深度学习模型在各个领域具有极高的潜力。研究的数量正在逐年加速增长,而此时,正是高速发展的时代,越来越多的研究会被逐渐落实,新的模式会不断涌入。在这篇文章中,我们不仅提供了目前研究现状的细分领域介绍,并试图为未来的研究人员确定方向。这一领域具有难以置信的机遇,并且这些机遇不会很快消失。我希望这篇文章是一个很好的契机,鼓励对该领域感兴趣的研究人员继续探索,将深度学习进行更深度的挖掘。

长按以上二维码可以阅读Deep Learning for Financial Applications : A Survey原文

关于一些计量方法的合辑,各位学者可以参看如下文章:实证研究中用到的200篇文章, 社科学者常备toolkit”、实证文章写作常用到的50篇名家经验帖, 学者必读系列过去10年AER上关于中国主题的Articles专辑AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向2020年中文Top期刊重点选题方向, 写论文就写这些过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图。后面,咱们又引荐了使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑!这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授Python, Stata, R软件史上最全快捷键合辑!关于(模糊)断点回归设计的100篇精选Articles专辑!关于双重差分法DID的32篇精选Articles专辑!关于合成控制法SCM的33篇精选Articles专辑!最近80篇关于中国国际贸易领域papers合辑!最近70篇关于中国环境生态的经济学papers合辑!使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑!最近50篇使用系统GMM开展实证研究的papers合辑!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存