查看原文
其他

摩根大通:面向金融的量子机器学习指南

光子盒研究院 光子盒 2022-07-04
光子盒研究院出品
 

“量子计算对金融服务的影响将比你想象的更快,”摩根大通量子技术主管兼研究主管Marco Pistoia及其团队成员撰写的论文中提到。摩根大通表示,金融业“即使在短期内”也会从量子计算中受益。这篇综述文章介绍了量子算法在金融领域的应用现状,特别关注那些可以通过机器学习(ML)解决的用例。
 

高效的ML算法经过不断发展,已经可以支持不同的数据类型并扩展到更大的数据集,ML在金融领域的适用性变得越来越重要。
 
目前,适用于金融业的ML操作包括资产定价的回归、投资组合优化的分类、投资组合风险分析和股票选择的聚类、市场制度识别的生成建模、欺诈检测的特征提取、算法交易的强化学习,以及风险评估、财务预测、会计和审计的自然语言处理(NLP)。此外,深度学习通常用于图像识别和文本分类,以及以大型非结构化数据集为特征的任何用例。
 
考虑到所涉及算法的复杂性和所分析数据的大小,ML已经被确定为量子计算应用的最重要领域之一。而且随着新的线性代数量子算法的发现,这一点变得更加明显,这些算法提供了在量子计算机上比相应的经典算法更有效、更精确地执行线性代数计算的潜力。
 
在某些条件下,量子加速甚至可以是指数级的。虽然目前还没有发现指数级加速的量子ML的端到端应用,但是已经提出了几个有希望的方向。与此同时,大量的研究和工程工作已经成功地致力于实现量子算法,在其数据处理子程序中(除了数据加载和输出提取)具有显著的多项式加速。
 

监督学习的中心任务是回归,即训练一个简单模型来逼近实值函数的问题。这是实验科学中一个极其重要的例行程序,最近已开始用于大规模数据集。在计算上,这减少到最小化捕获训练数据拟合质量的损失函数;常见的选择是最坏情况误差的L∞范数,以及平均情况误差的L1或L2范数。L2范数的光滑性使得它对优化算法有吸引力,导致最小二乘回归的普遍存在。
 
基于求解线性方程组的量子算法,Wiebe、Braun和Lloyd在2012年首次考虑了这一任务的量子加速。
 
他们的算法需要访问处于叠加的数据矩阵和权重向量的条目,并输出一个量子态,该量子态在(log(N)s3κ6/ϵ)时间内编码输出,其中(·)忽略了复杂度中的多对数因素。该算法的运行时间比经典算法要少很多。

接下来将介绍几种利用这些技术的金融应用。
 
A.资产定价
 
资产定价是为各类金融工具(如股票、债券和衍生品)定价的任务。有几种经济模型用于根据一系列瞬时(或现货)价格来分配这些价格,包括一般均衡定价和无套利定价。
 
预测这些现货价格的常用方法是将其建模为简单的基本随机过程的函数,如布朗运动或几何布朗运动。然后历史财务数据可以用来确定这些随机模型的参数。一般来说,预测现货价格(以及许多其他随时间变化的金融权益)可以建模为一个时间序列学习问题。具体来说,给定一系列历史价格,能否对未来的价格做出准确预测?由于这降低了基于训练数据预测实际值的难度,因此最好将其建模为有监督回归问题。
 
深度循环神经网络(RNN)在时间序列预测方面越来越成功,尤其是那些利用LSTM(长短期记忆人工神经网络)的方法,这使得研究人员考虑将这些通用算法用于资产定价。Gu等人和Chen等人分别在2020年和2021年研究了基于LSTM的深度学习方法在资产定价中的应用,获得了有希望的结果。
 
具体而言,Gu等人[1]表明,对标准普尔500指数的ML预测实现了样本外年化夏普比率0.77,而买入并持有型投资者的夏普比率为0.51。他们还发现,基于股票价格神经网络预测的价值加权长短十分位数价差(decile spread)策略的年化夏普比率为1.35,这几乎是最先进的经典回归方法的两倍。Chen等人[2]进一步表明,基于LSTM预测的改进模型可以实现比原始深度学习预测以及经典方法(包括Fama-French五因子模型)大得多的样本外年化夏普比率。
 
相关论文:
[1]S. Gu, B. Kelly, and D. Xiu, “Empirical asset pricing via machine learning,” The Review of Financial Studies, 2020.
[2]L. Chen, M. Pelger, and J. Zhu, “Deep learning in asset pricing,” arXiv:1904.00745, 2021.
 
部署深度学习方法的最大挑战是,与经典方法所要求的简单参数校准相比,训练复杂的神经网络通常是一个计算量大得多的过程。参数化量子电路(PQC)在表达性、训练复杂性和预测性能方面可能优于经典的变分回归模型。2020年的研究已经描述了使用PQC来形成RNN[3],另一项研究提出了量子LSTM模型的建议[4]。尽管对资产定价的适用性还有待研究,但这两种方法都显示出对特定功能的经典神经网络的潜在经验改进。
 
相关论文:
[3]J. Bausch, “Recurrent quantum neural networks,” in NeurIPS, 2020.
[4]S. Y.-C. Chen, S. Yoo, and Y.-L. L. Fang, “Quantum long short-term memory,” arXiv:2009.01783, 2020.
 
B.多资产趋势跟踪策略
 
回归模型可用于预测多资产类别投资组合的单日回报。每个金融资产类别(例如股票、债券、现金或商品)可能具有不同的内部动态。然而,回归模型可能能够涵盖全局动态。全局动态的一个例子是:如果股市看跌,投资者可能更喜欢更安全的投资,比如债券,从而导致债券价格上涨。事实上,自本世纪初以来,股票和债券之间一直存在负相关。然而,这种相关性在1970年和2000年之间为正的。因此,资产类别之间的关系不断演变,不应被视为普遍真理。
 
为了每天预测收益,可以使用不同时间段(例如1个月、3个月等)的历史价格在输入数据中引入趋势信息。但是,这会导致数据中特征数量的增加,并可能导致过度拟合。因此,人们宁愿使用套索(lasso)回归,而不是普通回归。实际上,通过向L2回归问题的成本函数添加L1惩罚项,模型将选择相关特征的子集。与任何回归方法一样,可将其视为一个分类模型。这里的分类是买入、持有或卖出。
 
对于量子实现,L1范数可能不是最有吸引力的正则化项。尽管如此,Du等人[5]提供了最接近已知的差分隐私套索估计器实现。
 
相关论文:
[5]Y. Du, M.-H. Hsieh, T. Liu, S. You, and D. Tao, “Quantum differentially private sparse regression learning,” arXiv:2007.11921, 2020.
 
C.隐含波动率估计
 
隐含波动率(implied volatility)指标反映了金融市场对给定证券价格变化可能性的看法。波动性分析对于风险管理、投资组合对冲和期权定价至关重要。我们需要准确了解市场对波动性的预期。投资组合对波动性变化很敏感。例如,已经证明隐含波动性——如石油、黄金和美国股市的波动性——对股票的回报有影响。特别是,它们对十个最具代表性的美国股票行业的价格和回报的影响已经被量化。
 
研究人员提出了一种学习隐含波动率的量子方法[6]。这使用了Beer等人[7]首次引入的深度量子神经网络。给定期权,输入数据为其执行价格,输出数据为隐含波动率。
 
相关论文:
[6]T. Sakuma, “Application of deep quantum neural networks to finance,” arXiv:2011.07319, 2020.
[7]K. Beer, D. Bondarenko, T. Farrelly, T. J. Osborne, R. Salzmann, D. Scheiermann, and R. Wolf, “Training deep quantum neural networks,” Nat. Comm., 2020.
 

在ML中分类的目标是使用一个由标记数据集拟合的模型来预测新数据点的标签。众所周知的传统分类算法包括线性分类、最近质心和支持向量机(SVM)。除此之外,基于神经网络的方法也取得了巨大的成功。经验证明,神经网络比传统方法具有更好的性能,尤其是在大型数据集上。但是另一方面,在决策或执行涉及处理敏感信息的任务时,神经网络在透明度和可解释性方面存在不足。
 
对于线性分类,常用算法是感知器方法,在给定时间O(nd/γ2)内n个d维数据点的情况下查找γ裕度分类器。量子算法已被证明能够为其提供加速,使运行时间降低到O(√nd/γ2)[8]或O(√nd/γ)[9]。用于训练具有不变裕度的分类器的最佳经典算法在(n+d)[10]时间内运行,相应的最佳量子分类算法可以带来平方加速,即(√n+√d)[11]。

相关论文:
[8]S. Lloyd, “Quantum machine learning for data classification,” Physics, 2021.
[9]A. Kapoor, N. Wiebe, and K. Svore, “Quantum perceptron models,” NIPS, 2016.
[10]K. L. Clarkson, E. Hazan, and D. P. Woodruff, “Sublinear optimization for machine learning,” JACM, 2012.
[11]T. Li, S. Chakrabarti, and X. Wu, “Sublinear quantum algorithms for training linear and kernel-based classifiers,” ICML, 2019.
 
对于基于距离的分类,主要包括最近质心和k最近邻(k-NN)分类器。QC Ware公司的研究人员[12]在2020年将最近质心算法的量子版本用于对MNIST手写数字数据集进行分类。实验是在离子阱离子量子计算机上进行的。但作者并没有声称在时间复杂度方面有任何量子加速。研究人员也已经提出了几种用于k-NN的量子方法。例如,利用一种算法计算叠加的汉明距离[13],并利用量子最小查找法[14]查找到样本的汉明距离最小的邻居。此外还有量子神经网络方法[15]。在另一项研究中,作者设计了一个oracle,将两个状态之间的保真度编码到一个量子寄存器中,允许使用量子算法来寻找k-最小值[16]。
 
相关论文:
[12]S. Johri, S. Debnath, A. Mocherla, A. Singh, A. Prakash, J. Kim, and I. Kerenidis, “Nearest centroid classification on a trapped ion quantum computer,” arXiv:2012.04145, 2020.
[13J. Li, S. Lin, Y. Kai, and G. Guo, “Quantum k-nearest neighbor classification algorithm based on hamming distance,” arXiv:2103.04253, 2021.
[14]C. Durr and P. Hoyer, “A quantum algorithm for finding the minimum,” arXiv:9607014, 1996.
[15]A. Basheer, A. Afham, and S. K. Goyal, “Quantum k-nearest neighbors algorithm,” arXiv:2003.09187, 2020.
[16]K. Miyamoto, M. Iwamura, and K. Kise, “A quantum algorithm for finding k-minima,” arXiv:1907.03315, 2019.
 
对于支持向量机(SVM),它可以解决凸二次优化问题,以找到导致两类数据之间最大裕度的超平面。2019年,研究人员已将复杂度为(√n+√d)的量子算法用于训练核分类器和ℓ2裕度支持向量机[11]。这些算法是最优的,并且比相应的最优经典算法提供了平方加速。但这些算法的复杂度多项式与误差成反比。2021年,I. Kerenidis等人[17]提出了一种量子算法,以维度d来加速这些方法。虽然量子运行时间取决于难以直接绑定的项,但对于随机情况,量子算法确实可以提供加速,复杂度从经典算法的O(n3.11)降低为O(n2.59)。

早在2014年,研究人员提出了量子支持向量机(QSVM)。在SVM中,获得最优超平面,将数据集划分为多个类,时间复杂度为O(log(1/ϵ)poly(N, M)),其中N表示特征空间维度,M表示输入点的数量,ϵ表示精度。从数学上证明,QSVM的运行时间为O(log(NM))[18]。
 
相关论文:
[11]T. Li, S. Chakrabarti, and X. Wu, “Sublinear quantum algorithms for training linear and kernel-based classifiers,” ICML, 2019.
[17]I. Kerenidis, A. Prakash, and D. Szil´agyi, “Quantum algorithms for second-order cone programming and support vector machines,” Quantum, 2021.
[18]P. Rebentrost, M. Mohseni, and S. Lloyd, “Quantum support vector machine for big data classification,” PRL, 2014.
 
二十多年来,支持向量机一直用于预测股票价格,以及预测财务困境和公司信用评级。
 
还有一种方法叫做变分量子分类器(VQC),这不是经典ML算法的量子版本,而是混合量子/经典ML架构,用于分类任务,利用量子态空间作为特征空间,潜在地获得量子优势。VQC电路主要由量子嵌入、处理量子数据的PQC(参数化量子电路)、测量例程和更新PQC参数的经典优化回路组成。使用经典优化器在训练数据集上训练分类器,训练后的电路可以用于为未标记的数据分配标签。研究表明,QSVM和VQC之间存在联系。
 
VQC有一些局限性,例如,当运行优化器后,参数搜索空间变平时,量子ML的优化算法会出现贫瘠高原;架构设计问题,如选择正确的成本函数和初始化参数,是一个非常复杂的过程,尚未完全理解。此外,具有固定形式的给定变分量子电路在其参数化中可能无法捕获希尔伯特空间中的所有必要状态,因此,自适应变分量子算法的工作,如进化变分量子本征求解器(EVQE),可能适用于VQC。
 
接下来,我们来看几个应用了上述量子分类技术的金融应用示例。
 
A.二元期权的预测
 
支持向量机(SVM)可以用来预测奇异期权的结果。例如,双边不触碰期权(DNT)是一种二元期权,具有固定的期权费,并且只有当且仅当标的资产价格在到期前保持在预定义的下限和上限之间时才能获得。因此,可以使用支持向量机来分离对应于二元期权结果的两类。因为这些类不是线性可分的。这类奇异期权通常用于外汇交易。选择用于训练模型的特征可以是平均方向指数(ADX)和已实现波动率与隐含波动率之间的比率。
 
B.财务预测
 
财务预测是一种规划工具,帮助企业根据预测适应不确定性。特别是,任何公司都会对预测年度收益的算法感兴趣。已经提出了这样一种利用k-NN的算法[19]。它将一家公司最近的年度收益趋势与其他公司的历史收益序列相匹配,这些公司被称为相邻公司。寻找这些相邻公司需要考虑的一些特征,包括基于行业、规模和过去应计项目的匹配。
 
相关论文:
[19]P. D. Easton, M. Kapons, S. J. Monahan, H. H. Sch¨utt, and E. H. Weisbrod, “Forecasting earnings using k-nearest neighbor matching,” SSRN, 2020.
 
C.信用评分
 
信用评分是评估贷款申请信用风险的方法,帮助信用分析师判断申请人是否具备信用。基于过去的经验,信用评分是对未来行为的预测。M. Mukid等人提出了一种使用加权k-NN[20]的算法。信贷申请人分为两类:一类是其成员有可能偿还债务的群体,另一类是因违约可能性高而被拒绝信贷的群体。
 
相关论文:
[20]M. Mukid, T. Widiharih, A. Rusgiyono, and A. Prahutama, “Credit scoring analysis using weighted k nearest neighbor,” in Journal of Physics: Conference Series, 2018.
 

聚类包括根据特定的度量标准识别彼此接近的数据点组。数据编码的特征空间和分组度量是数据点实际相似性和差异的代理。受量子力学的启发,量子聚类(Quantum Clustering, QC)适用于高维数据,属于基于密度的聚类算法,其中聚类由数据点密度较高的区域定义。QC的基本思想是将每个数据点映射到以该样本为中心的高斯分布。
 
动态量子聚类(DQC)是QC的一种改进,采用含时薛定谔方程来研究与数据点相关的量子态的演化和势能函数的结构。由于这种方法与数据无关,DQC可以应用于广泛的领域,尤其是金融领域,例如标准普尔500指数数据。
 
受经典算法启发的量子聚类技术也被提出。例如,一种著名的经典聚类算法k-means可以识别所有数据点中最重要的聚类及其代表性的质心。受k-means算法的启发,量子q-means算法提供了与经典δ-k-means算法相同的针对某种噪声水平δ的鲁棒性保证。其时间复杂度在数据集大小上是多对数的,并且可以使用距离估计和量子矩阵乘法来实现。还提出了一种用于表示为图的数据的量子谱聚类算法。
 
为了克服将大型数据集加载到量子设备上可能带来的巨大时间/空间开销,研究人员提出了核心集,核心集是与权重函数相结合的小型数据集,用于充分总结原始数据集。如果核心集足够小并且仍然是原始数据集的真实表示,则可以使用核心集在NISQ计算机上执行。
 
接下来,我们简要讨论这些量子聚类算法在金融领域的几个使用案例。
 
A.欺诈检测
 
聚类技术可用于执行异常检测,方法是从现有数据中学习正常模式,然后使用这些信息确定新数据点是正常还是异常。聚类可以改善从不平衡数据集中的学习,欺诈数据通常属于这种情况。聚类还可以与其他特征选择和提取技术相结合。例如,在时间序列数据中,序列可能异常快速,但仍保持在正常值范围内。向聚类算法中添加导数有助于检测此类异常。
 
B.股票选择
 
聚类分析也被投资者用来实现利润最大化和损失最小化。受地理和宏观经济影响,一个地区的股票回报率可能相似。通过识别股票聚类,我们可以跟踪那些收益相似但风险不同的股票。一旦通过聚类分析对股票进行分组,知情的投资者就可以使用结果作为指导。例如,他们会寻找同样回报的股票,然后选择最小化风险。或者,他们会选择一组风险相同、回报率较高的股票。
 
C.汇率制度分析
 
1999年,Levy Yeyati和Sturzenegger希望展示国际货币基金组织(IMF)报告的法律分类与数据中显示的实际行为之间的不一致。为了克服偏差,作者建议使用k-means对汇率制度进行聚类分析。这导致了一个事实上的分类,然后它被广泛使用,并根据先前的方法进行了测试。
 
D.对冲基金聚类
 
由于对冲基金和投资策略的多样性,投资者很难对此类投资工具进行分类。此外,对冲基金往往比其他类型的基金披露更少的信息。要对对冲基金进行分类,预先定义的类将无法正确管理对冲基金未来的类。因此,聚类方法,如k-means,已被用来克服这个问题。它考虑的特征基于对冲基金的可用特征,如资产类别、规模、费用、杠杆和流动性。
 

 
我们用生成模型学习数据的概率分布。在有监督学习中,模型作为一组输入/标签对{(xii,yii)}被提供,模型学习P(X,Y)即输入和标签的联合概率分布。在无监督学习中,这些模型可以用来生成仅给定样本的新数据。因为测量量子态自然会导致结果的概率分布,因此研究量子计算是否可以用于生成建模是有意义的。

1.量子玻尔兹曼机
 
玻尔兹曼机(BM)是由一组可见(观察到的)和隐藏(边缘化的)随机变量以及它们之间条件依赖的无向图定义的。它起源于热力学(因此用热力学的奠基人玻尔兹曼命名),其中的节点代表一个在外部磁场下相关的经典自旋系统si。经典伊辛哈密顿量H表示系统的能量,如下:
 

概率推断是通过对可见节点上的稳态分布(Gibbs态)进行采样来执行的。这通常是利用马尔可夫链蒙特卡罗(MCMC)方法实现的。在大多数情况下,为了使采样可以进行,图被限制为二分图,从而产生受限玻尔兹曼机(RBM)[21]。
 
为了建立量子玻尔兹曼机,我们通过替换si来量化伊辛哈密顿量,其中是第i个量子比特的泡利Z自旋算符。这就产生了量子哈密顿量,因此节点与量子比特相关联,可通过对可见量子比特的投影测量来进行采样。
 
从Gibbs态可见节点采样的一种潜在量子方法是利用量子退火(QA)[21–23],QA可以使用D-Wave设备执行[24]。
 
或者,我们可以通过执行虚时间演化(ITE)[25]为该系统制备量子Gibbs态。如果初始状态是最大混合的,根据量子哈密顿量执行ITE将产生相关的Gibbs态。通过McLachlan原理,可以在基于门的量子计算机上变分执行ITE[26]。有趣的是,C. Zoufal等人[25]引入的模型可以用来构造一个无限制连接的Boltzmann机,可以在量子设备上处理。
 
相关论文:
[21]M. H. Amin, E. Andriyash, J. Rolfe, B. Kulchytskyy, and R. Melko, “Quantum boltzmann machine,” PRX, 2018.
[22]E. Farhi, J. Goldstone, S. Gutmann, and M. Sipser, “Quantum computation by adiabatic evolution,” arXiv:0001106, 2000.
[23]V. Dixit, R. Selvarajan, M. A. Alam, T. S. Humble, and S. Kais, “Training restricted boltzmann machines with a d-wave quantum annealer,” Front. Phys., 2021.
[24]R. Harris, M. W. Johnson, T. Lanting, A. Berkley, J. Johansson, P. Bunyk, E. Tolkacheva, E. Ladizinsky, N. Ladizinsky, T. Oh, et al., “Experimental investigation of an eight-qubit unit cell in a superconducting optimization processor,” Phys. Rev. B, 2010.
[25]C. Zoufal, A. Lucchi, and S. Woerner, “Variational quantum boltzmann machines,” QMI, 2021.
[26]X. Yuan, S. Endo, Q. Zhao, Y. Li, and S. C. Benjamin, “Theory of variational quantum simulation,” Quantum, 2019
 
2.生成对抗学习
 
作为另一个用于建模概率分布的重要架构,生成对抗网络(GAN)通过对抗博弈同时训练一个生成器网络Gθ和一个鉴别器网络Dφ来相互对抗,其中,Gθ试图通过生成与真实分布中提取的数据样本不可区分的伪数据样本来欺骗Dφ,而Dφ试图将它们区分开来,不被Gθ欺骗。

量子生成对抗网络(qGAN)已经被提出[27,28],并在超导量子计算机上进行了实验测试[29]。qGAN的生成器和/或鉴别器都可以是量子电路的形式。除了原始的GAN交叉熵外,还提出了其他距离度量,如Wasserstein,以改进NISQ设备上的对抗训练。
 
相关论文:
[27]S. Lloyd and C. Weedbrook, “Quantum generative adversarial learning,” PRL, 2018.
[28]P.-L. Dallaire-Demers and N. Killoran, “Quantum generative adversarial networks,” PRA, 2018.
[29]L. Hu, S.-H. Wu, W. Cai, Y. Ma, X. Mu, Y. Xu, H. Wang, Y. Song, D.-L. Deng, C.-L. Zou, and L. Sun, “Quantum generative adversarial learning in a superconducting quantum circuit,” Science Advances, 2019.
 
3.量子玻恩机
 
与量子玻尔兹曼机和qGANs密切相关,量子玻恩机[30,31]是另一类基于PQC(参数化量子电路)的方法,已经被研究用于执行分布式学习任务。例如,Coyle等人[31]建议使用最大平均差异、Stein差异和Sinkhorn发散来改进量子电路玻恩机子类的训练。
 
相关论文:
[30]S. Cheng, J. Chen, and L. Wang, “Information perspective to probabilistic modeling: Boltzmann machines versus born machines,” Entropy, 2018.
[31]B. Coyle, D. Mills, V. Danos, and E. Kashefi, “The born supremacy: Quantum advantage and training of an ising born machine,” npj Quantum Information, 2020.
 
讨论了几种量子生成建模技术后,我们接下来看看金融领域中可以应用这些技术的用例。
 
A.欺诈检测
 
波尔兹曼机器的量子版本已用于生成学习和辨别学习任务[21,23]。特别是对于欺诈检测,变分ITE玻尔兹曼机方法已被用于分类异常信用卡交易[25]。系统哈密顿量由泡利字符串的和表示,泡利字符串的系数是训练参数和输入特征的函数。如前所述,该公式不限于玻尔兹曼机通常使用的伊辛哈密顿量。预测是通过从单个可见量子比特采样来执行的,该量子比特指示交易是否出现欺诈。
 
qGAN与生成对抗异常检测框架AnoGAN[32]相结合。生成器为PQC;来自每个量子比特上的泡利Z算符的期望的连续输出被馈入到经典的仿射放大层(affine upscaling layer),以获得完整的输入特征维数。生成器的目标是对非欺诈性交易的分布进行建模。
 
相关论文:
[21]M. H. Amin, E. Andriyash, J. Rolfe, B. Kulchytskyy, and R. Melko, “Quantum boltzmann machine,” PRX, 2018.
[23]V. Dixit, R. Selvarajan, M. A. Alam, T. S. Humble, and S. Kais, “Training restricted boltzmann machines with a d-wave quantum annealer,” Front. Phys., 2021.
[25]C. Zoufal, A. Lucchi, and S. Woerner, “Variational quantum boltzmann machines,” QMI, 2021.
[32]D. Herr, B. Obert, and M. Rosenkranz, “Anomaly detection with variational quantum generative adversarial networks,” Quantum Science and Technology, 2021.
 
B.概率分布制备
 
在许多金融应用中实现量子优势的一个关键步骤是有效地制备输入概率分布。qGAN[33,34]和量子玻恩机[30,31]都已经被用来学习PQC的加载概率分布。在收敛时,量子电路作为基础分布的有效表示,例如可用于振幅估计以执行衍生品定价任务[35],与经典蒙特卡罗模拟相比,具有理论上的平方加速。此外,研究人员探索了用于连续分布的一般创建的其他技术[36,37]。包括Rattew等人关于正态分布制备的工作[38]。
 
相关论文:
[30]S. Cheng, J. Chen, and L. Wang, “Information perspective to probabilistic modeling: Boltzmann machines versus born machines,” Entropy, 2018.
[31]B. Coyle, D. Mills, V. Danos, and E. Kashefi, “The born supremacy: Quantum advantage and training of an ising born machine,” npj Quantum Information, 2020.
[33]C. Zoufal, A. Lucchi, and S. Woerner, “Quantum generative adversarial networks for learning and loading random distributions,” npj Quantum Information, 2019.
[34]H. Situ, Z. He, Y. Wang, L. Li, and S. Zheng, “Quantum generative adversarial network for generating discrete distribution,” Information Sciences, 2020.
[35]N. Stamatopoulos, D. J. Egger, Y. Sun, C. Zoufal, R. Iten, N. Shen, and S. Woerner, “Option pricing using quantum computers,” Quantum, 2020.
[36]T. H¨aner, M. Roetteler, and K. M. Svore, “Optimizing quantum circuits for arithmetic,” arXiv:1805.12445, 2018.
[37]L. Grover and T. Rudolph, “Creating superpositions that correspond to efficiently integrable probability distributions,” arXiv:0208112, 2002.
[38]A. G. Rattew, Y. Sun, P. Minssen, and M. Pistoia, “The efficient preparation of normal distributions in quantum registers,” arXiv:2009.06601, 2020.
 

特征提取指的是用于识别数据集属性的一组技术,这些属性可能有助于ML任务,如分类和回归。量子算法可以通过计算经典计算机无法识别或需要很长时间才能识别的数据集的属性来帮助进行特征提取。通过将数据编码到量子态,我们可以将低维经典数据映射到希尔伯特空间中的更高维。量子表示的扩展维度可用于识别经典算法不可见的特征[40]。对与支持向量机结合使用的量子核[41,42]的兴趣也与日俱增,并进行了实验演示[43]。
 
从高维数据中提取低维特征的一种广泛使用的算法是主成分分析(PCA)。在PCA中,通过分析较大的特征空间来识别方差最大的属性。经典的主成分分析所花费的时间在原始数据集中的维数或特征数上是多项式的。如果将此类经典数据映射到量子密度矩阵,则该算法的量子版本可以以指数速度执行PCA,即在时间多项式中以维数的对数执行[44]。
 
在分析需要分析大量像素来识别图像属性的图像时,提取特征尤其具有挑战性。对于这些应用,量子计算机可能有助于图像的边缘检测[45]。
 
在金融领域,特征提取可用于检测交易中的异常情况。一个典型例子是,图论工具用于研究招投标市场,以识别串通的社区或企业[46]。量子辅助图核方法[40,47]已被提出用于检测图中的非平凡特征,例如网络社区[48],其可表示频繁相互交易的金融网络。在处理数据的图形表示时,我们通常需要测量两个图形之间的相似性。事实上,高斯玻色采样可以用来检查两个图是否彼此同构[49]。此外,高斯玻色采样可用于构造表示任意两个图之间相似性的核向量[39]。
 
特征选择包括从可用特征的子集中进行选择,然后传递给模型。这与对特征执行变换的方法(如PCA)形成对比。特征选择可以表述为一个组合最小化问题,二元决策变量指定是否选择特征。这种二元优化问题可以利用量子退火来解决[22]。
 
相关论文:
[22]E. Farhi, J. Goldstone, S. Gutmann, and M. Sipser, “Quantum computation by adiabatic evolution,” arXiv:0001106, 2000.
[39]M. Schuld, R. Sweke, and J. J. Meyer, “Effect of data encoding on the expressive power of variational quantum-machine-learning models,” PRA, 2021.
[40]M. Schuld, K. Br´adler, R. Israel, D. Su, and B. Gupt, “A quantum hardware-induced graph kernel based on gaussian boson sampling,” arXiv:1905.12646, 2019.
[41]R. Chatterjee and T. Yu, “Generalized coherent states, reproducing kernels, and quantum support vector machines,” arXiv:1612.03713, 2016.
[42]X. Wang, Y. Du, Y. Luo, and D. Tao, “Towards understanding the power of quantum kernels in the nisq era,” arXiv:2103.16774, 2021.
[43]K. Bartkiewicz, C. Gneiting, A. Cernoch, K. Jir´akov´a, K. Lemr, ˇ and F. Nori, “Experimental kernel-based quantum machine learning in finite feature space,” Scientific Reports, 2020.
[44]S. Lloyd, M. Mohseni, and P. Rebentrost, “Quantum principal component analysis,” Nature Physics, 2014.
[45]R.-G. Zhou, H. Yu, Y. Cheng, and F.-X. Li, “Quantum image edge extraction based on improved prewitt operator,” QIP, 2019.
[46]J. Wachs and J. Kert´esz, “A network approach to cartel detection in public auction markets,” Scientific Reports, 2019.
[47]L. Bai, L. Rossi, L. Cui, Z. Zhang, P. Ren, X. Bai, and E. Hancock, “Quantum kernels for unattributed graphs using discretetime quantum walks,” Pattern Recognition Letters, 2017.
[48]R. Shaydulin, H. Ushijima-Mwesigwa, I. Safro, S. Mniszewski, and Y. Alexeev, “Network community detection on small quantum computers,” QUTE, 2019.
[49]K. Br´adler, S. Friedland, J. Izaac, N. Killoran, and D. Su, “Graph isomorphism and gaussian boson sampling,” Special Matrices, 2021.
 
下面举例说明如何将这些技术应用于金融用例。
 
A.模型简化
 
从奇异值分解的角度可以看出,主成分分析是一种广泛使用的降维方法。利用矩阵分解A = UΣV,其中σ是矩形对角矩阵,k个主成分是UΣ的前k列。
 
2014年,Lloyd等人[44]描述了一种量子PCA,它比经典PCA具有指数加速。这种理论上的加速在某些条件下是可以实现的,因为它是基于HHL的。该算法可用于金融领域,以简化模型调整:随着市场条件的变化,需要调整模型,以使隐含波动率(由模型估计的波动率)与市场波动率相匹配。通过使用PCA,可以减少组件的数量,从而减少参数的数量,最终简化模型调整。
 
例如,在基于外汇的产品中,输入参数多种多样,范围从全球市场数据(如无风险利率)到资产具体参数(如现货价格)。因此,由于大量输入,模型调整在计算上变得昂贵。然而,由于前三个主成分通常可以解释95%以上的输出变化,因此只使用这三个成分可以更快、更准确地调整模型。
 
量子主成分分析的一种变体已经在硬件[50]上实现,通过降低Heath-Jarrow-Morton模型[51]的波动因子维度来估计远期利率,从而解决了类似的问题。
 
相关论文:
[44]S. Lloyd, M. Mohseni, and P. Rebentrost, “Quantum principal component analysis,” Nature Physics, 2014.
[50]A. Martin, B. Candelas, A. Rodr´ıguez-Rozas, J. D. Mart´ın- ´ Guerrero, X. Chen, L. Lamata, R. Or´us, E. Solano, and M. Sanz, “Toward pricing financial derivatives with an ibm quantum computer,” Phys. Rev. Research, 2021.
[51]D. Heath, R. Jarrow, and A. Morton, “Bond pricing and the term structure of interest rates: A new methodology for contingent claims valuation,” Econometrica, 1992.
 
B.信用评分分类的组合特征选择
 
如前所述,特征选择可以转化为一个组合优化问题。在监督学习的情况下,重要的是选择与学习任务相关的独立特征。更具体地说,对于分类,标签和特征之间的相关系数可以表示相关性。特征的相关矩阵可以用来表示特征之间的相关性。这可以表述为二次无约束二进制优化(QUBO)问题,其中二次项是特征之间相关系数的条目,线性项是特征和标签之间的相关性。量子退火可用于利用量子力学提供的启发式算法来求解QUBO。使用量子退火机求解的精确公式可以减少用于评估申请人信用度的特征数量[52]。
 
相关论文:
[52]A. Milne, M. Rounds, and P. Goddard, “Optimal feature selection in credit scoring and classification using a quantum annealer,” White Paper 1Qbit, 2017
 

强化学习(RL)是一种ML技术,其中代理试图通过与环境的交互进行学习。经典RL在视频游戏、棋盘游戏、机器人和自动驾驶车辆等领域展示了卓越的性能。
 
经典RL通常被表述为马尔可夫决策过程(MDP)。MDP支持对行动不确定的环境进行建模,即采取给定的行动可能导致多种可能的结果之一。因此,MDP对于建模许多实际问题非常有用,其中RL代理暴露于固有的不确定性中。MDP以一组状态s ∈ S为特征,一组动作a ∈ A(s)在每个状态s下可用,转移动力学指定在状态si采取动作a时获得状态sj的概率,以及回报函数R(si,A,sj)。重要的是,代理根据策略选择操作,该策略作为在任何给定状态下可用操作的概率分布进行维护。RL代理的目标是学习一个最优策略(选择最大化预期累积回报的行为),假设环境的转移动力学和回报函数都是先验未知的。
 
Dong等人在2005年[122]首次讨论了利用量子计算机执行RL,并在2008年进行了后续讨论[53]。在他们的方法中,环境中任何给定状态下的可能动作保持在量子叠加中,振幅放大用于增加在任何给定状态下测量良好动作的概率。2017年,Dunjko等人发布了一个量子RL框架,其中他们扩展了振幅放大方法,该方法假设可以访问代表环境的oracle[54]。此外,他们引入了更通用的学习模型元参数的技术,并且另外观察到,在基于量子搜索的加速之后,在幸运偏好的任务环境(即,幸运的代理比不幸运的代理更快地找到好的动作序列的环境)中,量子优势有着巨大的潜力。
 
在2021年的一篇论文中,Wang等人推导出了一种量子RL算法,该算法在各种参数上都比相应的经典算法有平方性能改进,用于评估MDP中的最优策略、状态值和状态动作对值(qvalues)[55]。他们解释说,这项工作适用于任何可以对环境进行经典模拟的RL问题,因为实现模拟器的经典电路可以有效地转化为量子电路。此外,最近的研究探索了在连续动作空间中使用变分PQC(参数化量子电路)实现RL和深度RL(DRL)[56,57]。
 
相关论文:
[53]D. Dong, C. Chen, H. Li, and T.-J. Tarn, “Quantum reinforcement learning,” IEEE SMC, 2008.
[54]V. Dunjko, J. M. Taylor, and H. J. Briegel, “Advances in quantum reinforcement learning,” in IEEE SMC, 2017.
[55]D. Wang, A. Sundaram, R. Kothari, A. Kapoor, and M. Roetteler, “Quantum algorithms for reinforcement learning with a generative model,” in ICML, 2021.
[56]S. Y.-C. Chen, C.-H. H. Yang, J. Qi, P.-Y. Chen, X. Ma, and H.-S. Goan, “Variational quantum circuits for deep reinforcement learning,” IEEE Access, 2020.
[57]S. Wu, S. Jin, D. Wen, and X. Wang, “Quantum reinforcement learning in continuous action space,” arXiv:2012.10711, 2020.
 
接下来,将介绍一些用例,展示如何在金融领域使用量子RL技术。
 
A.算法交易
 
在有限或无人为干预的情况下,通过考虑市场变量系统地执行金融工具交易的过程称为算法或自动交易。一般来说,算法交易是通过有监督的方式进行预测,然后在与相应预测和市场波动相关的不确定性下获得最佳交易决策。RL通过将算法交易转化为一个顺序决策问题绕过了对预测的需求,在该问题中,交易决策直接获得,从而在有限的时间范围内最大化累积收益。RL领域,更具体地说是DRL,已经证明了算法交易的巨大适用性。然而,这种用于自动交易的RL方法在某些强假设下运行,可以受益于量子ML技术,从而提高时间和模型复杂度。
 
算法交易可以归结为一个多期投资组合选择问题,包括在每个阶段重新平衡投资于选定资产的资本部分。已经有人尝试使用量子退火设备解决这一多阶段优化问题,以获得最优交易轨迹[130]。然而,该方法不采用任何基于策略或值函数近似的RL技术。由于当前量子设备的硬件限制,量子RL方法尚未直接应用于自动交易。然而,算法交易的组件肯定可以从量子RL提供的量子优势中获益。例如,用作q值估计器的LSTM神经网络结构[131]可能被量子LSTM[4]取代,以提高性能。此外,变分量子电路[57]可以用于不同的DRL组件,应用于算法交易的决策。
 
相关论文:
[4]S. Y.-C. Chen, S. Yoo, and Y.-L. L. Fang, “Quantum long short-term memory,” arXiv:2009.01783, 2020.
[57]S. Wu, S. Jin, D. Wen, and X. Wang, “Quantum reinforcement learning in continuous action space,” arXiv:2012.10711, 2020.
[58]G. Rosenberg, P. Haghnegahdar, P. Goddard, P. Carr, K. Wu, and M. L. De Prado, “Solving the optimal trading trajectory problem using a quantum annealer,” IEEE JSTSP, 2016.
[59]Y. Li, W. Zheng, and Z. Zheng, “Deep robust reinforcement learning for practical algorithmic trading,” IEEE Access, 2019.
 
B.做市商
 
做市商在金融市场中发挥着重要作用,因为它们增加了交易所的流动性,从而促进了交易和投资。做市商负责维护一组不同数量和价格的卖出订单(询价)和买入订单(投标)。当做市商持有的证券发出新的市场指令时,他们必须进行交易。因此,他们天生就承担风险,因为他们被迫获得的头寸可能随后贬值。做市商通过利用最低出价和最高出价之间的价差获利。
 
做市商适用量子RL,在量子RL中,问题可以用代理状态建模,考虑库存和风险承受能力等属性,以及代理仅具有部分信息(不一定是马尔可夫信息)的环境状态[60]。
 
相关论文:
[60]T. Spooner, J. Fearnley, R. Savani, and A. Koukorinis, “Market making via reinforcement learning,” arXiv:1804.04216, 2018.
 

自然语言处理(NLP)是与自动文本和语言分析相关的领域。大多数使用经典NLP的搜索引擎的一个缺点是它们只是理解单独的单词,而不是语法结构。这引发了分布式组合语义(DisCo)的研究。一种特殊的DisCo模型是CSC(Coecke, Sadrzadeh and Clark)模型[61,62],是基于量子理论启发的张量积合成。
 
在现代经典自然语言处理中,向量空间模型用于计算单个单词的含义。给定文本中的单个单词w,通过首先设置基本单词(即,文本中最常见的单词)来计算其含义,然后,对于w附近的每个基本单词,计算其在文本中的出现频率,从而计算其含义。两个单词的接近度是通过它们之间的相似性来衡量的,例如,使用它们的归一化代表向量的内积来计算。这些被称为分配方法,不能扩展到寻找长句的意义,因为两个句子通常不会重复。相比之下,基于组合语义的算法从组成词的已知意义推导出句子的意义。DisCo模型结合了这两种方法,将语法理解引入到词向量的组成中。
 
在CSC模型中,文本中的每种语法类型都根据某种语法分配一个张量积空间。例如,及物动词以主语名词作为左自变量,以宾语名词作为右自变量。名词的意义按照分配模型计算;其向量空间表示为N。因此,及物动词的意义是空间NL N中的张量,其中L是句子的意义空间(meaning space)。该模型的一个重要特征是对向量、张量和线性映射使用图解符号。该模型具有大张量积空间的计算挑战。即使存在经典方法如降维[63],为了避免计算全张量积,这些方法也会做出某些不一定总是满足的假设。
 
使用变分PQC在量子硬件上编码经典数据的最新进展使得量子NLP特别适用于NISQ设备。特别是,与经典的CSC模型相比,量子CSC模型可以更快地编码语言结构。它的量子加速源于用于DisCo框架中句子相似度计算的量子最近邻算法。如果满足一定条件,对于N维名词意义空间,已经提出的一种量子算法能够将任何由N个张量组成的CSC模型句子分类为M类,时间为O(√MN log(M)),这是对经典方法O(NM)复杂度的改进[64]。
 
相关论文:
[61]S. Clark, B. Coecke, and M. Sadrzadeh, “A compositional distributional model of meaning,” in QI, 2008.
[62]B. Coecke, M. Sadrzadeh, and S. Clark, “Mathematical foundations for a compositional distributional model of meaning,” arXiv:1003.4394, 2010.
[63]T. Polajnar, L. Fagarasan, and S. Clark, “Learning type-driven tensor-based meaning representations,” arXiv:1312.5985, 2013.
[64]W. Zeng and B. Coecke, “Quantum algorithms for compositional natural language processing,” arXiv:1608.01406, 2016.
 
下面是所讨论的量子NLP技术在金融领域的一些潜在应用。
 
A.风险评估
 
银行可以根据信用风险评估来量化成功偿还贷款的几率。通常,偿还能力是根据以前的偿还模式和过去的贷款偿还历史来计算的。但是这些信息并不总是可用的,尤其是对于银行存款不足的申请人。
 
NLP技术可以通过使用多个数据点来评估信用风险,从而解决这一问题。例如,NLP可以衡量商业贷款中的态度和创业思维。同样,它也可以指出不一致的数据,并对其进行更多的审查。更重要的是,在一些微妙的事情方面,例如贷款过程中贷款人和借款人的情绪,可以在NLP的帮助下结合起来[65,66]。
 
相关论文:
[65] L. Purda and D. Skillicorn, “Accounting variables, deception, and a bag of words: Assessing the tools of fraud detection,” Contemporary Accounting Research, 2015.
[66] I. E. Fisher, M. R. Garnsey, and M. E. Hughes, “Natural language processing in accounting, auditing and finance: A synthesis of the literature with a roadmap for future research,” ISAFM, 2016.
 
B.财务预测
 
财务预测基于许多宏观经济因素,这些因素是非结构化的,分散在不同的来源。这就是NLP技术被频繁使用的原因[67]。例如,NLP建议从财务角度将新闻文章分类为重要或非重要[68]。此外,情绪分析在交易者的决策中起着重要作用,它也在NLP技术的帮助下进行[69]。
 
相关论文:
[67]F. Z. Xing, E. Cambria, and R. E. Welsch, “Natural language based financial forecasting: A survey,” AI Review, 2018.
[68]S. Yıldırım, D. Jothimani, C. Kavaklıo˘glu, and A. Bas¸ar, “Classification of “hot news” for financial forecast using nlp techniques,” in Big Data, 2018.
[69]K. Mishev, A. Gjorgjevikj, I. Vodenska, L. T. Chitkushev, and D. Trajanov, “Evaluation of sentiment analysis in finance: From lexicons to transformers,” IEEE Access, 2020.
 
C.会计和审计
 
NLP的另一个应用是会计和审计[142],其目标是通过评估会计系统、监控内部控制、评估欺诈风险以及解释财务数据的异常趋势来发现和预防欺诈。NLP已被提议用于为财务会计准则创建语义知识库或树。此外,审计师还可以通过应用NLP技术检测财务报表中的异常情况。
 
相关论文:
[66] I. E. Fisher, M. R. Garnsey, and M. E. Hughes, “Natural language processing in accounting, auditing and finance: A synthesis of the literature with a roadmap for future research,” ISAFM, 2016.
 

本文介绍了量子ML技术及其在金融服务业中的应用。有七个机器学习任务已经提出了几种量子算法:回归、分类、聚类、生成学习、特征提取、顺序决策和自然语言处理。本文分析了各种量子ML技术提供的加速,并讨论了可以从量子加速中获益的金融应用。此外,在金融专用量子ML技术的文献仍然很少的情况下,本文提供了将最先进的通用量子ML技术应用于特定金融用例的见解。本文也考虑了在金融领域实施量子计算技术的现实,例如,考虑硬件限制所带来的挑战。
 
总之,本文是在NISQ时代及以后,利用量子ML技术丰富金融业的路线图。
 
摩根大通原文:
https://arxiv.org/pdf/2109.04298.pdf

—End—

相关阅读:
2021年值得关注的10家量子机器学习公司
谷歌在机器学习实现量子优势方面取得突破
3万字报告!金融中的量子计算
量子计算落地!一个插件,即可在Excel进行量子金融分析
金融工程的未来,量子计算
正面人工智能,反面量子计算
摩根大通提出首个适用于近期量子硬件的投资组合优化算法
趋势!20家大型银行正在探索量子计算应用
剑桥量子发布全球首个量子自然语言处理工具包和库

#诚邀共建国内首个量子垂直招聘平台#

光子盒将为中国境内的研究机构和企业提供一个免费的垂直招聘信息发布渠道,欢迎有需求的机构或企业直接联系光子盒。(微信:Hordcore)

你可能会错过:

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存