查看原文
其他

Nat. Rev. Phys.:金融领域的量子计算

光子盒研究院 光子盒 2023-11-30
光子盒研究院


量子计算机有望超越经典计算机的计算能力,并对众多行业领域产生变革性影响。

近期,在nature reviews physics上,来自摩根大通、美国、日本的科学家们全面总结了量子计算在金融应用领域的发展现状——尤其侧重于随机建模、优化和机器学习。
“Quantum computing for finance”,第一作者/通讯作者及主要成员来自摩根大通。

研究团队表示:“本评论面向物理学家,因此概述了金融业使用的经典技术,并讨论了量子技术的潜在优势和局限性。最后,我们将探讨物理学家可以帮助应对的挑战。”

核心观点

- 用于随机建模、优化和机器学习的量子算法适用于各种金融问题。


- 与经典方法相比,量子蒙特卡罗积分和梯度估计可提供四倍的速度提升,但要减少量子资源量以实现早期容错可行性和实际速度提升,还需要做更多的工作。


- 金融优化问题可以是连续的(凸或非凸)、离散的或混合的,因此可以应用这些问题的量子算法。


- 量子机器学习在经典问题上的优势和挑战在金融领域也很明显。



金融机构每天都要处理大量具有计算挑战性的问题。这些问题包括预测(从定价和风险估计到识别异常交易和客户偏好)和优化(如投资组合选择、寻找最佳交易策略和对冲)。

由于数学金融和计算技术的进步,以及金融业和科学界的贡献,现在,金融机构已经采用了一套多样化的问题解决工具,利用随机建模 、优化算法和机器学习(ML)模型来解决这两类问题。近年来,学术界和业界对探索量子计算是否可用于解决经典挑战性问题的兴趣与日俱增。研究人员和行业从业者已经为上述每种问题解决工具开发了各种量子计算算法。

例如,蒙特卡罗积分(MCI)的量子算法显示,与经典算法相比,其收敛速度有望提高四倍;这可大大改善风险建模,而 MCI 是风险建模不可或缺的工具。在优化和 ML 方面,最近的研究已经证明了量子算法在离散优化、动态编程、提升和聚类方面的优势,与最先进的经典算法相比,量子算法在问题规模的某些维度上显示出更好的复杂性

此外,科学家还开发并大量研究了各种启发式方法(通常使用涉及变量子电路的经典-量子混合方法)。初步结果表明,这些启发式方法比经典方法有所改进。由于这些算法大多普遍适用于各类问题,因此在金融应用中也具有类似的潜力。

尽管量子算法取得了显著进展,但要在具有商业相关规格的问题上实现端到端的量子优势,仍面临许多挑战。特别是,需要开展大量工作来减少算法某些组成部分的资源需求:如经典输入数据的量子嵌入、量子输出的读出以及预处理和后处理。否则,这些部分的复杂性可能会大大影响算法其他部分的速度提升。此外,目前的量子硬件仍处于初级阶段;现有的NISQ量子设备保真度低、量子比特数量少,严重限制了可解决的问题规模。因此,在硬件上执行量子电路往往需要在电路设计和编译层面进行大量优化工作,并依赖经典计算来找到最佳初始条件和减少错误。

这些挑战为解决端到端量子应用的瓶颈和设计硬件感知量子算法提供了研究机会;此外,在寻求量子提速时利用金融问题的丰富结构、为计算困难问题引入新的启发式算法以及改进经典启发式算法等方面,可能会发现更多机会。
金融问题的量子算法

在这篇综述中,实验团队对金融应用领域的量子算法现状进行了调查。科学家讨论了利用随机建模、优化和 ML 技术解决的重要金融问题;对于每个领域,团队都回顾了所使用的经典技术,并讨论了相关的量子算法是否有用。与以往著作相比,这篇评论从更全面的角度出发、讨论了更广泛的金融应用和最新的量子算法。


随机过程常用于对物理科学、生物学、流行病学和金融学中的现象进行建模。在金融领域,随机建模常用于帮助做出投资决策,通常以收益最大化和风险最小化为目标。描述市场状况的量(包括股票价格、利率及其波动率)通常用随机过程建模,并用随机变量表示。这种随机过程的演化受随机微分方程(SDE)的控制,随机建模的目的是求解某个相关随机变量的期望值(如金融衍生品在未来某个时间的期望收益)的随机微分方程,而期望值决定了衍生品的公允价值。

虽然在少数简单的情况下(如Black–Scholes欧式期权模型中使用的几何布朗运动),SDE 都有解析解;但绝大多数金融模型中的 SDE 形式都比较复杂,只能用数值方法求解。此外,即使在可以分析求解 SDE 的情况下,由于导数报酬规格的复杂性,除了最简单的欧式期权和某些亚 洲期权外,很难找到报酬矩的闭式精确解 。这些更复杂的报酬类型包括美式期权和障碍期权。如果所需的随机过程矩可以表达为可处理的微分方程,那么一种数值方法就是使用高精度的非随机方法来近似求解微分方程。高精度的代价是对随机过程维度的强烈依赖。或者,我们也可以使用 MCI,通过随机过程的方差来换取对维度依赖更弱的精度。

事实上,为金融问题计算的积分通常涉及随机过程,其方差不会像在更一般的情况下那样随维度呈指数增长。直接求解矩演化的偏微分方程(PDE)与通过抽样估计矩演化的偏微分方程(PDE)之间的二元性在Feynman–Kac公式中得到了体现。这两种方法即使在随机建模之外也可广泛应用,并引发了相应量子方法的发展。

1)基于蒙特卡罗定价和风险分析的量子方法

金融领域资产定价问题的一个重要类型是衍生工具的定价。衍生工具是一种合约,其价值来源于另一种被称为 “标的”的来源(如资产集合或金融基准),而标的价值是以随机过程为模型的。衍生品的价值通常是通过模拟标的物的动态并计算相应的报酬来计算的。在每个时间步长内,根据标的资产的当前和潜在历史状态,报酬函数计算合约所有者的现金流:报酬是一个简单的函数,在签订衍生品合同时就已确定。衍生工具的公允价值价格由贴现到当前日期的预期未来现金流或报酬给出。

传统上,我们可以使用模型模拟报酬率的随机过程,并用样本平均值估算衍生产品的价格——这就是 MCI 方法 ,它不对基础模型做任何假设,可以处理高维金融问题

根据切比雪夫不等式,实现估计误差 ε 所需的模型样本数量为O(σ22),其中 σ2是报酬过程的方差。然而,有一种量子算法(通常称为 QMCI)可以使用 O(σ/ε)个量子样本,以恒定的成功概率得出价格的ε估计值。

具体来说,假设标的物的状态以概率 p(ω)遵循从初始时间点到合约到期点的轨迹 ω∈Ω ,另外假设 f(ω) 是按比例在 [0, 1] 内的报酬函数,那么下面的操作给出了一个量子样本:

它由单位算子 Q 生成。

实现实用量子优势的一个必要条件是,Q 可以在与从 p(ω)生成经典样本的时间相当的时间内实现。此外,有人指出,当前量子纠错码的开销可能会阻碍二次加速的实现。好在大多数导数中的报酬函数形式简单,因此可以使用可逆算术技术来实现;此外,还有一些 QAE 变体可以降低电路深度。

为了实现 Q,人们开发了各种技术。具体来说,Grover-Rudolph 算法及其近似变体旨在解决可有效数值积分的负载分布问题(例如对数凹分布)。然而,有研究表明,当使用数值方法(如我们试图避免的经典 MCI)对分布进行积分时,QMCI 在使用这种状态准备技术时并不能提供二次加速。

对于加载一般的 L1 或 L2 归一化函数,已经提出了许多黑盒状态准备技术。这些算法首先以成功概率准备目标状态,然后使用振幅放大来提高成功概率。尽管这些算法具有普遍适用性,但当目标分布集中在几个值附近时,这些算法对加载函数的填充率(函数的相关规范除以该函数框边界的相应规范)的反向依赖性使得这些算法的效率大打折扣。还有人提出了非单元分布加载方法,不过如何将这些方法集成到 QMCI 中仍是一个未决问题。

此外,与其直接加载完整的报酬分布 p(ω),不如加载路径增量的联合分布,并使用算术引入必要的相关性。不过,这种方法需要的量子比特数量与时间步数成线性比例,而且量子算术运算的执行成本可能很高。因此,是否有避免大量算术运算且量子比特数量呈亚线性缩放的加载报酬分布的替代单元程序,仍然是一个未决问题。在只能近似模拟 SDE 的情况下,即使用局部波动模型时,时间离散化可能会给 MCI 算法的总体复杂度带来 O(1/ε)的额外乘法系数。为了解决这个问题,有人提出了多级 MCI,它能确保在报酬函数的某些假设条件下,整体算法仍能像单时步长 MCI 一样扩展到多对数因子。

有一种被称为准 MCI 的确定性经典方法,对于低维问题可以获得与 QMCI 类似的误差缩放;然而,这种方法的代价是对维度的指数依赖。有趣的是,由于尚未完全理解的原因,这种指数依赖关系在某些金融问题的实际应用中并没有出现。因此,在某些情况下可以获得类似的经典二次加速。

由于 QMCI 为广泛使用的 MCI 方法提供了可证明的查询复杂度提速,因此社会各界已经开始对各种类型的衍生产品定价进行特定的应用资源分析。

对于某些衍生品来说,评估预期收益可能会受到未来决策的影响,这可能会使定价过程大为复杂。美式期权就是这类衍生品的一个重要例子。美式看涨期权赋予持有者在今天(t=0)和到期日(t=T)之间的任何时间以固定价格 K(行 使价)买入标的资产的权利;在每个时间点 t∈[0, T],持有者必须通过比较[数学处理错误]的收益来决定是否行使期权。

St 是标的资产在 t 时的价格。与日后行使期权的预期收益进行比较,从而决定是否行使期权。美式期权定价属于更广泛的最优止损问题。美式期权价值的精确求解需要动态编程,因为要确定是否在 t 时刻行权,需要求解确定 t 之后行权的未来预期收益的子问题,即延续值。在金融领域,美式期权定价的近似解法通常是使用回归法预测延续值,并从到期点开始回溯 计算停止时间。这种技术被称为最小二乘蒙特卡罗。用于训练回归模型的标签通常使用 MCI 计算,也有使用 QMCI 的版本。

与衍生品定价相关的另一项重要工作通常是计算衍生品价格对模型和市场参数的敏感性,这相当于计算价格相对于这些输入参数的梯度。这种梯度通常被称为“期权希腊字母(Greeks)”。期权希腊字母可以系统地对冲在市场变动情况下持有衍生品合约的风险,因此是风险管理的重要工具。

传统上,Greeks 可以通过“碰撞与重定价”来计算,它将有限差分与 MCI 结合在一起。在报酬函数相对于相关输入参数的某些连续性条件下,当使用普通随机数进行 MCI 时,使用碰撞和重定价计算的希腊式可以达到与 MCI 所用样本数相同的均方误差收敛。因此,以 ε 精度计算 k 个期权希腊字母所需的样本数为O(kσ22)。有学者利用量子梯度方法,提出了计算希腊文的经典凸点与重定价方法的量子加速方法,实现了所需样本数量相对于 k 和 ε 的二次方减少。
在量子计算机上,也可以使用可逆算术来执行自动微分(AD)。当使用 AD 时,可以使用 QAE 来加快误差收敛。此外,还可以利用神经网络将 AD 与反向传播相结合,同时学习积分及其偏导数。虽然目前还不清楚使用神经网络的优势,但如果神经网络可以同时学习价格和希腊文,只需要O(σ22)个训练样本,那么它将优于碰撞加价格法。遗憾的是,目前的量子神经网络(QNN)架构在计算梯度时需要付出经典采样成本,这使得量子优势不太可能实现。

除了定价和期权希腊字母,量子神经网络还广泛应用于计算其他风险指标,这些指标涉及从随机过程中估计预期数量。与衍生品定价类似,QMCI 也可应用于这些任务,从而实现潜在的量子提速。具体来说,基于 QMCI 的量子方法已被证明可用于计算风险价值和信用风险

2)基于微分方程的定价和风险分析量子方法

如前所述,某些随机变量的期望值(其演化由 SDE描述)可以表述为抛物线 PDE的解。SDE 与 PDE 之间的这种联系使我们可以使用确定性方法研究随机过程。求解 PDE 的一种常用数值技术是有限差分法,该方法可将微分方程近似转化为离散网格点上的线性方程组。基于有限差分法的方法与量子线性系统算法(QLSA)相结合,用于求解多资产 Black-Scholes PDE。虽然在线性系统和数据访问模型条件的各种假设下,量子线性系统的求解对维度的依赖性呈指数下降,但从量子态读出解需要付出采样成本,这让人联想到经典和量子 MCI。

不过,与 MCI 相比,选择 PDE 求解方法可能仍然是有益的,因为有研究表明,前者可以更好地收敛由时间离散化引起的某些误差(例如在为障碍期权定价)。

对于二阶线性 PDE,可以将 PDE 转换为类似薛定谔方程的形式,并使用哈密顿模拟技术来模拟此类 PDE 产生的动力学。如果产生的演化是非单元演化,可能需要进行分块编码才能将其转换为单元演化。有研究表明,如果已知演化矩阵的所有特征值,那么与经典方法相比,模拟哈密顿动力学的速度可以达到指数级。然而,由于 PDE 的解被编码在量子态中,因此仍需要 QMCI 或 QAE 才能从 PDE 解中获得所需的量,从而增加了额外的开销。

变分量子模拟(VQS)也可用于将某些 PDE 的解模拟为量子态的演化。有研究表明,Black-Scholes PDE 可以做到这一点。随后,有团队将这一方法扩展到了更一般的Feynman–Kac PDE 及其变体,并讨论了美式期权定价(即Hamilton–Jacobi–Bellman方程)和随机波动模型的潜在适用性。

上述算法将解法编码为量子态,计算基态表示空间变量的离散值,振幅与函数的相应值成正比。然而,也有团队提出了另一种方法,即使用 QNN 作为 PDE 解的参数化解析器。通过梯度下降更新变分参数,以满足 PDE。这种方法需要注意的一点是,输入数据被编码为积状态。这样就有可能使用经典的内核方法实现更具表现力的模型版本。然而,人们认为变量子模型可以引入核方法无法实现的正则化,从而使将输入数据编码为单一乘积态的 QNN 具有潜在用途。

尽管 VQS 和 QNN 通常比 QLSA 耗费更少的资源,但在没有进一步实验的情况下,我们仍不清楚这些启发式技术是否有任何量子优势

大多数金融优化问题通常是具有连续变量、离散变量或两者兼有的高约束线性或二次方程程序。量子计算为解决此类问题提供了各种启发式方法和算法。

1)用于连续优化的量子方法

在连续优化中,问题的决策变量都是实值。凸编程是连续优化的一个领域,对于结构化问题存在各种高效的经典算法。结构化凸问题的著名例子是对称圆锥程序(SCP),如线性程序(LP)、二阶圆锥程序(SOCP)和半定式程序(SDP),它们经常出现在金融应用中。融资或现金流管理和套利检测是重要的金融线性优化问题。在短期融资问题中,目标是选择现金流(例如,具有固定回报率的资产或信贷额度)以匹配定期配额,同时使资产最大化。由于现金流或信贷义务的数额与持有的数额成正比,因此各种问题的约束条件都是线性的。

投资组合优化是指根据某些预定目标,从所考虑的资产池中选择一组最佳资产及其数量的过程。目标可以根据投资者对金融风险和预期收益的偏好而变化。现代投资组合理论重点关注风险与收益之间的权衡,以产生有效投资组合——即在一定风险下最大化预期收益。金融投资组合的预期收益和风险通常可以分别通过观察投资组合收益的均值和方差来模拟。投资组合优化的问题设置可以表述为受约束的效用最大化:

考虑到 SCP 的经典求解效率很高,量子加速在实践中的余地很小。不过,由于基本线性代数子程序(BLAS)的快速量子算法的存在,在问题维度的最坏运行时间方面还是观察到了量子降低。然而,量子 BLAS(QBLAS)有三个值得注意的问题,使得比较量子和经典的最坏情况复杂性具有挑战性。

- 首先,QBLAS 对矩阵的频谱进行操作,因此对矩阵的调节具有多项式依赖性,而这种依赖性通常只出现在经典的迭代算法中。
- 其次,从量子设备检索数据需要采样,因此会产生经典采样成本,而这种成本与所需误差关系不大。
- 最后,这些算法需要访问量子叠加中的经典数据,而只有在输入矩阵稀疏的某些情况下,才能在没有量子存储器的情况下高效完成。

求解 SCP 的经典技术分为两类:一类是与问题规模相关性较好的技术,另一类是与求解误差相关性较好的技术。第一类主要由矩阵乘权元算法(MMW)主导。可以看出,一般 SDP 求解的复杂度为:

其中 m 是约束数,n 是变量数,s 是稀疏度,γ 是期望误差的函数。

由于 MMW 对所需问题误差的依赖性已经很低,并且假定矩阵稀疏,量子 MMW 可能不会受到 QBLAS 的限制。虽然 MMW 在求解金融领域的 SCP 方面尚未得到广泛研究,但作为 MMW 特例的标量乘权更新法却得到了广泛研究。在线投资组合优化算法可根据市场变化调整投资组合选择,已受到量子计算界的关注。

标量乘权框架还被用于产生估计双人零和博弈纳什均衡的亚线性算法\,这是一种简单矩阵博弈。Gibbs采样的量子算法已被用于求解零和博弈的维度依赖性的四次降低。这些算法已被应用于从市场数据和衍生品定价中估算马氏计量的任务。此外,量子振幅放大技术还被用于对一类更通用的矩阵博弈以乘法权重和在线镜像下降的初等二元方式求解的经典亚线性算法进行维度依赖性的二次缩减,并应用于内核分类器的训练。

第二类算法被称为多项式时间方法,由内点法(IPM)和切割平面组成。理论上,这类算法中解决一般 SDP 最快的方法是基于切割平面的方法,而 IPM 是解决 LP和 SOCP最快的方法。遗憾的是,这些量子 IPM 与 QBLAS 都存在上述三方面的问题。经典 IPM 可以在对数依赖矩阵条件的多项式时间内实现,即通过经典算术实现;量子算法付出的经典采样成本有效地抵消了经典 IPM 的良好误差依赖性,只能近似地求解牛顿系统。研究表明,这导致量子 IPM 只能近似解决原始优化问题;对简单组合优化问题的资源估算表明,量子 IPM 缺乏优势。

目前,量子计算是否能为一般的结构凸程序(而不仅仅是金融程序)带来优势,似乎仍是一个悬而未决的问题。不过,对于条件良好、具有稀疏性或能获得足够量子内存的问题,在实际问题上可能会实现提速。不过,这些问题已经可以通过经典计算快速解决。

2)用于离散优化的量子方法

金融领域的许多优化问题都要求解决方案从离散集合中取值,而不是连续。这方面的例子包括一些最常见的金融优化问题,如投资组合优化。在许多投资组合优化问题中,凸优化的最优解可能会建议分配零碎单位的资产,而市场约束往往要求这些资产的头寸是固定增量的整数或倍数。这些金融用例要求使用离散优化方法或整数编程,其中需要优化的变量仅限于整数,更一般的是混合整数编程(MIP),其中部分变量为整数。

在资产组合优化问题中,资产头寸的典型值远大于允许的最小增量,通过弛豫得到的近似最优解往往只需稍加修改即可接受。股票投资组合通常就是这种情况,其最小持股量为一股,而持股量通常至少大两个数量级。然而,固定收益市场和衍生品市场通常需要更大的单位交易规模,这就使得弛豫问题的近似解质量不能令人满意。因此,这些问题往往需要借助离散优化技术。

分支与边界(B&B)方法是一类强大的算法,可用于解决 MIP 等困难优化问题,并可提供最优性证书或最优性差距。最优性差距是已知最优解与已知边界之间的差值。B&B 是大多数商业求解器的核心算法,因此被金融机构普遍采用。

量子行走搜索(QWS)是加速经典搜索算法的强大框架,已被应用于金融领域的重要优化算法。值得注意的是,量子行走的总体框架还能使模拟对称马尔可夫链的时间最多减少四次方,这可能适用于模拟金融中出现的随机过程。在这个方向上已经取得了进展,集成了深度优先搜索启发式算法,最近又集成了一大类实用启发式算法。然而,与用于随机建模的量子 MCI 相似,考虑到解决子问题所需的资源,目前尚不清楚是否能实际缩短解决问题的时间。

模拟退火(SA)是一种广泛应用于组合优化的马尔可夫链蒙特卡罗(MCMC)方法。量子行走已被用于四次降低精确解渐近收敛时间的谱差距依赖性。不过,一般来说,量子对所有参数的依赖性是否能比经典 MCMC 的依赖性更好,甚至与经典 MCMC 的依赖性相匹配,目前还不清楚。

也有科学家在Grover算法的基础上开发了一个框架,该算法是 QWS 的一个特例,利用全局问题信息进行非结构优化。该算法是 QWS 的特例,利用全局问题信息进行非结构优化。虽然量子非结构化搜索的查询复杂度比经典非结构化搜索提高了四倍,但其资源效率却不如基于量子漫步的技术,因为后者依赖的是局部信息而非全局信息。在离散优化方面,无约束搜索空间上的均匀叠加可以用较低的门复杂度来准备,对于 NP 优化问题,检查约束和评估代价函数的神谕可以用高效的门复杂度来实现。

最后,还有短路径算法,它利用量子漫步中的技术、并利用特定问题的信息,在某些离散优化问题上实现了优于基于Grover算法的提速。

除了各种经典算法的量子化版本,还有量子启发式算法。这些算法包括量子退火和变分量子算法:量子近似优化算法 (QAOA)、变分量子优解器 (VQE) 和 VQS。一般来说,这些方法可以自然地处理无约束二元优化问题,但也被应用于连续优化问题。至少在通用数字量子计算机上实现时,可以有效限制这些量子启发式算法的演化,以尊重二元变量约束。

变分量子算法通常难以调整变分参数和超参数,而这本身就是 NP 难题。此外,对于某些初始化,即使模型远未收敛,参数的梯度也可能消失,这就需要指数级数量的样本来估计它们。不过,VQE 的收敛性已在过参数化机制中得到证实——即使梯度呈指数级小。

虽然现有的量子退火设备规模较大,无需满足通用设备的容错要求,但量子退火的整体效益仍有待确定。量子隧穿可以穿透高而薄的势垒;然而,我们不可能事先知道实际问题中出现的势垒是否允许隧穿。对于具有多类变量的高约束金融优化问题,将问题转化为无约束二次优化问题往往代价高昂,尤其是在量子比特数量有限的情况下。不过,由于有了相对较大的量子退火器,科学家已经开始尝试应用,如投资组合优化。

最后,与 VQE 和 VQS 相比,QAOA 还具有其他优势:例如,每层只使用两个参数,理论和数值结果表明它能够在问题实例之间转移优化参数。此外,在某些情况下,可以使用量子电路模拟器以经典方式高效地进行参数优化。

3)动态编程的量子方法

在某些优化问题中,做出后续决策所需的信息只有在做出中间决策后才会显示出来。因此,在这种情况下,必须按顺序做出决策,而且最优策略必须同时考虑当前和未来的决策。解决这些决策问题往往需要动态编程,即通过将主要问题简化为一系列更容易解决的较小子问题来递归解决问题。

动态编程问题在金融领域也很常见。除了美式期权定价问题,动态编程在金融领域出现的另一个重要地方是抵押按揭债券(CMOs)的结构设计。CMO 将抵押贷款捆绑在一起,并将其现金流重新安排为多个“档次”,按顺序支付。CMO 的发行人通常对这些分期付款的最佳付款时间表(结构)感兴趣,以尽量减少对 CMO 所有者的付款义务,这需要递归求解,因为第 k 期付款的最佳开始和结束时间取决于前 k - 1 期付款的最佳时间表。

虽然还没有针对 CMO 结构和其他类似金融问题的量子解决方案,但已经提出了量子算法,用于降低各种 NP-完全问题的指数时间动态编程的指数依赖性。
涉及概念梳理

ML领域已成为金融业各种应用的重要组成部分。例如,丰富的历史金融数据和 ML 的进步使得训练复杂的模型成为可能,以检测股票市场的模式、发现金融交易中的异常值和异常现象、自动对金融新闻进行分类和归类以及优化投资组合。

用于 ML 的量子算法可进一步分为加速经典技术的方法(通常通过应用 QBLAS)和量子原生算法(试图利用量子模拟的经典难解性来建立更具表现力的模型)。前者通常需要一台纠错量子计算机,而后者可能不需要,而且更接近现实。

-加速经典算法的方法需要克服上一节提到的量子线性代数的各种限制。最明显的限制是数据加载,不幸的是,这些算法大多在量子存储器的环境下工作;目前还不清楚能否构建这样的设备。此外,各种方法只有在数据具有低阶近似值时才会提速,而在这种情况下,提速并不像人们曾经认为的那样是指数级的。不过,仍有一些量子 ML 算法不依赖于这种低阶假设。要确定经典 ML 问题的指数级加速是否仍有可能通过量子计算实现,还需要进一步研究

量子原生模型,如 QNN、量子玻恩机(quantum circuit Born machine,QCBM)和量子核方法,规避了 QBLAS 的问题,而且在经典模拟中可能难以实现;但是,目前还不清楚它们是否能为经典问题带来优势。具体来说,虽然这些方法的表达能力更强,但只有在涉及量子过程产生的数据问题时才显示出优势;此外,初步的数值证据表明,这并不能延伸到经典问题。参数化量子方法(如 QNN)的训练一般具有挑战性,而且目前的反向传播算法不如经典 NNN 高效。虽然目前看来,使用量子原生方法在经典问题上取得量子优势的可能性不大,但要确定这一点,仍需进行大量算法研究。此外,随着量子硬件的进步,人们最终将能在实际问题上对这些启发式算法进行基准测试。

1)用于回归的量子方法

回归是根据训练数据集拟合数值函数的过程。这一过程通常用于了解属性变化时数值的变化情况,也是经济预测的重要工具。

例如,回归模型可用于资产定价和波动率预测。最小二乘法是最广泛采用的回归模型之一,相应的量子算法也已被提出。此外,量子退火也被用于求解二次无约束二元优化的最小二乘回归。除了最小二乘法,高斯过程回归是另一种应用于金融领域的技术,但它的经典运行时间较慢。有学者提出了一种基于 QLSA 的算法,对于某些稀疏、高阶核的高斯过程回归,该算法可以获得指数级的速度提升。另一项研究使用了带有量子特征图的 QNN,该特征图可将经典输入数据编码为具有可配置参数的单元。

这项技术被称为量子电路学习 ,数值显示它可以实现低深度电路,从而为金融量子算法提供了重要的应用机会。

2)用于分类的量子方法

分类是将对象归入预定组的过程。这类过程也称为模式识别。在风险管理和大型数据处理中,当群体信息特别重要时,例如在信用度识别和欺诈检测中,可以有效利用这一领域的 ML。

有许多著名的经典分类算法,如线性分类、支持向量机 (SVM)、最近中心点和基于神经网络的方法。量子算法可以作为子程序来加速现有的经典算法。或者,也可以开发此类算法的量子版本。这两种情况都有可能使金融应用受益。有人提出了用于训练线性和基于内核的分类器的亚线性量子算法,该算法对训练具有恒定边际的分类器有四次改进。

基于欧氏距离和汉明距离的量子近邻分类算法也得到了研究。有文献提议使用量子 k 最大值搜索算法来寻找 k 个近邻,并使用保真度和内积作为相似性度量。各种类型的 QNN 也被应用于分类任务,现在,提高经典神经网络推理或训练复杂度的量子算法也已开发出来。

3)用于提升(boosting)的量子方法

提升算法利用对弱学习算法的查询(弱学习算法生成的模型的分类或回归效果往往略好于随机猜测)来构建强学习器,从而实现任意低的预测误差。

自适应提升算法(AdaBoost)是第一个提升算法,可以看作是乘法权重更新方法的一个实例。AdaBoost 复杂性中的一个组成部分是与弱学习者的 Vapnik-Chervonenkis (VC) 维度的线性关系。有团队展示了 AdaBoost 算法的量化方法,有望将对 VC 维度的依赖性降低到二次方;然而,其代价是边际对随机猜测的依赖性大大降低。另一种方法量化了 Smooth boost 算法,该算法保证了 VC 依赖性的类似二次方降低。这两种方法的一个主要局限是,它们都需要访问量子实例,这就需要准备对训练数据分布进行编码的量子态。

最后,还有 QBoost 框架——该框架建议使用离散优化的量子启发式来选择弱分类器的线性组合,并已应用于金融风险检测。

其中一种非常流行的提升形式被称为梯度提升,其高性能实例化被称为极端梯度提升(XGBoost)。目前,梯度提升似乎还没有任何量化方法。鉴于提升法具有明显的通用性,这些模型已被广泛应用于金融领域的 ML 应用。特别是,提升法已被应用于预测,如衍生品定价、金融危机预测、信用风险评估和波动率预测。

4)用于聚类的量子方法

聚类或聚类分析是一种无监督的 ML 任务。它探索并发现数据的分组结构。在金融领域,聚类分析可用于开发一种交易方法,帮助投资者建立多样化的投资组合;它还可用于分析不同的股票,从而将收益相关性高的股票归入一个“篮子”。

经典的 k-means 聚类算法(又称Lloyd算法)可以利用量子计算来加速 k-means 的一个步骤,有文献表明,k-means 的一个步骤可以通过使用按下式比例缩放的查询次数来完成:

其中,M 是数据点的数量,N 是向量的维度,ε 是误差。虽然直接的经典方法需要 O(kMN),但量子解决方案在合理的假设条件下要好得多,比如算法的查询次数与特征数量无关。

另一种方法提出了 q-means,它是 k-means 的扰动版本(称为 δ-k-means)的量子等价物。q-means 算法的运行时间与数据点的数量呈多对数关系。有人提出了使用量子计算的中间规模 k-means 聚类的噪声量子版本、期望最大化的量子版本,期望最大化是无监督 ML 中常用的工具。也有学者在高斯混合物模型量子期望最大化算法的基础上,开发了另一个版本的 k-means 聚类。

谱聚类是另一种取得巨大成功的经典聚类方法。不过,它的运行时间增长很快,为 O(N3),其中 N 是数据集中的点数。有文献利用相位估计和 QAE 在量子计算机上进行谱聚类,更有建议将聚类问题简化为优化问题,然后通过 VQE 结合非正交量子比特态来解决。

5)用于生成学习的量子方法

无监督生成学习是深度学习研究的前沿。生成学习的目标是对观测数据的概率分布进行建模,并据此生成新样本。实现潜在量子优势的最有希望的方面之一在于量子计算机的采样优势,特别是考虑到金融领域的许多应用需要从复杂分布中生成样本。因此,需要进一步研究用于金融的生成量子 ML。

QCBM直接利用量子波函数固有的概率解释,用量子纯态代替热分布来表示概率分布。数值模拟表明,在学习分布的任务中,QCBM 至少能与受限玻尔兹曼机的性能相媲美,而且随着模型规模的扩大,QCBM 还能表现出更优越的性能。
波尔兹曼机是一种无向概率图形模型,灵感来自热力学。

QCBM 也被用于建立 copulas 模型。有学者建议将训练和采样阶段分开,并用数值表明概率分布可以高效地训练和采样,而 SDE 可以作为这种可训练量子模型的微分约束。

贝叶斯网络是概率图形模型 ,通过有向无环图表示随机变量和条件依赖关系,其中每条边对应一个条件依赖关系,每个节点对应一个唯一的随机变量。这类图的贝叶斯推理有很多应用,如预测、异常检测、诊断、不确定性推理和决策。虽然精确推理是 #P 难的,但使用量子技术可以在某些参数上实现二次加速。将这一问题映射到量子贝叶斯网络似乎是可行的,因为量子力学自然描述了一种概率分布。在金融领域的潜在应用包括投资组合模拟和决策建模。

经典的推理方法通常是使用 MCMC 方法从模型的均衡分布(玻尔兹曼分布)中采样。由于一般玻尔兹曼机的分区函数难以处理,因此图结构通常是双分区的,这就产生了受限玻尔兹曼机。量子波尔兹曼机是通过量子退火实现的;此外,还设计了一种基于门的变分方法,使用变分量子虚时演化。

生成式对抗网络(GAN)是经典 ML 的有力工具:生成器试图创建模仿真实数据集的数据统计,而判别器则试图判别真假数据。有学者引入了量子 GAN 的概念,其中的数据由量子态或经典数据组成,生成器和判别器配备了量子信息处理器。作者指出,当数据由高维空间上的测量样本组成时,量子对抗网络与经典对抗网络相比可能会表现出指数级的优势。量子 GAN 已被用于学习和加载随机分布,并可促进金融衍生品定价。

6)量子特征提取方法

特征提取技术旨在对原始训练数据进行预处理,以识别重要成分、将数据转换到更有意义的表示空间或降低维度。然而,有时这会导致数据被修改得无法为人类所解读,这使得此类技术难以在高度监管的金融行业中使用。因此,对于金融业来说,找到高效、有用且可解释的特征提取方法非常重要。一种特别简单的算法是主成分分析(PCA),它可以在线性流形上找到数据的低维表示。人们提出了各种量子版本的 PCA,所有这些算法都在量子叠加中对主成分进行编码。与大多数使用 QBLAS 的技术类似,从量子输出中获取有用的经典信息尤其困难。不过,我们可以将结果反馈给其他基于量子线性代数的 ML 模型。

量子界对拓扑数据分析,特别是持久同调的兴趣激增。在实际应用中,与经典算法相比,密集clique复合体的潜在速度提升最多可达多项式。此外,各种量子优化启发式方法可用于组合特征选择——即根据某种重要程度选择输入特征的子集。

7)强化学习的量子方法

强化学习(RL)是 ML 的一个领域,它考虑的是代理如何在环境中采取行动以最大化其回报。它已被应用于许多金融领域,包括或有债权的定价和对冲、投资组合分配 、市场摩擦下的自动交易 、做市、资产负债管理 以及税收后果的优化。

当人们可以访问状态或行动空间时,例如,通过量子“神谕”访问马尔可夫决策过程,已经有一系列研究将量子算法应用于 RL。

经典 RL 的前沿研究主要集中在近似设置上,利用深度神经网络处理状态和行动空间,否则表格 RL 方法将难以处理264。在这种情况下,量子算法(例如 QNN)的优势似乎并不明显,这与变量子模型用于有监督或无监督模型的情况类似。不过,这方面已经有了一些研究成果。

8)去量化算法(dequantized algorithms)

当不需要高精度时,这些量子启发算法可提供潜在优势,并可应用于金融应用。尽管这些算法在很大程度上驳斥了最初宣称的 ML 指数级量子提速,但它们有可能为高维金融问题提供有用的算法灵感。

量子计算机有望超越经典计算机的计算能力,为现实世界的应用提供更快的速度。

正如本评论所述,金融业需要处理各种具有计算挑战性的问题,而这些问题有许多适用的量子算法。在 MCI 等某些黑盒设置中,已经发现了有望证明的量子优势。然而,这些针对随机建模、优化和 ML 提出的方法是否能在实际问题中转化为端到端的量子优势,目前仍不清楚。在金融领域,计算时间和准确性往往会直接转化为解决问题的业务盈亏,因此,新计算形式可能带来的任何实际壁钟速度提升和相关模型性能改进都会对金融业产生巨大影响。例如,快速准确地评估衍生品交易中的风险指标,对于有效规避风险至关重要,尤其是在市场动荡的情况下。欺诈检测显然是金融业另一个时效性很强的用例,因为及早准确地发现欺诈活动可以避免对金融机构造成潜在的重大经济损失和声誉损害。

因此,金融业完全有能力成为量子计算的早期采用者,并在计算金融领域充分利用量子计算的优势。

最后,如果现有的量子硬件和架构挑战能得到解决,将有利于金融应用中的量子算法。如前所述,状态准备,特别是加载编码经典概率分布的量子态,是随机建模量子算法所需的一项常见任务。可以降低状态准备复杂度的一个潜在硬件特性是本机多控门,已经有人提出了在冷原子、捕获离子和超导量子比特等各种架构中实现了本机多控门。

同样,变分量子算法也可受益于本地多量子比特门。特别是在求解高阶组合优化问题时,变分量子优化算法(如 QAOA)往往需要多体相互作用,而这种相互作用可以编码为参数化的多量子比特纠缠门。因此,本机访问此类多量子比特门将有助于降低这些算法的电路复杂度。除了多量子比特门,更多的本机双量子比特相互作用也能让我们更高效地实现用于受限问题的 QAOA 混频器。如“优化”部分所述,金融问题通常是高度受限的。此外,利用各种本机纠缠门还能促进量子 ML更高效电路的设计与实现。

相干量子运算对金融领域的量子算法也大有裨益。具体来说,随机建模的量子算法和量子优化算法的实现很可能需要大量的可逆运算。因此,随着高效量子浮点运算技术的发展,这些算法的量子比特数要求可能会降低。

量子存储器是另一个可大幅提高金融量子算法可行性的硬件特性。大多数用于连续优化和 PDE 求解的算法都可以使用经典写入、量子读取的存储器。然而,最近有研究强调,现有的量子存储器技术存在根本性的限制,使得实现低成本、可扩展、无主动纠错的量子存储器极具挑战性。因此,可能需要新的量子存储器架构来克服这些限制。

此外,与经典计算机相比,当前量子硬件的运行速率要慢得多;这也是许多量子算法实际可用性的限制因素。例如,用于 ML 的量子变分算法需要大量高质量的电路评估来通过采样估计梯度。因此,提高量子计算机的门操作速度将减少量子算法的开销,从而有可能使量子算法在更大的问题规模范围内具有优于经典算法的优势,而不仅仅是在渐近机制下。通常观察到,在“自然原子”(如捕获离子)中编码的量子比特能产生高保真的门操作,但速度通常很慢。相比之下,超导量子比特等“人造原子”虽然速度快,但保真度低。要在金融应用中有效利用近期量子设备,将这些方面结合起来至关重要。

此外,目前的量子纠错技术会带来巨大的额外开销,可能会抵消某些量子金融的速度提升。因此,继续研究改进纠错和量子架构对于实现量子计算在金融领域的商业应用也至关重要。

文章的最后,撰文团队表示:“我们希望本综述能突出强调,除了硬件技术方面的挑战外,要实现现实世界中的量子优势,仍有许多有趣的量子算法挑战需要克服。随着量子硬件的进步,我们希望能够在有趣的问题上对更复杂的量子算法,尤其是启发式算法进行基准测试。”

相关阅读:
量子计算在金融领域的应用 | 综述荐读
量子 & 金融,将改变游戏规则?
摩根大通:“量子机器学习”优化金融风险建模
金融时报:量子计算不可避免,但泡沫仍存
美国「量子联盟倡议」最新报告:量子攻击,将带来下一轮金融危机

#光子盒视频号开通啦!你要的,这里全都有#

每周一到周五,我们都将与光子盒的新老朋友相聚在微信视频号,不见不散!


|qu|cryovac>
你可能会错过:|qu|cryovac>

|qu|cryovac>
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存