查看原文
其他

量子机器学习的挑战与机遇 | 综述荐读

光子盒研究院 光子盒 2023-04-26
光子盒研究院出品


在机器学习和量子计算的交叉点上,量子机器学习有可能加速数据分析,特别是量子数据,在量子材料、生物化学和高能物理方面有应用。然而,关于量子机器学习模型的可训练性仍然存在挑战。


因此,美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory,LANL)团队在《自然 · 计算机科学》杂志上,回顾了当前量子机器学习的方法和应用。




现在,作为通信技术基础的香农信息理论已被推广到量子香农理论(或量子信息理论),为量子效应使信息传输更有效率提供了可能。
生物学领域已经扩展到量子生物学,以便更深入地了解生物过程,如光合作用、气味和酶催化作用。图灵的通用计算理论已被扩展到通用量子计算,有可能导致物理系统的模拟速度成倍增长。
本世纪最成功的技术之一是机器学习(ML),其目的是对大型数据集进行分类、聚类和识别模式。学习理论与ML技术同时发展,可以了解和改进量子科技。支持向量机(support vector machines, SVM)、神经网络和生成式对抗网络等概念对科学和技术产生了深远的影响。ML现在已经根深蒂固地融入社会,以至于对ML的任何根本性改进都会带来巨大的经济利益。
与其他经典理论类似,ML和学习理论实际上可以嵌入到量子力学形式中。从形式上讲,这种嵌入产生了量子机器学习(QML)领域,其目的是理解物理定律所允许的数据分析的终极极限。实际上,量子计算机的出现,希望在数据分析中实现量子优势,这是使QML如此令人兴奋的原因。
QML的任务。QML通常被考虑用于四个主要任务;左上:张量网络是量子启发的经典方法,可以分析经典数据。右上:来自量子系统的单位时间演化数据U可以经典地编译成量子电路。左下:手写的数字可以映射到量子态,在量子计算机上进行分类。右下:分子基态数据可以直接在量子计算机上进行分类。图中显示了基态能量E对原子间距离d的依赖性。
量子计算利用纠缠、叠加和干涉来执行某些任务,其速度比经典计算大幅提高,有时甚至是指数级的。事实上,虽然已经观察到一个设计好的问题有这样的提速,但对于数据科学来说,即使在理论层面,达到这样的提速仍然是不确定的,但这是QML的主要目标之一。
QML的关键应用。QML已经被设想为在许多应用中带来计算优势。QML可以加强 化学的量子模拟(例如,分子基态、平衡态和时间演化)和材料科学(例如,量子相识别和考虑到目标属性的生成设计)。QML可以通过学习量子纠错码和综合征解码器、执行量子控制、学习错误抑制、以及编译和优化量子电路来增强量子计算。QML可以增强传感和计量学,并从量子系统中提取隐藏参数。最后,QML可以加速经典的数据分析,包括聚类和分类。
我们可以推测,上图中所示的所有领域都将受到QML的影响。例如,QML将可能有利于化学、材料科学、传感和计量、经典数据分析、量子纠错和量子算法设计。其中一些应用产生的数据本身就是量子力学的,因此将QML(而不是经典ML)应用于它们是很自然的。
虽然经典和量子ML之间有相似之处,但也有一些区别。因为QML采用了量子计算机,这些计算机的噪声可能是一个主要问题。这包括硬件噪声,如退相干,以及对量子状态的测量所产生的统计噪声(即射击噪声)。这两种噪声源都会使QML的训练过程复杂化。此外,由于量子变换的线性,经典ML中自然的非线性操作(例如,神经激活函数)需要对QML模型进行更仔细的设计。
对于QML领域,近期的目标是在数据科学应用中展示量子优势,即超越分类方法。要实现这一目标,需要对哪些应用能从QML中获益最大保持开放的心态(例如,可能是一个本身就是量子力学的应用)。还需要了解QML方法如何扩展到大问题规模,包括分析可训练性(梯度扩展)和预测误差。高质量量子硬件的可用性也将是至关重要的。
最后,我们注意到,QML提供了一种思考既定领域的新方法,如量子信息论、量子纠错和量子基础。从数据科学的角度来看待这些应用可能会带来新的突破。
a)经典数据x,即猫的图像和狗的图像,通过某种映射x → |ψ(x)〉被编码到希尔伯特空间。理想情况下,不同类别的数据(这里用点和星表示)被映射到希尔伯特空间的不同区域。b)量子数据|ψ〉可以直接在量子设备上进行分析。这里的数据集由代表金属或超导系统的状态组成。c)数据集被用来训练QML模型。QML的两个常见范式是QNN和量子内核(quantum kernels),这两个范式都允许对经典或量子数据进行分类。d)一旦模型被训练好,它就可以用来进行预测
如上图所示,QML可以用来从经典数据或量子数据中学习,因此我们首先对这两种类型的数据进行对比。经典数据最终被编码为比特,每个比特都可以处于0或1的状态:这包括图像、文本、图表、医疗记录、股票价格、分子的属性、生物实验的结果和高能物理实验的碰撞痕迹。量子数据被编码在量子比特中,称为量子比特(或高维类似物)。
一个量子比特可以由状态|0⟩、|1⟩或这两者的任何归一化复数线性叠加来表示。在这里,状态包含从一些物理过程中获得的信息:如量子传感、量子计量、量子网络、量子控制,甚至量子模拟数字转换。
原则上,所有的经典数据都可以在量子系统中有效地编码:一个长度为n的经典比特串可以很容易地编码到n个量子比特上。然而,反之却很难,因为人们无法在比特系统中有效地编码量子数据;也就是说,一般的n个量子比特系统的状态需要(2n - 1)个复杂的数字来指定。

因此,量子比特系统(以及更普遍的量子希尔伯特空间)构成了最终的数据表示媒介,因为它们不仅可以编码经典信息,而且可以编码从物理过程中获得的量子信息。
我们希望QML模型能够通过访问量子系统中的“量子”来解决学习任务。在不久的将来,量子数据的可用性将大大增加。仅仅是人们会使用现有的量子计算机这一事实,就会在逻辑上导致更多的量子问题被解决和量子模拟被执行。
这些计算将产生量子数据集,因此,有理由期待量子数据的迅速崛起。不过,在短期内,这些量子数据将以准备数据集的量子电路的有效描述形式存储在经典设备上。
最后,随着我们对量子技术控制水平的提高,可能会实现量子信息从物理世界到数字量子计算平台的连贯转换。这将在量子力学上模仿来自物理世界的经典数据的主要信息获取机制,这就是模拟-数字转换。此外,我们可以预期,实用的量子纠错和量子存储器的最终出现将使我们能够将量子数据存储在量子计算机中。

分析和学习数据需要一个参数化的模型,许多不同的模型已经被提出用于QML。
与经典的ML类似,存在几种不同的QML范式:监督学习(基于任务)、无监督学习(基于数据)和强化学习(基于奖励)。虽然这些领域中的每一个本身都是令人兴奋和蓬勃发展的,但监督学习最近因其实现量子优势的潜力、对噪声的弹性和良好的泛化特性(generalization properties)而受到相当大的关注,这使其成为近期应用的有力候选者。
1)量子神经网络
QML模型中最基本和关键的成分是参数化量子电路(parameterized quantum circuits, PQC)。这些涉及到一系列作用于量子数据状态|ψj〉的单元门,其中一些有自由参数θ,将被训练来解决手头的问题。PQC在概念上类似于神经网络,事实上这种类比可以被精确化:也就是说,经典的神经网络可以被正式嵌入PQC中。这使得研究人员将某些类型的PQC称为QNN。在实践中,只要PQC被用于数据科学应用,就会使用QNN这一术语。
QNN在上述三种QML范式中都有应用。
- 在监督分类任务中,QNN的目标是将不同类别的状态映射到希尔伯特空间的可区分区域;
- 在无监督学习方案中,一个聚类任务被映射到一个最大割问题 (Max-cut Problem)上,并通过训练一个QNN来解决类之间的最大距离。
- 在参强化学习任务中,一个QNN可以被映射为一个最大割问题,并通过训练一个QNN来实现类间距离的最大化。
QNN架构的例子。a)耗散QNN(dissipative QNN)的量子电路图;b)标准的QNN。在这个QNN中,量子数据状态通过一个量子电路被发送,在这个电路的末端,一些或所有的量子比特被测量;c)卷积式QNN。
2)量子核方法(Quantum kernels)
作为QNN的替代方法,研究人员已经提出了量子版本的核方法。核方法将每个输入映射为高维向量空间的一个向量,称为再现核希尔伯特空间。然后,核方法在再现核希尔伯特空间中学习一个线性函数。再现核希尔伯特空间的维度可以是无限的,这使得核方法在表达能力方面非常强大。
量子核方法考虑使用量子计算机计算核函数,有许多可能的实现方式。

3)归纳偏置(Inductive bias)
对于QNN和量子核方法来说,一个重要的设计标准是它们的归纳偏置。用QML实现量子优势的一个方面是以QML模型的归纳偏置为目标,而用经典模型来模拟是没有效率的。
一般来说,归纳偏置包括在模型设计或优化方法中的任何假设,这些假设使潜在模型的搜索偏向于所有可能模型集合中的一个子集。
最终,来自ML模型设计的归纳偏置,结合训练过程的选择,是决定ML模型成败的关键。那么,QML的主要优势将是有能力从(至少部分地)原生量子力学的模型中取样和学习;因此,它们具有经典模型所不具备的归纳偏置。这个讨论假设要表示的数据集在本质上是量子力学的,这也是为什么研究人员通常认为QML对量子数据而不是经典数据有更大希望的原因之一。
4)训练和泛化

ML(经典或量子)的最终目标是训练一个模型来解决一个特定的任务。因此,理解QML模型的训练过程是其成功的基础
考虑到训练过程,我们的目标是找到能带来最佳性能的参数集θ。散粒噪声、硬件噪声和独特的应用特征往往使现成的经典优化方法在QML训练中表现不佳(这是由于从量子态中提取信息需要计算一些观测值的期望值,而这些期望值在实践中需要通过在有噪声的量子计算机上的测量来进行估计)。
最近对QNN的理论分析表明,它们的预测性能与QNN中独立参数的数量密切相关,当训练数据的数量与参数的数量大致相等时,就会获得良好的泛化效果。这给了人们一个令人兴奋的前景,即只用少量的训练数据就能获得良好的泛化效果。

启发式领域(Heuristic fields)可能会因为不可预见的技术挑战而面临停滞期。事实上,在经典的ML中,在引入单一感知机(single perceptron)和多层感知机(即神经网络)之间存在着差距,在试图训练多层和引入反向传播方法之间也存在着差距。
自然,我们希望避免QML的这些技术局限性。显而易见的策略是试图尽快确定所有的挑战,并集中研究力量解决这些挑战;幸运的是,QML的研究人员已经采用了这种策略。
a)建立一个QML模型需要几个成分和先验:数据集(和经典数据的编码方案)、参数化模型的选择、损失函数和经典优化器。b-d, 阻碍QML模型训练能力的现象。
1)嵌入方案和量子数据集
获得高质量的、标准化的数据集在推进经典ML方面发挥了关键作用。因此,人们可以猜想,这种数据集对QML也是至关重要的。
目前,大多数QML架构是使用经典数据集(如MNIST、Dogs vs Cats和Iris)作为基准。虽然使用经典数据集是很自然的,因为它们的可及性,但目前仍不清楚如何将经典信息最好地编码到量子态。
一些嵌入方案已经被提出,它们必须具备一些特性。其中一个属性是,嵌入的输出状态之间的内积在经典上很难模拟(否则量子核方案将是经典可模拟的)。此外,嵌入应该是实际有用的:也就是说,在一个分类任务中,状态应该在希尔伯特空间的可区分区域。不幸的是,满足这些属性之一的嵌入不一定满足其他属性。因此,开发编码方案是一个活跃的研究领域,特别是那些配备了包含数据集信息的归纳偏见的方案。
此外,最近的一些结果表明,用经典数据实现量子化优势可能并不简单;另一方面,使用量子数据的QML模型在实现量子优势方面有更大的希望。尽管有这样的事实,但真正的量子数据集对于QML来说仍然很匮乏。因此,该领域需要标准化的量子数据集,其中有容易制备的量子态,因为这些数据集可以用来在真正的量子数据上对QML模型进行基准测试。
2)量子纵览(Quantum landscapes)

训练QML模型的参数,在很多情况下对应于最小化一个损失函数,并通过一个(通常是非凸的)损失函数来寻找其最小值。
从技术上讲,损失函数定义了一个从模型的参数空间到实际数值的纵览。损失函数值可以量化,例如,模型在解决一个给定任务时的误差,所以,QML的目标是找到使这种误差最小的参数集。量子纵览理论(Quantum landscape theory)旨在了解QML的纵览特性以及如何对其进行工程设计。
3)QNN架构设计
由于QNN是监督学习(深度学习、核方法)的基本成分,也是无监督学习和强化学习的基本成分,所以开发好的QNN架构对该领域至关重要:例如,量子卷积神经网络(QCNNs)。
在经典的ML中,对图神经网络背后的群论(group theory)的研究,即对输入空间的各种群作用的不变性和等价性的概念,已经导致了基于群论的深度学习架构的统一理论——几何深度学习理论。
为了创建适合一组给定的量子物理数据的任意架构和归纳偏置,量子几何深度学习理论可能是设计架构的关键,在变换空间和归纳偏置上有正确的先验,以确保训练性和泛化。
由于物理学的研究往往是关于特定系统中固有的或出现的对称性的识别,未来的量子几何深度学习的统一理论有很大的潜力,可以提供一致的方法来创建QML模型架构,其归纳偏置编码可以给定量子数据集的基本对称性和量子物理系统的原理的知识。
4)量子噪声

量子计算过程中硬件噪声的存在是噪声中尺度量子计算(NISQ)的决定性特征之一。如果我们希望用目前可用的硬件追求量子优势,对硬件噪声的影响的核算应该是QML分析的一个关键方面。
解决噪声引起的问题可能需要:
- 减少硬件错误率;- 部分量子错误修正- 采用相对较浅的QNN(即其深度在问题大小中呈亚线性增长,如QCNNs。
误差缓解技术也可以提高QML模型在噪声下的表现,尽管它们可能无法解决噪声引起的可训练性问题。处理噪声的另一种方法是设计具有抗噪声特性的QML模型(如最小值的位置不会因噪声而改变)。

1)量子优势的潜力
QML的第一个量子优势可能会产生于从量子数据中提取隐藏参数。这可以是用于量子传感或量子状态分类/回归。从根本上说,我们从最优测量的理论中知道,非局部的量子测量可以用较少的样本提取隐藏的参数:使用QML,人们可以形成并搜索这种测量的假设的参数化。
由于这种经典参数的信息被嵌入到子系统之间的量子关联结构中,因此,具有良好归纳偏置的、训练有素的QML模型自然可以表现出比局部测量和经典表征更多的优势。

另一个经典参数提取可能产生优势的应用领域是量子机器感知,即量子传感、计量学和其他领域。
除了嵌入量子数据的经典参数提取外,发现量子纠错码可能还有一个优势:量子纠错码从根本上将数据(通常)非局部地编码到希尔伯特空间的子系统/子空间。由于深度学习从根本上说是关于数据空间的子曲面的发现,从希尔伯特空间中识别和解码对应于量子纠错子空间/子系统的子空间/子系统是可微分量子计算可能产生优势的一个自然领域。
2)量子优势会是什么样?
当数据来源于量子力学过程时,如化学、材料科学、生物学和物理学的实验,更有可能在ML中看到指数级的量子优势。量子优势可能体现在样本复杂性或时间复杂性方面:这种实质性的量子优势最近在谷歌的Sycamore处理器上得到了证明,提高了使用NISQ设备实现量子优势的希望。
在时间复杂性方面的优势情况更为微妙。量子过程的经典模拟在许多情况下是难以实现的,因此在时间复杂度上的指数级优势将被预期为普遍存在。
当数据是纯粹的经典来源时,例如在向客户推荐产品、执行投资组合优化,以及处理人类语言和日常图像的应用中,没有已知的指数优势。然而,期待多项式优势仍然是合理的。此外,对于纯粹的经典问题,可以严格地证明有二次优势。因此,当我们拥有容错的量子计算机时,我们很可能在长期内产生潜在的影响;尽管在目前已知的容错量子计算方案中,量子纠错的开销明显抑制了速度的提升。
3)容错量子计算时代......
虽然QML已经被提议作为在近期内使用NISQ设备实现量子优势的候选方案,但我们仍然可以对其在未来的可用性提出质疑。在这里,研究人员设想了NISQ之后的两个不同的时间时代:
- 在第一个时代,我们可以称之为“部分纠错”,量子计算机将有足够的物理量子比特(几百个),以及足够小的错误率,以允许少量完全纠错的逻辑量子比特。由于一个逻辑量子比特是由多个物理量子比特组成的,在这个时代,我们将可以自由地进行交易,将设备中的量子比特分成一个错误修正的量子比特子集和一个非错误修正的量子比特子集。
- 下一个时代,即“容错”时代,将在量子硬件拥有大量纠错的量子比特时出现。
事实上,我们可以很容易地设想QML在这两个后NISQ时代都是有用的。首先,在部分纠错的时代,QML模式将能够执行高保真电路,从而具有更好的性能;最重要的是,在容错时代,QML可能会看到它最广泛和最关键的用途:量子算法,如用于量子模拟的算法,将能够准确地准备量子数据,并将其高保真地存储在量子存储器中。因此,QML将成为从量子数据中学习、推断和预测的自然模型,因为这里的量子计算机将直接从数据本身学习。
在更远的时间线上,预计将有可能直接从自然界捕获量子数据,通过从其自然模拟形式转变成量子数字形式(例如,通过量子模拟-数字相互转换)。然后,这些数据将能够在量子网络中穿梭,用QML模型进行分布式和/或集中式处理,使用容错的量子计算和错误纠正的量子通信。
在此时,QML将达到与今天的ML相似的阶段,即边缘传感器捕获数据,数据被转发到中央云,并在汇总的数据上训练ML模型。参照现代广泛的经典ML,我们可以预见,在容错时代对量子数据的无处不在的访问,同样可以推动QML得到更广泛的使用。
参考链接:
https://www.nature.com/articles/s43588-022-00311-3

相关阅读:量子机器学习进展:哈佛仅用六个铷原子模拟大脑功能
量子机器学习首次应用于欧洲核子研究中心LHCb实验
量子机器学习的突破!首次实现量子-经典生成算法
谷歌在机器学习中证明量子计算优越性
南京大学同时实现了机器学习和通信复杂度的量子优越性

#光子盒视频号开通啦!你要的,这里全都有#
每周一到周五,我们都将与光子盒的新老朋友相聚在微信视频号,不见不散!
|qu|cryovac>
|qu|cryovac>你可能会错过:|qu|cryovac>|qu|cryovac>

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存