查看原文
其他

如何评估量子计算机性能?IBM提出两大新指标——

光子盒研究院 光子盒 2024-03-26
光子盒研究院

随着我们不断扩大量子处理器的规模,很明显,我们需要的不仅仅是量子体积(QV),还要能完全概括公用事业级量子计算机的性能。
因此,在一篇公开推文中,IBM引入了两个新指标:每层门误差(EPLG)和CLOPSh,以全面概括为公用事业级时代提供动力的100多比特处理器的性能

预印版研究成果刚刚发表在arXiv上
论文链接:https://arxiv.org/abs/2311.05933

如果一个处理器的量子体积为2^n,这意味着该设备有可能在n个量子比特子集上通过n层随机双量子比特门产生正确的正方形量子电路输出。其计算公式如下:

其中,VQ即量子体积,对于一个n量子比特处理器,m≤n,d(m)是最大方形电路中的量子比特数。也就是说量子体积与处理器拥有的量子比特数有关,还与量子处理器能够可靠运行的最大方形电路的深度有关。
量子体积的数字意在表示电路所能访问的计算空间的复杂性。因此,如果一个处理器的8个量子比特足够稳定,能够为一个有8层门的电路持续返回正确的值,那么量子体积就是2^8或256。
现在,量子体积仍然是确保我们不在系统中玩游戏,以了解串扰、错误等问题的最佳方法。但我们一直知道,一旦我们开始发布更大的系统,我们就需要找到额外的基准指标。对于小容量系统,量子体积只对系统的一小部分进行采样:量子体积只对设备中少数几个最好的量子比特进行采样,而不对整个系统的平均性能进行全面分析。
对于足够大的系统,量子体积实验很快就会变得太大,我们无法进行经典模拟:我们将无法知道我们的系统是否能通过量子体积测试。最后,量子体积设计用于在全对全连接系统上运行,即每个量子比特都能与其他量子比特对话。
在我们的二维拓扑结构中,这意味着量子体积的每一步提升都会对保真度和门的数量造成负担,因为我们需要引入许多SWAP门来移动信息(每个SWAP需要三个CNOT纠缠门)。
展望未来,我们需要一个额外的指标来跟踪100+量子比特时的持续改进,并帮助我们了解系统运行大规模、误差校正算法的能力;一个系统通常可以为比其量子体积大得多的量子比特或门电路返回准确的误差校正期望值。
最终,量子体积仍然是对系统性能的一个非常有力的测试,我们将继续对此进行跟踪。但是,随着规模和质量的不断提高,我们需要用一个新的基准指标来增强我们的表征组合
显示随时间变化的IBM后端数量的图表,每个条都分为实现每个给定量子体积的后端数量


随着IBM进入量子实用时代,它们开始引入一种指标,让业界对系统有更细化的了解,同时准确捕捉系统运行当今用户正在运行的电路类型的能力。
我们将这一指标称为层保真度(layer fidelity)。”IBM表示。
层保真度提供了一个基准,它囊括了整个处理器运行电路的能力,同时揭示了单个量子比特、门和串扰的信息。它扩展了一种成熟的量子计算机基准测试方法,即随机基准测试。
在随机基准测试中,IBM团队在电路中添加一组随机克利福德群门(这是一组基本门:X、Y、Z、H、SX、CNOT、ECR、CZ等),然后运行一个操作,从数学上讲,这个操作应该代表前面操作序列的逆。
如果任何一个量子比特在测量时没有通过反向运算恢复到原来的状态,那么我们就知道出现了误差。我们用越来越多的随机门多次重复这个实验,从实验中提取出一个数字,在图上绘制出错误是如何随着门的增加而增加的,在图上拟合一个指数衰减,并用这条线计算出一个介于0和1之间的数字,称为保真度。
因此,层保真度提供了一种方法,将较大电路的随机基准测试数据结合起来,告诉我们有关整个处理器及其量子比特子集的信息。
为了提取层保真度,我们从一个连接的量子比特集合开始,就像一个量子比特链,每个量子比特都与相邻的量子比特纠缠在一起。然后,我们将这个相连的集合拆分成多层,这样每个量子比特最多只有一个双量子比特门作用于它:如果你需要一个门来纠缠量子比特一和量子比特二,需要另一个门来纠缠量子比特二和量子比特三,那么这些将被拆分成两个“不相连层”(disjoint layer)。
如果你愿意,还可以进一步拆分。然后,我们对这些新的 “不相连层”中的每一层进行随机基准测试,计算出每一层的保真度;最后,我们将每个层的保真度相乘,得出一个最终数字,即层保真度。
层保真度是一个极具价值的基准。通过运行协议,我们可以鉴定整体设备,同时还能获得门级信息,例如这些分层电路中每个门的平均误差:每层门误差 (EPLG),其中 EPLG=1-层保真度(1/[N-1])
我们可以用它来逼近gammabar (γ̄),这是IBM去年首次提出的指标,用于说明特定器件通过概率错误消除(PEC)协议(γ̄=(1-EPLG)-2)返回准确的错误消除结果的能力。
结合速度 (β),我们可以预测PEC的运行时间 γ̄{nd}*β。最重要的是,我们已经定期对量子比特的栅极误差进行基准测试;结合层保真协议,我们可以确定器件上的最佳量子比特子集。
作为层保真提案的一部分,IBM在所有100量子比特器件上运行了100量子比特层保真,包括新的133量子比特Heron处理器,结果如图所示。
从Eagle R1 (ibm_washington),到Eagle R3,再到引入ibm_montecarlo的Heron R1处理器系列,IBM逐步推出了100多量子比特IBM器件的80量子比特和100量子比特链EPLG。不久,更多的Heron R1设备也将加入这一行列

性能是质量、规模和速度的结合。由于我们在层保真度中引入了新的质量/规模指标,因此现在正是更新速度指标CLOPS的大好时机,CLOPS是“每秒电路层操作数”的缩写。
2021年,IBM曾介绍了三个量子计算性能的衡量标准,其中就包括CLOPS
至关重要的是,CLOPS既包含了电路运行所需的时间,也包含了所需的实时和近实时经典计算。
最初,CLOPS被视为与量子体积密切相关的指标。每个电路层都是一个量子体积层:一组单量子比特旋转加上一组随机双量子比特门。但CLOPS的含义远不止于此。
当我们计算CLOPS时,实际上是连续运行100个电路,其中前一个电路的输出为后一个电路的参数提供信息。这意味着,我们的CLOPS测量包含了运行电路所需的量子(和实时经典)计算,以及更新后续电路值所需的近实时经典计算。
或者,简而言之:目前,CLOPS是衡量我们的处理器串联运行量子量电路速度的一个标准,是衡量包含量子计算和经典计算的整体系统速度的一个标准。

但这有一个问题。我们对量子体积层的理解或多或少有些理想化。
一个单量子比特旋转,加上IBM在Qiskit中编程的随机双量子比特门,在将电路编译成量子处理器可以真正理解的语言后,需要更多的门才能在硬件中实际执行。
物理处理器的现实情况(尤其是其量子比特的连接方式)意味着我们理论上认为的“一层”可能需要多层才能在机器上实现。简而言之,在计算CLOPS时,假定的是电路运行的理想化版本,而不是采用硬件感知技术。
因此,IBM正在更新CLOPS,以更好地反映硬件运行电路的真实情况。
更新后的CLOPS指标称为CLOPSh,它只是反映了硬件的真实运行方式。CLOPSh对“层”的定义有所不同,“层”不再代表同时作用于所有随机量子比特对的一组双量子比特门,现在“层”只包括可在系统架构上并行运行的双量子比特门。基本上,如果量子体积层以前有两个无法在硬件架构上并行运行的门,我们就必须在更新的CLOPSh计算中将其分成两个或更多层。
与层保真度类似,CLOPSh允许我们以更真实的硬件运行方式计算硬件能力。以前,CLOPS对硬件来说过于具体;两个不同的处理器可能会以不同的方式编译门电路,或者并行运行门电路的能力不同,因此它们的CLOPS值会有所不同,但不一定代表性能上的真正差异。
但有了硬件高效的CLOPSh,我们现在就可以用更通用的电路层定义来比较苹果与苹果之间的差异。CLOPSh与β也直接相关(β = 1 / CLOPSh),因此CLOPSh的改进将直接应用于PEC和类似错误缓解技术运行时间的改进
过去,我们使用量子量电路(即虚拟电路)计算CLOPS,而不考虑设备连接性(上图)。现在,我们采用硬件感知方式计算CLOPS(下图)

这在100*100时代也很重要:IBM曾承诺在明年年底前提供100量子比特、100层电路的精确期望值。此外,IBM现在可以测量软件堆栈有效运行大型公用事业规模电路的能力,这需要大量的工程努力。
层保真度和CLOPSh共同为我们的系统提供了一种新的基准方法,对于试图改进和使用我们硬件的人来说更有意义。
因此,在未来,这些指标将显示在IBM 100多量子比特器件的系统属性卡上,这些指标将使系统之间的比较、IBM的系统与其他架构的比较以及反映不同规模的性能提升变得更加容易。
最终,这些指标将帮助我们继续提升性能,使用户能够在这个量子公用事业时代在IBM系统上运行100+量子比特电路。
参考链接:[1]https://medium.com/qiskit/what-is-quantum-volume-anyway-a4dff801c36f[2]https://research.ibm.com/blog/utility-toward-useful-quantum[3]https://research.ibm.com/blog/gammabar-for-quantum-advantage[4]https://research.ibm.com/blog/quantum-metric-layer-fidelity?sf184023934=1#-fn-1


相关阅读:是什么让量子计算机更强大?量化“量子性能”给出了具体指标
量子计算机有哪些性能指标?分别代表了什么?
IBM提出首个衡量量子计算速度的指标CLOPS
Q-score:评估量子性能和优势的唯一通用指标
一项新技术将评估量子计算机中的射频元件

#光子盒视频号开通啦!你要的,这里全都有#
每周一到周五,我们都将与光子盒的新老朋友相聚在微信视频号,不见不散!

|qu|cryovac>你可能会错过:|qu|cryovac>|qu|cryovac>
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存