查看原文
其他

IBM提出首个衡量量子计算速度的指标CLOPS

光子盒研究院 光子盒 2022-07-04

光子盒研究院出品


在IBM看来,衡量近期量子计算机性能的关键属性有三个:规模、质量和速度。规模和质量分别用量子比特数和量子体积(QV)来衡量,但是关于速度的指标还没有。为此,IBM提出了第一个衡量量子计算速度的指标——每秒电路层操作数(CLOPS)。
 


IBM通过三个指标来衡量量子计算性能,分别是量子比特数、量子体积和CLOPS。
 
图1 衡量量子计算性能的三个关键指标:规模、质量、速度

量子比特数是最基本的指标,它决定了量子计算机中可编码用于计算的信息量,从而决定了可解决问题的规模。由于容错计算需要大量的量子比特,因此规模是量子计算机发展的一个关键指标。量子比特数也可以作为一种资源来提高另两个指标——质量和速度。例如,辅助量子比特经常被用来减小电路的深度并提高其保真度。额外的量子比特也可用于QPU的多道程序设计,以提高其电路处理速度。
 
量子体积(QV)则表示量子电路在量子计算系统中的实现程度。IBM将QV层定义为一层量子比特之间的置换和一层成对随机SU(4)双量子比特幺正门,如图1所示。QV是由量子处理器能够成功运行的最大随机平方电路的QV层的宽度或数量(宽度等于层数)定义的。
 
QV这一指标对相干性、门保真度和测量保真度非常敏感。QV还受连接性和编译器的影响,这可以使电路有效地最小化退相干的影响。QV是一个整体指标,不能仅仅通过改善系统的一个方面来改善,而是需要以协同方式改善系统的所有部分。
 
每秒电路层操作数(CLOPS)与一个QPU在单位时间内可以执行多少个QV电路相关。其定义是使用一组参数化QV电路每秒执行的QV层数,其中每个QV电路都有D=log₂QV层。电路执行时间包括更新电路参数、将作业提交给QPU、在QPU上执行以及将结果发回处理。然后计算CLOPS,即执行的QV层总数除以总执行时间。

图2 用于CLOPS基准的电路矩阵有M = 100个独立的QV电路模板,具有D层SU(4),其中电路中的每个SU(4)都是完全参数化的。每个电路的参数更新K = 10次。参数θm,k取决于使用参数θm,k−1的电路输出。
 
CLOPS基准由100个参数化模板电路组成(表示为C∏m, 0≤m<100),与测量系统量子体积时使用的模型电路类型相同,只是每个SU(4)随机单位都完全参数化。换句话说,在100个QV电路中选择和固定随机置换层,同时将相邻量子比特对上的SU(4)参数化。

每个电路模板CΠm将被执行10次,随机参数有10个选择(,0≤m<100, 0≤k<10)。这些参数应用于电路模板,生成最终电路,然后在系统上运行,无需任何进一步的参数更新。这些实例化电路中的每一个都表示为C∏m,这些电路中的每一个都执行100次。

基准程序如下:
 
1.生成100个参数化电路C∏m,并且可以将其编译为目标机器的本机门中的参数化电路。
 
2.时间开始。
 
3.初始电路的参数使用合适的伪随机数发生器(PRNG)生成,并用于运行电路。
 
4.对于k>0的C∏m,C∏m的输出用于播种PRNG以产生参数,因此直到电路C∏m完成并返回其结果之前,C∏m不会运行。
 
5.电路执行100次,量子比特、门长度、电路间延迟与建立设备QV时使用的相同。
 
6.除第4项和第5项中列出的限制条件外,电路可按任何顺序或组合执行,以充分利用系统资源,同时不改变QV质量。
 
7.所有电路运行完毕并收到结果,时间停止。
 
然后,可将CLOPS计算为:


其中:
M=模板数量=100
K=参数更新次数=10
S=执行次数=100
D=QV层数=log₂QV
 
IBM已经在几个系统上运行了CLOPS基准测试。结果如表1所示,量子体积均为32的三台量子计算机Bogota、Toronto和Brooklyn的CLOPS分别为1419、951和753。通常我们会认为,65比特的量子计算机具有性能优势,但实际上它在CLOPS指标上处于劣势,速度是最慢的。
 

表1

 


为了更好地理解CLOPS的差异,IBM将在每个设备上执行基准测试的时间分为五个方面:
 
1.在设备上运行电路实际花费的时间:电路执行
 
2.设备上每个电路每次执行之间的延迟时间:电路延迟
 
3.制备电路在设备上实际运行(参数更新、运行时编译、波形生成)以及数据传输(电路提交到后端、仪器初始化、仪器加载、结果返回给用户)所花费的时间:运行时编译和数据传输
 
每台设备的时间细分如表2所示。这种细分强调了需要一个整体的速度基准,例如,从执行电路本身的时间来看,ibmq_brooklyn看起来是最快的,但它实际上是最慢的。
 
这是因为其他因素占主导地位,电路延迟比电路执行时间大一个数量级,最明显的是运行时编译和数据传输大两个数量级,从而限制了整体利用率。由此可见,使用CLOPS基准,能够找到提高量子计算速度的真正障碍。
 
表2(单位:秒)
 
IBM已开始着手改善耗费时间最多的运行时编译和数据传输,包括通过更改软件堆栈来减少初始化工作以及需要加载的数据量。此外,IBM正在构建一个新的高性能编译器来完成最后的降低步骤,预计这会对性能产生很大影响。同样,在整个堆栈中支持参数化更新将有助于降低运行时编译要求,并减少需要传输的数据量。对于电路延时,IBM希望随着量子设备的改进,这种延迟时间可以大大缩短。

参考链接:
[1]https://research.ibm.com/blog/circuit-layer-operations-per-second
[2]https://arxiv.org/abs/2110.14108

End—

相关阅读:

谁是最强量子计算机的争论第一次有了实际意义:一种面向应用的性能衡量方法

Q-score:评估量子性能和优势的唯一通用指标

IonQ公布离子阱量子计算机路线图

远超预期!霍尼韦尔量子系统一年性能翻16倍

IBM报告:量子十年2021-2030

回顾IBM量子这五年


#诚邀共建国内首个量子垂直招聘平台#

光子盒将为中国境内的研究机构和企业提供一个免费的垂直招聘信息发布渠道,欢迎有需求的机构或企业直接联系光子盒。(微信:Hordcore)

你可能会错过:

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存