量子化学、张量网络与量子计算的一些交叉问题探讨
The following article is from Q101 Author 李振东@BNU
本文希望以一种尽可能不使用太多数学、以化学和物理图像为主的方式介绍量子化学与另外两个相关领域——张量网络(Tensor Network)与量子计算(Quantum Computation)在近些年之间的交叉,希望能给对这些交叉领域感兴趣的学生和研究者一些启示。
有两点需要说明:本文主要面向量子化学背景的读者,另外其中很多是笔者自己的主观观点,并不保证完全正确。文章最后列出一些综述文献,供大家参考。
量子化学可以认为从1927年Heitler和London对氢气分子进行的量子力学计算开始。经过近百年的发展,已经可以对“简单”化学体系进行到非常好的理论描述。
这里的“简单”指的并不是分子结构简单,事实上利用一些局域电子相关方法(如DLPNO-CCSD等),现代量子化学方法和程序可以对复杂如整个蛋白质进行高精度量子化学计算。
因此,这里的“简单”更多的是指电子结构方面的简单。一般可以粗略的认为只要是单参考态方法可以描述的好的体系,我们都认为是“简单”的。目前,不能用这一框架描述的体系,常常被称为是“多组态”问题或“强关联”体系。前者更多是从波函数的角度来说,如果体系真实波函数不能被表示成简单的一个或几个行列式,一般称为“多组态”问题。而后者更多是从物理的角度来说,强调体系内部电子之间相互作用非常强的情况下,平均场处理失效。
对于这类体系,目前利用精确对角化/全组态相互作用(full configuration interaction, FCI)来处理,受限于物理内存,只能大致处理18个电子、18个活性空间轨道的问题[1]。
张量网络最早可以认为发源于1992年White的密度矩阵重整化群(density matrix renormalization group, DMRG)算法。早期DMRG算法仅被当作一种利用了“重整化”思想进行模型哈密顿量对角化的算法,而后人们发现DMRG本质上是用了一种被称为“矩阵乘积态”(matrix product states, MPS)形式的多体波函数。在有了波函数形式后,就可以把DMRG方法这一基态方法推到到更广阔的应用领域,例如含时演化、有限温度等等。
DMRG进入化学中,最早是对半经验哈密顿量进行处理,而后在1999年左右开始对从头算哈密顿量进行处理[1]。经历了近20年的发展,已经发展为一种成熟的处理“多组态”问题的手段,可以超越18个活性空间轨道的限制。
然而,需要强调的是,DMRG本身对化学问题是有局限的。因为MPS是一种链状结构(如图1),这种数学结构的表达能力有不少局限性,例如一条链上的两个点之间的关联函数是指数衰减的,即使一维情况也不是都能很好描述的。
超越DMRG/MPS,在凝聚态物理中发展出了各式各样拓扑结构的波函数形式,如TTNS(tree tensor network states)、MERA(multi-scale entanglement renormalization)和PEPS(projected entangled-pair states)等。这些波函数可以形象地看作是数个张量之间收缩成的形式,因此统称之为张量网络态 (tensor network states,TNS)[2]。而MPS可以看作是TNS的特例,因为向量和矩阵可以分别看作是一维和二维的张量。
这些方法虽然在凝聚态物理中取得了巨大的成功,但应用到化学体系里存在不少困难,甚至可以说对于大部分体系目前没有看到突出的优势。本质原因在于存在一个波函数表达能力和计算效率的矛盾。因为高维的张量网络态计算标度本身非常之高,其表达能力的优势对有限分子体系很容易被巨大的计算量所抵消。因此,探索如何利用张量网络进一步发展出可以处理更复杂体系的高效方法,是一个十分重要而困难的理论问题。
张量网络可以看作是对多体波函数的一种特殊的经典计算方式,可以一定程度上克服量子化学经典计算里的一些困难问题。目前的极限以实际体系为例,大致在含八个过渡金属的问题[3]。利用近期发展的自旋投影DMRG产生关联初始波函数,进而结合最先进的自旋匹配DMRG程序,笔者曾完成了对固氮酶中一个[Fe8S7]团簇从头算。一个初始波函数对于的DMRG计算大致需要的计算资源为百GB以上的内存、TB级别的硬盘,以100个CPU核做单点计算大概需耗时一周左右。因此,未来仍然需要发展新的张量网络态以及配套的高效程序,才能使得这类化合物的计算成为常规计算。
量子计算可以看作是另一种不同于经典计算的计算方式。其最早起源于Feynman的想法——使用一种可以操控的量子系统模拟感兴趣的量子系统,优势在于以量子态作为类似经典比特的计算单元,自然地解决了态的表示/存储问题。量子计算需要实现量子计算机,这本身是一个物理和工程上的难题。
抛开这一点不谈,在假设我们已经有了量子计算机的情况下,是否量子化学的难题就自然解决了呢?与许多铺天盖地的商业宣传不同,答案是否定的!量子计算应用到量子化学里,除了量子计算机本身实现上的困难,仍然有许多理论上的问题,不少是目前研究的热点,这里我们稍作一些简单探讨,感兴趣的读者可以研究相关文献[4]。
量子计算最早进入化学可以认为是2005年Aspuru-Guzik等人在Science上的一篇理论探讨,其中讨论了应用一种称为“量子相位估计”(quantum phase estimation,QPE)的算法来得到给定化学体系的能量和本征态。
理论上说,假设精确波函数已经通过某种方法在量子计算机上得到,那么运行QPE可以给出体系的精确能量。但是,问题在于精确波函数在量子计算机上仍然无法“容易”的得到。如果使用近似波函数,QPE将初始态投影到某一个本征态的概率正比于初始态和这一本征态的重叠。
我们知道,随着体系大小的增加,Hartree-Fock态和精确态的重叠将指数减小,因此对于之前提到的困难“强关联”体系,这个重叠可能非常小,从而使得QPE从Hartree-Fock态出发得到基态的概率会非常低。因此需要从一个更好的初始态出发,才能高效地得到想要的本征态。
然而,如何制备这样的态,本身也是一个难题。利用量子绝热定理,理论上从可以从一个简单的态(比如Hartree-Fock态),缓慢地引入微扰,通过时间演化可以制备最终的态。但是对于量子化学问题来说,演化算符exp(iHt)本身在量子计算机上实现起来设计非常复杂的量子电路。
原因在于哈密顿量H里的项不对易,需要进行Trotter分解,如需将exp(i(Ha+Hb)t)近似为[exp(iHa t/n)exp(iHb t/n)]^n,n是个足够大的数。因此,这一演化操作实现难度也很高,即使在理想的量子计算机上实现起来可能也会非常耗时。更不用说,实际实现还需要考虑很多量子误差校正(Quantum Error Correction)带来的巨大额外开销。
因此,量子和经典计算对于化学体系的交叉点在哪,目前难以准确预测(根据一篇最近文章的理论估算[5],实现对之前提到的固氮酶铁硫团簇进行计算,大概需要几百到上千个逻辑比特,如果要在一天内完成,需用两千万个物理比特实现)。只是从理论上来说量子计算的标度是多项式复杂度的,而经典的FCI是指数复杂度的。然而,正如前面讨论的,需要注意这个多项式前的系数有可能非常巨大!
除了需要考虑误差校正的QPE,目前量子计算化学领域很多研究都集中于使用2014年Aspuru-Guzik等人提出的变分量子本征态求解器(variational quantum eigensolver,VQE)进行各个方向上的探索。
这一方法本质上和量子化学中的其他变分方法如Hartree-Fock和MCSCF原理相同,都是给定一个波函数形式进行变分优化其中的参数。区别在于在量子计算机上可以有更多的可能性。具体举例来说,经典计算中耦合簇(coupled cluster, CC)方法一般使用的是非对称的投影方法来确定指数参数化|CC>=exp(T)|HF>里的未知参数,因为变分方法需要的能量泛函里如<HF|exp(T^+)exp(T)|HF>的项是无法截断的。而量子计算机上可以以多项式复杂度(根据涉及的单比特和双比特门数目来计算)表示出这些项,因此在量子算计上可以实现Unitary CC。
目前实验和理论模拟上也对简单的分子如H2和HeH+等演示了可行性。但是问题在于,这是否意味着有了量子计算机量子化学里的难题用VQE原则上就都解决了?核心还在于波函数的参数化上。以一些前人经典计算的经验,我们知道Unitary CCSD方法,本质上CCSD差别不大,仍然是一个单参考态方法,因此即使能对更大的分子在量子计算机上实现这一方法,对前面提到的困难化学体系可能还是没有任何帮助!一些基本问题如量子线路参数化的态和经典计算可以描述里的态边界在哪,是否对“强关联”体系带来量子优势等,一定程度上可以从前面提到的张量网络角度来考虑,但就笔者所知大都仍然是开放问题,有待进一步的研究。
最后,需要指出的一点是“量子化学”一般大家默认指的还是经典计算,和“量子计算”里的“量子”不是一个意义!
目前,商业公司对于量子计算在化学中应用的研究大多集中于VQE应用方面的研究。可惜的是一些宣传有夸大其词、偷换概念的一面,殊不知此“量子”非彼“量子”。经典和量子计算对于量子化学问题的边界在何处,仍然需要大家以科学的态度进行探索。
声明:本文来自出于传递更多信息之目的。若有来源标注错误或侵权,请作者持权属证明与我们联系,我们将及时更正、删除