查看原文
其他

机器学习方法在量子多体物理中的应用

2017-10-12 蔡子 中国物理学会期刊网

作者:蔡子 (上海交通大学物理与天文学院)


1 引言


物理世界是由相互作用的多粒子系统组成的,量子多体物理研究这种相互作用系统的新奇量子关联效应及其物理机理,不仅是高温超导、量子霍尔效应、量子磁性等凝聚态物理前沿领域中的核心问题,也在量子调控和量子信息、超冷原子物理、原子核物理与格点规范场等领域的发展中起着至关重要的作用。在一般的量子多体物理系统中,系统的希尔伯特空间维度会随着系统尺度增加指数发散,这为量子关联系统尤其是强关联系统的量子多体波函数的描述以及相关物理量的计算带来了本质性的困难,1998 年诺贝尔化学奖得主W. Kohn 在其诺贝尔奖演讲中将其称为“指数墙”困难(图1)。过去30 年来,为了绕开这一“指数墙”困难,物理学家们做出了大量的努力,尽管如此,目前还没有一种普适的方法能够一劳永逸地解决所有的强关联问题,只能针对不同的具体问题,设计和发展有针对性的解析与数值方法。这些方法在取得了很多重要进展的同时,也存在着各自的局限。例如,针对低维强关联系统,人们设计了密度矩阵重整化群方法来研究这一系统的基态和低能激发态的性质,然而如何将这一方法推广到更高维度,至今仍然是这一领域最具挑战性的问题之一。针对另一类强关联问题,如相互作用的玻色子系统或没有阻挫的量子磁性系统,物理学家借鉴经典统计物理学中蒙特卡罗方法重要性抽样的思想,发展了量子蒙特卡罗方法,用以研究这类系统的基态和热力学平衡态性质,然而,对于许多强关联物理关心的核心问题,如高温超导、阻挫量子磁性等系统,在用量子蒙特卡罗方法对这些问题做重要性抽样的过程中可能出现接收概率为负的情况,即负符号问题,这大大限制了量子蒙特卡罗方法在解决这类问题中的能力。一般而言,一种好的量子多体计算方法是能够从具有指数多信息量的多体波函数中,利用系统本身所具有的某些特性,提取出少量的人们关心的物理量,如能量、关联函数、序参量等重要信息的方法。近十几年来,越来越多的来自其他相关学科的物理思想和方法被引入到量子多体物理中,这一新趋势大大促进了该领域的发展。例如本世纪初物理学家将量子信息中量子纠缠的概念引入量子多体物理,使人们更深刻地理解了量子多体基态波函数的结构,同时也产生了包括张量网络重整化群(参见《物理》2017年第7 期谢志远、李伟、娄捷的专题文章)在内的一大批新的量子多体算法,为解决阻挫量子磁性和相互作用的费米子系统等量子多体物理的核心难题提供了新的解决思路。


图1 量子多体物理中的“指数墙”困难(参见W. Kohn 36 41322 36 15231 0 0 2860 0 0:00:14 0:00:05 0:00:09 30361998 年的Nobel Lecture: Electronic structure of matter——wave functions and density functionals)


机器学习算法是一种从已有的大量数据中自动分析获得规律,并利用所获得规律对未知数据进行判断,做出决策的人工智能算法。机器学习的研究目标是让机器获得一定的智能,从而更高效地解决问题,这是一门综合了计算机科学、数理统计、数据科学,并且具有鲜明的应用色彩的学科。通过智能的方式处理数据优化、函数拟合、特征抽取和模式识别等任务,机器学习在大数据处理、视觉与语音识别、生物特征识别、搜索引擎和机器人等领域具有广泛的应用。近年来,例如,由于AlphaGo 的成功,机器学习和深度学习等算法在人工智能以外的许多领域受到了广泛的关注。本文将着重总结目前机器学习方法在凝聚态物理、量子关联体系中的应用,这些应用包括:训练机器学会区分物质的不同量子相或经典相;通过机器学习方法来加速和优化现有的量子多体算法甚至发展新的算法;利用人工神经网络刻画量子多体波函数;同时,我们也会讨论一些多体物理上的进展对机器学习领域带来的影响。通过下面的讨论我们会看到,机器学习和量子多体物理这两个领域处理问题的思想有诸多共通之处,它们各自面临的困难也十分相似,我们预期这两个领域的融合和思想的碰撞,不仅会大大加速量子多体物理的发展,同时也会加深人们对机器学习这一领域很多基本问题的理解。


2 机器学习算法介绍


机器学习是人工智能中由模式识别衍生出来的一个领域,通常被用来处理一类用常规逻辑编程方法很难处理的实际问题。在这类问题中,一方面,机器面临的输入数据的可能性太多以至于不可能采用枚举法对所有的可能性做出判断;另一方面,通过训练,机器能够通过从有限的数据集中“自动”提取关键信息和特征的方法对其进行识别、分类;更重要的是,训练完成后,机器面对全新的输入数据,能够做出自己的判断,这些判断的“合理性”往往能接近甚至超越人类对于同一问题的判断,这让机器具备了某种意义上的“智能”。下面我们以机器学习中的最常用的人工神经网络算法为例,简要介绍机器学习算法的工作流程和特点。


人工神经网络是受到生物大脑中信息处理模式的启发发展出的一类算法,也是人工智能领域“连接主义”的代表性算法。一个人工神经网络本质上可以看成是一个函数拟合器。以前馈神经网络为例,该网络结构可以分为三个部分:输入层、输出层、以及夹在这两层之间的若干隐层。输入层是待处理的数据集,输出层输出神经网络对该数据的预测结果。每一隐层由若干神经元构成,每一个神经元作为基本的运算单元,对上一层神经元传来的信息做某种非线性处理后传递给下一层神经元(图2)。一个人工神经网络即是由这些非线性函数组合而成的某种复杂的函数形式,建立了从输入数据到输出标识的一个映射。通过调节网络参数(如连接强度和偏置大小),该函数原则上可以拟合任何光滑函数,即一个人工神经网络可以看成是一个普适的函数拟合器。


图2 前馈神经网络示意图。每一个神经元与上一层所有神经元相连,将这些神经元的输出结果按照一定比例加权求和(另外还要加上该神经自身的偏置)作为该神经元的输入,通过某个非线性映射产生出该神经元的输出,传递给下一层的神经元


下面我们通过一个图像识别的例子,来说明神经网络的工作原理和该方法与传统算法的区别。假设有大量关于猫和狗的不同照片,我们希望编写程序来让计算机对这些图片进行分类。在传统的逻辑编程中,程序员自身必须知道猫和狗照片的本质区别,并将其精确地翻译成计算机语言,对每张输入图片进行“if…,then…”的逻辑判断,输出结果。不幸的是,对这样一类问题,这种传统的编程方法一般很难成功。一方面由于区分“猫和狗照片的本质区别”的精确判据可能很难找到,甚至根本不存在(对每一条判定标准,人们往往都可以找到反例)。另一方面,输入的图片可能有无穷多种可能性,程序员很难穷举出所有可能出现的情况。人工神经网络方法针对这类问题,提供了一种新的解决问题的思路。人们将一部分具有正确标识的图片输入网络,并将网络预言的标识和正确标识做比较,通过动态调节网络参数(神经元间的连接强度和神经元的偏置),不断提高网络预言标识的准确率,最终完成从图片到标识这一函数拟合。在训练过程中,机器自动提取了很多区别猫和狗图像的重要特征,尽管其中单个的特征作为判定标准(例如猫头的形状一般比狗更圆),可能不够精确,但是机器会根据训练结果,自动地将提取出的特征做出综合权衡,并将它们以某种形式储存到网络参数中,最终形成自己的判定标准并以此对标识未知的新图片进行判断,最终我们认为机器通过训练“学会”了区分猫和狗的图片。从这个例子中,我们可以看到机器学习方法的一些特点:(1)该算法适用于处理很复杂甚至定义比较模糊的问题,这些问题往往超越了传统的穷举法和逻辑编程方法的处理能力;(2)在这一算法中,程序员本身不需要知道猫和狗的本质区别在哪里,所有这些区别或判定标准都是机器在训练过程中自动涌现的;(3)它是一种启发性的近似算法,通过牺牲一定的精确性来提高算法的效率,但不能保证预言结果百分之百准确;(4)在多数情况下,没有普适标准来保证该方法的成功率和效率,在很多具体问题中,人工神经网络的设计高度依赖于程序员的经验和直觉。


3 机器学习在量子多体物理中的应用


量子多体物理的研究对象是大量微观粒子的集体行为,即从巨量的信息(例如每个粒子的微观状态,或者量子多体波函数)中提取出关键的特征量,即物理可观测量(如序参量、关联函数、能量等)。量子多体物理面临的最大困难是待处理系统的信息量(希尔伯特空间维数)会随着系统尺寸指数发散。如果比较一下量子多体物理和机器学习这两个领域,我们会发现这两个领域不管是处理的问题,还是面临的困难都有某种程度的相似性。这让我们思考能否利用机器学习算法强大的特征抽取和函数拟合能力,促进量子多体物理的发展。总的来说,机器学习可以从思维、方法和技术三个层面影响量子多体物理的研究。首先,机器学习倡导一种数据驱动的思维方式,往往可以通过牺牲一定精确性的要求来达到目的;其次,机器学习领域发展了大量优秀的数据拟合、特征提取等方法;最后,由于机器学习的重要性,工业界专门为这类计算打造了优化的硬件和开源软件包,这些都有可能被用来帮助我们解决量子多体物理问题。将机器学习方法运用到量子多体物理已经成为一个蓬勃发展的领域,下面我们着重介绍这方面一些代表性的进展。


3.1 训练机器学会区分物质的不同量子或经典相


凝聚态物理的研究对象是物质的相和相变。在热力学极限下,不同的相一般具有不同的自发对称破缺,通过相应的序参量来刻画。这些序参量是反映出数据共性的物理量,从而刻画多体关联系统的宏观行为。物理学家们发现,通过训练,机器学习算法可以自发地发现并学会序参量的概念,并以此来分类不同的量子多体态,按照多体模型中的物理参数和温度对量子多体系统的集体宏观状态进行预测。更重要的是,机器学习到的知识可能具有一定的泛化能力,即将从某个系统中学到的知识应用到一个全新的系统中的能力。以二维铁磁伊辛模型为例,我们先对二维正方格点上的伊辛模型进行训练,机器会自动抽取出自发磁化这一概念作为序参量来区分铁磁相和高温顺磁相。训练完成后,将同样的人工神经网络运用到一个新的系统:三角格点上的伊辛模型,物理学家发现机器能将从正方格点上学到的知识运用到三角格点上,正确区分这个新模型上的高温相和铁磁相,甚至找出相变点的位置。但是,对于一般的系统,提高机器学习的泛化能力仍然是这一领域最具挑战性的问题。另外,对最近广受关注的一类量子物态,即非平庸的拓扑量子态,这些量子态不能用局域的序参量来刻画,物理学家也做了大量的尝试,希望机器能通过学习学会这些非局域的拓扑信息,包括拓扑量子数等。


以上对物质态的分类多数是由监督学习来完成,即程序员必须先对不同的态做出正确的标识,这也意味着通过这种方法不可能预言出新的未被标识过的物态。最近在这一方向的另一进展是通过无监督学习来完成多体态的分类,即根据数据本身隐含的结构,按照一定的方法对它们进行自动分类。例如,对伊辛模型,每一个空间构型可以对应构型空间的一个点,通过无监督学习中主成分分析这一方法,能够将属于不同相的态空间中的点自动分开,并从中自动得出自发磁化这一物理概念。这类基于无监督学习的机器学习方法本质上是一种空间降维的方法,有望被用来发现新的物质态。


3.2 加速现有量子多体算法和发现新算法


推荐系统深入到电子商务和人类生活的方方面面,比如购物网站会对用户的购物历史记录进行建模,并推荐给用户更多可能感兴趣的产品。根据统计,亚马逊年收入30% 的收益来自于推荐系统算法的进步。机器学习在推荐系统的建模中扮演了重要角色。在量子蒙特卡罗中,要对不同的蒙特卡罗构型按照其重要性进行随机抽样,然而对于许多困难的量子多体问题,生成样本的效率往往很低。借鉴推荐系统的思想,物理学家使用机器学习方法对一经收集到的构型及其权重进行建模,再从模型中得到新的“推荐样本”,如果所建立的模型较好地学会了构型空间的概率分布,这些推荐样本就会有更大的概率被接受,从而提高了蒙特卡罗抽样的效率 (另见孟子杨《物理》2017 年第4 期“从德尔斐箴言到自学习蒙特卡罗”)。另外,人们期望,机器学习方法不仅仅能加速现有算法,还有可能发现新的算法。在最近的一个例子中,物理学家将机器学习方法与经典蒙特卡罗方法相结合,发现机器可以重新“发明”出蒙特卡罗中的“团簇更新”的算法,甚至能发现尚未被人类发明的高效更新算法。


机器学习方法在算法应用上的另一个例子是密度泛函理论。密度泛函理论从理论上避免了处理量子多体波函数,而将基态电子密度放在核心地位。密度泛函理论是一个原则上严格的理论,并且存在一个唯一且普适的密度泛函。密度泛函中包含了动能泛函和交换关联能泛函。然而,遗憾的是,没有人知道这个普适的密度泛函形式。传统上,物理学家和化学家使用种种经验性的办法拟合密度泛函的形式。由于密度泛函理论的重要性,这些工作获得了大量的关注。将这种函数拟合的思想推到极限,自然可以产生利用机器学习方法来拟合密度泛函的想法。具体来说,可以分别拟合动能泛函与交换关联泛函。由于动能泛函只涉及到求解不同外势场下的无相互作用问题,一个准确的动能泛函允许人们开展纯粹基于密度的“无轨道”密度泛函理论的计算(Orbital free DFT),从而大大优化寻找材料的速度。更进一步,如果能够得到比较准确的交换关联势,则会大大改善密度泛函理论的精度。目前仅在一维理想情况下有一些演示性的研究。


机器学习方法的另一重要应用在新材料的发现与设计。在传统的第一性原理材料计算中,人们通过求解薛定谔方程,建立了材料微观结构(多体哈密顿量)与宏观(热学、力学、电学等)性质的对应关系,但是这一过程往往会耗费大量的计算资源。通过与高通量计算和材料基因组计划结合,人们可搜集大量材料的微观组成结构与材料宏观性质的数据库,再借助机器学习方法强大的函数拟合能力,物理学家可以得出从微观结构到宏观性质这一函数的近似形式。面对新的材料,物理学家可以在不用求解薛定谔方程的情况下,通过训练得到的神经网络拟合函数直接了解其宏观性质,极大地加速新材料的发现和设计的速度。最近,在机器学习方法的帮助下,物理学家们成功找到了一种适用于做太阳能电极的材料,这是机器学习方法帮助新材料发现的一个典型范例。


3.3 为量子多体波函数提供一种新的描述


一般来说,一个量子多体系统的波函数可以在某组正交基下做展开,正交基的个数(即希尔伯特空间的维数)随着系统尺寸的增加指数发散。以量子自旋系统为例,其波函数可以在Sz算符的本征态下做展开: φ[σ] =ΣσC[σ]|σ> ,展开系数为C[σ],即该波函数在|σ> 这个基下的投影。C[σ]称为该波函数的特征函数,包含了波函数的所有信息。在量子多体物理中,所有基于波函数的方法本质上都是找到一个近似的变分波函数来拟合精确特征函数,其中变分波函数中的变分参数应该远远小于希尔伯特空间维数。换句话说,变分波函数为量子多体波函数提供了一种经济的描述,这种描述需要的计算资源不随系统尺寸指数发散。对于一般的量子多体波函数,不能保证能够找到这样的经济的描述,例如,对于一个完全随机的波函数(C[σ]是随σ变化的随机数),其中所包含的信息量完全不可压缩,要表达这样一种波函数所需的计算资源(如内存的大小)仍然会正比于希尔伯特空间维数。幸运的是,在绝大多数量子多体系统中,我们关心的量子多体态往往不是随机波函数,而是该系统哈密顿量的一个特殊的本征态:基态。相比于随机波函数,基态的特殊之处在于它往往蕴含着某种物理规律,这些规律反映出系统的某些物理性质,并能够帮助我们大大减小描述该基态波函数所需的计算资源。以一维有能隙的量子多体系统为例,物理学家已经证明,这样一类系统的基态的量子纠缠满足面积率,即系统的量子纠缠并不随系统尺寸的增大而增加。换句话说,尽管这类系统的基态不是直积态,但是它们在某种意义上离直积态并不太遥远。这一物理规律帮助人们提出了矩阵乘积态这一变分波函数来有效地近似该基态波函数的特征函数,其中变分参数的个数正比于系统尺寸的大小。在这个例子中,一维有能隙量子多体系统基态波函数纠缠很低这一物理规律帮助我们大大减小了描述这一波函数所需要的计算资源。然而,在更多的强关联系统中,人们并不清楚该系统基态中蕴含的物理规律,这对设计合适的变分波函数提出了挑战。


机器学习算法为这一困难提供了一种新的解决思路。原则上,人工神经网络作为一种普适的函数拟合器,可以拟合任意函数。借助其强大的特征提取和函数拟合功能,人们希望人工神经网络能够在物理学家不知道基态波函数蕴藏的物理规律的前提下,通过大量的训练自动提取出物理规律,并完成对特征函数的拟合。换句话说,任意一个人工神经网络可以看成是一个变分波函数,输入是基,输出是波函数在这个基上的投影。通过调节网络参数,物理学家希望该波函数可以逼近精确的基态波函数。在传统的量子多体变分波函数方法中,物理学家需要事先知道待求解系统基态的某些特点,并基于这些特点设计变分波函数的特定形式,而基于人工神经网络的变分波函数具有普适的结构,系统基态蕴含的规律会在变分的过程中自发的涌现。基于这一思想,物理学家做了大量尝试,例如,在文献中,G. Carleo 和M. Troyer 通过限制玻尔兹曼机作为变分波函数,求解了几种典型的量子磁性模型的基态。但是该方法是否能成功运用到强关联中最具挑战性的问题,如阻挫量子磁性系统和相互作用费米子系统仍然是一个未解之谜。在这些问题中,待拟合的特征函数往往是剧烈震荡的函数(类似于负符号问题),这为人工神经网络的拟合带来了困难。一种可能的解决方案是额外地改变神经网络的结构,将待拟合函数的符号部分和振幅部分分开分别拟合。针对这类问题最近有了一些初步的进展。


4 多体物理在机器学习中的应用


以上我们介绍了机器学习方法运用在量子多体物理中的几个例子。反过来,我们也可以思考是否物理学中的方法和思想可以对机器学习这一领域有所促进?目前,机器学习领域面临的困难之一是在很多情况下,用机器学习方法解决具体问题的过程类似于一个“黑箱作业”,人们对该方法的可行性或有效性没有一般性的判断标准,往往只能依赖经验和直觉。例如,对于机器学习方法成功运用的例子,成功的原因是什么?如何将这种成功推广到类似的问题中? 对于那些失败的例子,为什么会失败?如何系统地进行改进?近年来,有物理学家试图从物理学的角度对这些问题给出答案。例如,从统计物理学的角度,物理学家发现机器学习方法和重整化群方法可能存在某种深刻的联系。重整化群方法是统计物理中研究相变点附近临界行为的重要手段,通过对系统不断地做标度变换和重整化,抽取出反映相变点附近普适行为的重要物理量,即临界指数。在某种意义上,机器学习方法,尤其是卷积神经网络,对信息的处理过程和以上重整化群的思想有异曲同工之妙:通过变换不断过滤掉冗余信息并从中提取出关键特征,最终完成拟合。最近,有物理学家试图从另外一个角度阐述深度学习方法成功解决很多常见问题的原因。他们认为人们通常遇到的现实问题,往往遵循某些简单的物理规律,如具有某种局域性(例如,在图像识别的例子中,局域地改变一些图像的像素往往不会改变该图像最后的标识),同时也可能天然地具有某些层级结构的特征,而这些层级特征很容易被深度学习算法所描述。这些简单的物理规律可能会帮助深度学习方法大大简化要研究的问题,从而取得成功。量子多体物理对机器学习方法的其他重要应用还包括:从量子纠缠的角度重新阐述神经网络的结构;将量子多体方法如矩阵乘积态直接用到图像识别等机器学习中的重要问题上等等。


5 结束语


传统的科学研究的范式是由人来观察自然界,总结抽象出经验和自然规律,进而对客观世界做出预测并通过实验来验证这些预测。随着人工智能技术的发展,科学发现的过程可以在机器的帮助下达到更高的自动化。机器不仅解放了科学家的双手,也可能解放科学家的大脑,即机器不仅是人类观察自然界和做实验的工具,同时将在总结抽象出自然规律方面扮演重要的角色。可以想象,未来机器将有可能“自动地”发现人类目前未知的自然规律,设计出全新的计算方法,解决目前不能解决的科学难题,甚至找出科学发现的新的范式。这些进展一方面可能部分取代物理学家的现有工作,另一方面,它们能够解放人类从事更有创造性的工作,从而极大地促进科学发展。在本文中,我们借用量子多体物理这一例子,讨论了机器学习对于科学研究可能的影响,我们期待未来量子多体物理和机器学习这两个领域的交汇能够碰撞出更为绚丽的火花。


致谢 感谢王磊在本文写作过程中的大量讨论和有益的建议。


本文选自《物理》2017年第9期



十大热门文章

1. 量子力学诠释问题(一)

2. 量子力学诠释问题(二)

3. 高温超导研究面临的挑战

4.  YBCO超导体的电工学应用研究进展

5.  中国纳米白皮书:国之大器,始于毫末

6.  物理学咬文嚼字之八十九:Parity

7.  高温超导太赫兹辐射源与检测器

8. 铜氧化物高温超导体中的电子有序态

9. 超导“小时代”之二十二:天生我材难为用

10. 费米子家族新成员——突破传统分类的三重简并费米子的实验发现

END


更多精彩文章,请关注微信号:cpsjournals


长按指纹 > 识别图中二维码 > 添加关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存