查看原文
其他

DP能干这么多?DP在材料科学中的应用综述

深度势能 2022-09-11

The following article is from Materials Futures Author D. Srolovitz团队





研 究 背 景 


原子模拟在材料科学中正在发挥越来越重要的作用,并正在改变以实验为主导的材料科学的研究方式。材料模拟中的原子模拟都需要输入某种形式的势能面(PES)来描述原子间的相互作用,从而可以确定原子的受力。获得势能面最准确的方法是在Born-Oppenheimer近似下,求解基于电子结构量子力学的薛定谔方程。

然而,在最广泛使用的电子结构方法密度泛函理论(DFT)中,计算速度一般和原子数的三次方成正比。这种正比关系使得DFT在大型材料系统(超过1000个原子)和长模拟时间(例如分子动力学MD的纳秒量级)的应用中非常昂贵。一种来解决这个效率问题并广泛应用的方法是开发经验的原子间势函数。这些势函数通常基于物理和化学的认知,通过假定一个解析函数来描述原子位置与系统能量之间的关系。尽管使用这些经验的原子间势函数可以很容易地进行大规模、长时间的原子模拟,原子模拟描述真实材料体系的准确性通常受到势函数假设的限制。在这个情况下,研究人员面临着一个窘境,即量子力学方法准确度高,但效率很低;经验原子间势函数效率高,但是通常准确度有限

为了解决以上面临的问题,基于机器学习的势函数方法在近些年取得了巨大进展,并得到了广泛应用。深度势能(Deep potentials,简称DP)是机器学习势函数的一种,于2017年首次提出,已被广泛应用于不同的材料体系。DP的基础理论也不断地在发展,这使得DP能够更好地结合准确性和效率。最近,DP已在最先进的超级计算机上以第一性原理的精度应用于超过1亿个原子的MD模拟,并获得了2020年高性能计算的戈登贝尔奖,相关成果入选当年中国十大科技进展。这个例子充分体现了物理建模、机器学习和高性能计算的相互集成和融合。


  研 究 亮 点  

本综述介绍了应用于计算材料学中的深度势能DP方法,重点阐述DP方法背后的理论、DP的开发方法和使用。同时,本综述回顾了DP在不同材料体系中的应用,介绍了DP Library作为DP开发平台和数据库的作用,并在准确性效率上将DP与第一性原理方法和经验势函数作了系统的比较。


  图 文 导 读  

01

DP的理论介绍

目前DP中主要有两类描述原子环境的描述子,即对原子坐标的不光滑和光滑映射。不光滑描述子背后的理论是为每个原子和其截断半径内的原子建立一个局部的坐标系,并根据离中心原子的距离对近邻原子进行排序。这可以保证原子环境的平移、旋转和置换对称性(图1)。光滑描述子的构建方式如图2所示,主要通过(1)构建局部的环境矩阵;(2)构建嵌入矩阵;(3)构建描述子等三个步骤完成。对于光滑描述子,目前有三体嵌入和双体嵌入两大类描述子。在实际应用中,两种或多种描述子可以同时使用,从而构成混合描述子。
图1 构建不光滑DP描述子的示意图(水分子为例)

图2 构建DP光滑描述子的流程图

02

DP的相关软件

目前开发DP主要需要用到三种软件:(1)dpdata:用于将DFT软件的计算结果转换成DeePMD-kit接受的数据格式;(2)DeePMD-kit:用于做DP训练以及计算;(3)DP-GEN:用于有效地采样和标定训练数据。DP-GEN软件调用了DeePMD-kit和DFT计算软件包,从而可以自动地产生和测试DP。
图3 DP-GEN的流程示意图

03

DP Library

DP Library项目是共享和发布DP和训练数据集的平台。首先,DP Library是模型共享的平台,类似于其他原子间势函数的存储库。其次,DP Library提供了一个数据共享的机会。研究人员可以贡献和下载用于训练已发布DP的DFT数据集。如果需要对DP进行优化或改进,可以先将新数据添加到从DP Library下载的训练数据集中,然后使用DeepPMD-kit进行训练。用于产生数据集的DFT计算设置会在网站上提供,所以新数据可以以与下载的数据集相同的方式生成。共享的训练数据使得已发布的DP具有可重复性并且可以改进。DP Library可以通过链接https://dplibrary.deepmd.net/进行访问,图4给出了目前网站的截图。
图4 DP Library的网站截图,加黑的元素表明有上传的DP模型

04

DP压缩模型

在使用DP的过程中,最花费计算时间的步骤是嵌入网络的计算和通过公式组装描述子。DP压缩模型的目的是减少与嵌入网络相关的计算和内存开销,并保证压缩后模型的精度。以下,DP压缩模型的表现以Cu、H2O和Al-Cu-Mg三元合金DP为例。压缩后,模型的计算速度在CPU上加速了9.7(Cu)、4.3(H2O)和18(Al-Cu-Mg)倍,并在英伟达 V100 GPU上加速了9.7(Cu)、3.7(H2O)和16.2(Al-Cu-Mg)倍。在一块GPU上可以运算的最大原子数相应地从12000、49000和5000增加到129000(Cu)、246000(H2O)和61000(Al-Cu-Mg)。图5(a) 和 (b) 展示了Ti的DP压缩模型与EAM、MEAM势函数在CPU和GPU机器上的速度比较。注意这里的DP比EAM和MEAM截断半径要长。在CPU机器上,DP压缩模型比EAM势函数慢200到300倍,比MEAM势函数慢30到40倍。在GPU机器上,DP压缩模型比EAM势函数慢20到30倍,MEAM势函数目前还不支持GPU加速。所有势函数的速度都显示出与原子数呈线性比例关系。由于这种线性和速度,压缩后的DP模型可用于执行大规模MD模拟,并能以第一性原理精度研究各种性质,例如缺陷性质、相变和输运系数等。
图5 Ti DP压缩模型与EAM和MEAM势函数在(a)CPU和(b)GPU机器上的速度比较

05

DP针对特定应用的“专门化”

从DP-GEN方法产生的通用DP对于一些复杂现象的描述可能不够准确,这时就需要对DP进行“专门化”处理。由于DP-GEN中的探索策略可能对所关心现象的相关构型无法提供足够的采样,一些特殊的结构需要加入到训练过程中来更好地描述一些微妙的性质。“专门化”DP的工作流程如图6所示。
图6 “专门化”通用DP的流程图
此处以“专门化”Ti DP来描述相关的力学性质为例。图7(a) 和 (b) 分别展示了不同的经验原子间势函数和DFT在Ti HCP Basal和Prism面上的γ-line结果,所有的经验势函数均低估了Basal面的堆垛层错能。当在训练数据中加入红色虚线框内以及原点的结构后,DP整体的γ-line与DFT符合较好。在此基础上,<a>方向螺位错在Prism和Pyramidal I面上的相对能量如图7(f) 所示。可以发现,<a>方向螺位错在Pyramidal I面上比在Prism面上更稳定,这与之前DFT计算和实验测量结果相符合。另外,图8展示了DFT、DP和MEAM势函数对<c+a>方向螺位错核心结构的计算结果。DP的计算结果与DFT定性上吻合:核心有一个长的扩展区域和一个不对称紧凑的局部核心,而经验势函数MEAM的结果与DFT差别较大。
图7 Ti HCP不同面上γ-line计算结果(a-e)以及<a>方向螺位错不同核心结构的能量(f)
图8 DFT、DP和Hennig势函数计算得到<c+a>的螺位错在Pyramidal I面上的核心结构

06

DP在材料科学中的应用范例

在过去的几年时间内,DP已被应用到了各种不同的材料体系中,包括(1)单质体系;(2)多元体系;(3)水相关体系;(4)分子体系和团簇;(5)表面和低维体系。表1列出了到目前为止,应用了DP的材料体系。
表1 材料科学中DP的应用范例
图9展示了DP在水相图中的应用。虽然DP和经验势函数TIP4P/2005在低中压范围内表现均较好,DP比TIP4P/2005在高压处与实验更为接近,特别是在VIII、VII和VI的相边界处。与实验不同,TIP4P/2005预测了一种从VII到塑性相的一级相转变,DP的预测与实验相符。考虑到水的重要性、水相图中温度和压强的变化范围以及表示自由能所需的高精度,水相图的研究对DP而言是一个里程碑。
图9 DP和经验势函数水相图的计算结果与实验的比较

07

实际应用中DP的精度

7.1 DP有多准确
在大多数例子中,DP和DFT在能量和力的均方根误差一般小于10 meV每原子以及100 meV每埃。在某些体系中,例如水相图中,误差大约是1 meV每分子。这种精度对于大部分的应用都是足够的。在表1中,大约一半的例子关注的是非晶体系(液体和无定形体系)。与DFT相比,基于DP的计算模拟在液体性质如液态结构、扩散系数和热导率等方面是特别准确的。
虽然DP的灵活性对于描述复杂的势能面是很理想的,但DP最终的准确性往往受到DFT训练数据集精度的限制。由于DFT本身也是一种近似的方法,有时候不可能与真实情况完全一致。一般可以通过使用更准确的交换和关联DFT泛函来提高DFT的精度,比如爬Jacob的梯子,从LDA到GGA,到meta-GGA再到hybrid-GGA,再到非局域的方法。在实际应用中,DP最终的准确度和使用的训练数据集有关,而训练数据集的精度与选取的DFT泛函有关。由于Jacob梯子越往上,计算速度越慢,因此泛函的选取也是在精度和速度之间选择一个平衡。
7.2 从之前DP的应用中得到的经验
在DP开发的早期阶段和简单的应用中(例如液态结构的模拟),精度的要求并不是太高,因此采样的效率不是特别关键。对于这些简单的应用,基于少量第一性原理MD轨迹的训练集得到的DP往往会给出高效和准确的结果。然而,当需要通用的DP或者目标性质比较微妙时(如两相的能量差很小或缺陷性质),第一性原理MD可能不能足够或者有效地采样到与目标性质相关的构型。这可以通过上述描述的DP-GEN和“专门化”得到解决。“专门化”的过程随着体系和目标性质而改变,并且可以认为是基于物理认知地对DP进行微调。
7.3 DP模型什么时候值得信赖
在执行完通常的一套对DP的性质测试后,经验告诉我们这些DP在原子模拟中可以给出比较准确的结果。对于所有的机器学习势函数两个最重要的问题是表示能力和泛化能力。表示能力意味着函数形式准确再现训练集中目标性质的能力,泛化能力是势函数描述那些不在训练过程中性质的能力。DP的表示能力在绝大多数情况下都是很好的。当用户不确定DP是否具有泛化能力时,在与DFT结果和实验验证后,DP可以与模型之间的偏差(model deviation)一起使用。DP和其它经验势函数一样受到下面格言的限制,“在发现是不准确前都是准确的”或者“在不能用之前都是可以用的”。从这个角度来说,用机器学习势函数替代DFT是完全不可靠的,DFT仍然是在需要高精度性质预测时的一种方法。DFT与DP的结合提供了一个满足材料科学界需求的实用策略,给准确性和计算效率之间提供了一个平衡。

08

实际应用中DP的效率

通过之前DP应用的例子,对DP效率的总结如下:(1)在CPU机器上,压缩后的DP比DFT速度快超过106倍,比经验势函数如EAM(MEAM)慢约100(10)倍;(2)在GPU机器上,DP压缩模型比EAM势函数慢10倍的量级。当然,实际速度取决于真实的应用(尤其是与DFT相比)。压缩的DP可以比原始DP快超过10倍并且消耗更少的内存。对DP核心神经网络进一步的优化可以通过计算路线上算符的优化和硬件的改变来实现。在CPU和GPU机器上,DP和经验势函数的速度都随着原子数的增多而线性上升,而这种线性关系是进行大规模原子计算的前提。考虑到DP中大量的参数(通常在105量级),DP比经验势函数慢是合理的。因为DP目前并且在未来都会比经验势函数慢,简单的经验势函数在材料科学中仍会扮演着重要的角色。机器学习势函数和更简单的经验势函数之间的“竞争”推动了两者的不断进步。机器学习势函数领域继续关注于提高计算速度,而经验势函数继续在开发能够提高精度的形式。“由经验势函数中的物理原理指导的机器学习势函数”也是最近兴起的一个热点领域。

总结与未来展望 

机器学习势函数(MLPs)已经成为一种描述原子模拟中势能面的新方法,并实现了准确性、通用性和效率之间的平衡。深度势能(DP)方法是一种MLP,并在近些年发展迅速,广泛应用在了不同的材料体系中。本文综述了DP方法(机器学习势函数的一种),总结了基本理论、如何开发DP和应用DP相关的软件和数据库、如何使得DP在应用中更加有效以及如何针对特定的应用场景“专门化”DP,回顾了一些DP的应用范例,并讨论了DP的精度和效率。经过这些年的进步,DP方法现在已经比较成熟,而且在开源社区框架的推动下在精度和效率上也在不断改进。DP接下来几年大致会在以下五个方面继续发展:(1)开发有更好预测能力、更智能的描述子;(2)使DP训练和“专门化”更加自动;(3)优化DP的计算速度;(4)将DP和目前在自然语言处理中广泛应用的transformer结合起来;(5)继续改进开源的DP Library,增加所包含的模型数量和训练数据

#   作 者 简 介   #


  文 通 其  

香港大学机械工程系博士后,曾在香港城市大学高等研究院担任杰出博士后。2014年本科毕业于西北工业大学,2019年博士毕业于西北工业大学与美国爱荷华州立大学埃姆斯国家实验室(联合培养)。主要研究领域包括材料的缺陷性质、液体和玻璃结构和动力学的分子动力学模拟、通过传统和机器学习方法开发原子间势函数、无机材料结构和物理性质的DFT计算等。曾获得2021年美国陶瓷协会Ross Coffin Purdy奖。 


  张 林 峰  

北京科学智能研究院副院长,北京深势科技公司创始人及首席科学家。2016年本科毕业于北京大学元培学院,2020年博士毕业于普林斯顿大学应用数学系。通过结合机器学习和多尺度建模方法,有效解决了计算化学、分子模拟、增强采样等方向中的一些关键问题,对物理、化学、材料、生物等领域的第一性原理建模和模拟产生较大影响。与合作者发展了DeePMD-kit等开源分子模拟软件和DeepModeling开源社区。2020年作为核心开发者的工作曾获得高性能计算领域最高奖ACM戈登贝尔奖,相关研究成果入选当年中国十大科技进展。


  王 涵  

北京应用物理与计算数学研究所研究员。2002年进入北京大学数学科学学院学习,2006年获学士学位,2011年获博士学位,师从张平文院士。主要研究兴趣为分子模拟中的多尺度建模与计算方法,以及基于深度学习的分子建模。2019年入选北京市青年人才托举工程,曾获中国数学会计算数学分会第五届青年创新奖。2020年作为核心开发者的工作曾获得高性能计算领域最高奖ACM戈登贝尔奖,相关研究成果入选当年中国十大科技进展。


  鄂 维 南  

中国科学院院士,北京科学智能研究院院长,北京大学国际机器学习研究中心主任。在国际上率先提出“AI for Science”的概念,大力推动了 AI for Science 在应用数学、物理、化学、力学、材料学、生物学等多个领域的发展。他和合作者们开创了深度学习和微分方程相结合的研究领域,并把机器学习系统地应用到多尺度建模领域,在量子多体问题、密度泛函理论、分子动力学、动力学方程、连续介质力学等多个领域都做出了原创性突破。他和合作者依靠在科学计算、机器学习和高性能计算交叉领域的突出贡献而获得2020年高性能计算最高奖ACM戈登贝尔奖,并受邀成为2022年国际数学家大会一小时报告人。


  David J. Srolovitz  

美国工程院院士,香港工程科学院院士,香港大学工程学院院长,MRS、TMS、ASM以及英国物理学会会士,曾获MRS材料理论奖。主要从事材料理论与计算等方面的研究工作,在材料结构缺陷、固体微结构与形貌演化、材料力学行为与薄膜生长等领域取得了具有开创性与重大影响力的研究成果。曾任埃克森公司和洛斯阿拉莫斯国家实验室工作人员,也是新加坡高性能计算研究所的执行主管。曾在密歇根大学、普林斯顿大学、Yeshiva大学、宾夕法尼亚大学和香港城市大学担任教授,任教方向包括材料科学、机械工程、航空航天工程、计算机科学、物理学和应用数学等。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存