查看原文
其他

精彩回顾 | 第三期哥伦布训练营暨2022材料多尺度计算模拟国际会议DP培训课程圆满结束

DeepModeling 深度势能 2022-09-11

第14届材料多尺度计算模拟国际会议于2022年7月4日至8日在成都举行,由电子科技大学承办,围绕新型自旋电子材料及其输运特性、多体系统的量子理论与计算、高效能源转存材料与器件设计、拓扑电子态与拓扑磁性等方向的议题开展研讨。


2022材料多尺度计算模拟国际会议开幕式


DeepModeling社区受邀参加了此次会议,并于7月7日至8日举办了第三期哥伦布训练营暨2022材料多尺度计算模拟国际会议DP培训课程,共吸引150+名学员报名参与,线上线下好评如潮,赶紧跟随小编盘点一下本次哥伦布训练营亮点和成果,重温一下精彩课程吧~


课程亮点回顾


超强的师资阵容

本次训练营邀请到DeepModeling创始人之一张林峰博士、社区运营负责人王一博老师、北京大学数学学院博士后王亦楠老师、北京科学智能研究院研究员拓娉老师、dflow工作流套件主要负责人蒲建锟老师担任课程讲师。张与之老师协助对学员问题进行一对一答疑。


课上,老师们深入讲解每个项目的闪光点,亮点频现。不同的教学风格、丰富的教学形式为学员们带来了精彩纷呈的课程内容。课后,课程讲师及答疑讲师们收集学员们在课程内容方面存在的困惑和意见。学员们认真聆听、积极交流、纷纷表示受益良多。



丰富的课程内容

不同于以往课程设置,本期训练营我们充分听取了往期学员的建议,不仅有往期备受好评的《DeePMD-Kit理论 & 上机实战》,《DP-GEN理论 & 上机实战》,还加入了DP软件应用于科研领域的实战案例,结合具体材料领域科研案例讲解如何将DP软件应用到科研实践中,在理论学习中夯实基础, 在案例学习中感受DP软件的应用魅力。



理论与实践相结合

如果你认为哥伦布训练营像平常的讲座一样,只需要听和记,那就错了。


哥伦布训练营最大的亮点是上机实践环节,由讲师“手把手”带着大家在Bohrium平台上逐行运行DP系列软件代码,让大家真正将DP系列软件跑起来,并且跑熟练。


学员上机实战


课程内容总结


没来听课的小伙伴也不要遗憾,知识点已经给大家划好了:


DeePMD-Kit、DP-GEN原理介绍&上机实战

训练营第一部分是哥伦布训练营经典的DeePMD-Kit和DP-GEN的讲解。王一博老师深入浅出地介绍了DeePMD-Kit和DP-GEN的原理,又带着大家一起上机实践,亲自动手学习相关软件的使用方式。



DP在能源材料领域的应用和DP+增强采样案例分析

拓娉老师在“DP在能源材料领域的应用”中主要介绍了两个工作:


1. 用DP研究LGPS固态电解质的扩散系数,及Ge和P位点占位无序对扩散系数的影响。

2. 用DP准确预测FAPbI3钙钛矿的相图,发现低温正交相存在多畴,导致实验得到的衍射谱类四方相且无法精确标记。


最后,拓娉老师分享了一个用训练好的DP+OPES增强采样方法计算分子旋转自由能面的案例,并简单介绍了增强采样方法的基本原理、操作流程和注意事项。



DP在合金领域的应用和实战案例分析

王亦楠老师针对DP在合金领域的应用介绍分为三个层次:DP明显优于传统经验势的案例,如何benchmark DP的可用性及DP的长时间尺度和大尺寸结构应用,以及DP与实验的结合。


对于DP明显优于传统经验势的领域,王亦楠老师举例为Ag-Au合金对表面复杂问题的准确预测,和AlCuMg三元势对Al-Cu析出相形核过程的准确描述,还介绍了transfer learning方法的优越性及模型压缩的必要性。


对于如何benchmark DP的可用性,以Mg-Y DP势为例,王亦楠老师介绍了用于固溶元素与位错相互作用研究的DP势需要准确描述哪些性质,包括单质、化合物的基本性质,以及特定缺陷行为。接下来以Mg-Y位错转化问题为例,王亦楠老师介绍了DP可应用于长时间尺度模拟和大尺寸模型预测。


针对DP与实验的结合领域,以MgSnLi析出相形核过程和超高温陶瓷为例,王亦楠老师介绍了DP描述团簇形核过程和合金强化晶界的机理,并与实验结果进行了很好的对照。


课程最后,以Mg-Y和Mg-Zn-Y为例,王亦楠老师介绍了DPGEN过程中需要注意的一些关键问题,包括收敛性测试,初始数据准备,模型偏差力上下界的选取,模型测试内容,以及模型特化方法等。



dflow原理介绍&上机实战

在这一环节,蒲建锟老师分享了DeepModeling社区最新软件:dflow工作流套件。分享内容分为两部分:


第一部分主要介绍了dflow工作流的使用场景和功能:蒲建锟老师首先归纳了材料计算的几种典型场景和常规解决方案,同时分析讨论了现存解决方案存在的困境和问题。从具体问题出发,结合dflow的底层技术,介绍了dflow工作流套件尝试攻克的科学计算的典型难题。通过结合具体案例,分享了dflow工作流套件的几个常用功能的使用方法。


第二部分为上机实战,蒲建锟老师在Bohrium材料计算平台上用dflow+helloworld,dflow+cp2k,dflow+vasp手把手带领大家上手dflow,实现从0到1的突破。



经典问题汇总


在训练营最后,针对大家上机实践中遇到的实际问题,讲师也进行了耐心的解答。这里我们公开了一部分学员提出的问题。对于大家自己在实践中的问题,也非常欢迎来哥伦布训练营问问我们的老师哦。


Q1:能量和力的误差(RMSE)有评估标准吗?应大致分布在什么量级。如果要降低误差(尤其是力)应该从哪些方面着手呢?(还未使用DP-GEN)


A1:  一个简单的估计准则,能量<5E-3eV/atom,力<2E-2eV/A。想降低误差,提高训练步数,增加力的权重(prefactor),以及查看数据质量(1. 是否有原子过近,比如原子间距最好大于两倍RCORE,两倍RDEPT中更大的那个,如果做不到,那就不要小于RCORE/1.2的两倍,避免核交叠。2. 确保收敛准则设置正确)。


如果你的问题比较复杂(比如Li高压相图),准则要相应提高,能量<1E-3eV/atom,力<1E-3eV/A。但是这个力的准则目测过于苛刻,可能很难实现。


Q2:  DeepMD-kit中的lmp默认包含的lammps package有哪些?可以自己添加package进去吗?新加入的包需不需要重新编译?新版本如何编译USER-DEEPMD接口呢?


A2:make package status可以查看当前版本执行文件包含哪些package。可以自己加,make yes你想加的包。


Q3:用多系统数据长训模型后,在测试集上,各个系统的能量偏移都较多如何解决(受力较准)?


  A3:

1. 请先检查训练是否收敛,更长训练会否有显著的误差下降。dpgen完成数据生产后推荐使用所有数据进行一次从头长训,数据量几千至几万frames,合适的训练stop_batch可能在百万到千万步;

2. 训练已经收敛,确认能量偏移是否为近常值shift

  i. 近常值shift,当前模型表现为PES形状较准,但PES位置相对于label_E有整体shift。

   1. 考虑在尽量不影响PES形状(F&V)的前提下修正该shift(E);可加入少量|F|&|V|较小(使得[learning_rate*prefactor*(|F|&|V|)]较小)的new_label使用init-model续refine模型。

  a. label构型的选取可考虑各相长MD轨迹近平衡后段的随机选帧,此时构型对应的受力和应力都较小;  b. 类似地,refine时可同时调整 learning_rate & prefactor, 如减小learning_rate一个量级(保留old数据中学到的信息),并减小prefactor_f及prefactor_v如1-1, 增大prefactor_e如10-10;  c. 注意init-model调整old:new训练数据的访问频率,期望有效refine模型目标表现的同时尽量保留模型在old数据中已学到的有用信息; d.具体参数需测试,类似操作可参考DP水相图工作(PhysRevLett.126.236001的支持信息,https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.126.236001),类似情景讨论及init-model功能介绍可见社区教程

  ii. 非近常值shift,问题可能复杂,考虑进行一般性检验,定位模型or数据问题。基本原则:优先只考虑训练误差、缩小数据集,分离变量,以完成快速测试

   1. 尝试基于已有测试结果反的信息缩小能复现问题的训练数据集,或排除异常数据并调整dpgen策略

观察误差大的构型是否对应特定的条件:如采样自负压、高压、高温等,对应的结构特征如盒子发生膨胀/压缩/倾斜、原子距离相对近等;(力较准该条可能性小)

    i. 条件/特征波动范围是目标课题需要涵盖的,

     1.取对应条件下典型的(如盒子膨胀/压缩/倾斜最严重的)各相label少量,保证合训该部分多相数据会复现问题;并分别单独训练各相数据并测试在各相上的训练误差;分析训练误差。(训练stop_batch比多相全数据训练可显著变短)若在(单相或多相)少量数据上训练误差依然大:

  a. 数据问题,

可能在这类构型上dft计算参数未收敛,检查dft计算参数的收敛性(强烈建议在dpgen开始前完成

  b. 模型表示能力不足

对特定复杂体系可能需要使用表示能力更强的描述符如考虑了3体的se3等(少见)

  ⅱ.条件/特征波动范围过大显著不合理(构型可能来自模型不可靠的前期iter、MD系不合理、构型未被合理设置的trust_f_hi屏蔽等);剔除相应数据并修改dpgen参数使采样更合理,如对熔点以上采样使用npt-iso系而不要使用npt-tri、调整trust等。


第三期哥伦布训练营圆满结营。我们期待更多对科学计算有热情、对DP系列方法感兴趣的同学,能够加入我们的队伍。我们会倾尽所能,帮助各位想要上手DP系列软件的新人、遇到使用难题的熟练者。让我们一起,共同定义科学计算未来!











本期哥伦布训练营上机教学部分在微尺度科学计算云平台Bohrium运行。通过弹性调度海量计算资源,Bohrium为用户提供第一性原理计算、分子动力学,高通量材料筛选的完整解决方案。若您希望使用 Bohrium平台,欢迎邮件联系 bohrium@dp.tech。


- End -

(如需转载图文请与公众号后台联系)

-------------------------------

推荐阅读

加入哥伦布计划,发现计算模拟新大陆!

哥伦布训练营40问 | 第二期答疑干货分享

第一期哥伦布训练营回顾


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存