东南大学王金兰课题组Adv. Mater.: 人工智能加速新型二维铁磁材料研发
The following article is from 科学材料站 Author 王金兰课题组
点击蓝字关注我们
基于机器学习技术的材料设计模式已在光伏、催化和电池等材料的开发中取得了显著成就。然而受制于高质量二维磁性材料数据的匮乏以及高效二维/磁性材料描述符的缺失,机器学习技术在二维铁磁材料设计中的应用依然是一个巨大的挑战。
结合机器学习和多层晶体图描述符加速二维铁磁材料研发
作者:陆帅华1,周跫桦1,过伊吕,章烨晖,吴艺蕾
通讯作者:王金兰*
通讯单位:东南大学
这项工作突破了机器学习技术在新型二维铁磁功能材料设计领域的瓶颈,为解决二维磁性材料,特别是铁磁半导体和半金属的短缺问题提供了一个极具潜力的策略。构建的材料智能化设计方案,将极大地加速二维功能材料的研发进程。
要点解析
图1.
图1显示了二维铁磁材料智能化设计流程。
(1)数据准备。从材料数据库C2DB中收集了2569个包含晶体结构,热稳定性和自旋带隙信息的二维材料作为机器学习训练集和测试集。其中,训练/测试集中的所有二维磁性材料的磁基态都通过严格的第一性原理高通量计算进行确定(在构建超胞的前提下,考虑所有铁磁和反铁磁构型)。然后,从其他二维材料数据库中收集仅包含晶体结构信息的3759个候选材料作为预测集(未进行过磁性研究)。
(2) 机器学习过程。利用特征工程对特征进行挑选,将训练/测试集放入机器学习模型进行训练和测试,使用训练好的模型对预测集中候选材料的热力学稳定性、磁基态和带隙值进行预测。
(3) 筛选选择过程。从机器学习模型的预测结果中交叉筛选出热力学稳定的二维铁磁半导体、半金属和金属。
(4) 第一性原理计算验证。对所有筛选出的二维铁磁材料的热力学稳定性、电子性质、磁性和居里温度进行细致的第一性原理计算。
图2.
图2显示了多层晶体图描述符(CGMD)。数据集中的所有二维材料(训练,测试和预测集)包含了100多种不同的晶体结构,组成元素覆盖了除惰性气体和放射性元素外的整个元素周期表。在数据集规模较小的情况下,复杂的材料组成和结构对于机器学习模型的建立是非常困难的,即仅仅利用传统的向量描述符或者几何描述符来进行构效关系的描述将难以取得较好的效果,对于成因复杂的磁性性质来说会尤为困难。
为此作者基于晶体图论和元素性质发展了一种新型描述符CGMD来克服这一难题。首先,基于晶体图论,二维材料的晶体结构被转换为原子邻接矩阵,该矩阵表示相邻原子之间的连通性。黑框/白框分别表示晶体中相邻原子成键/不成键的情况。然后,基于元素特征构造元素特征矩阵(矩阵主对角线元素由原子本身的元素属性组成,非对角元素表示相邻原子间的元素属性的相对比值),在这里我们选取了7种基本元素性质,包括门捷列夫数、原子的未配对电子数和空轨道数、电负性、共价半径、原子化焓、第一电离能和原子极化率。
最后,将每个晶体结构的原子邻接矩阵分别点乘不同的元素特征矩阵,每一个矩阵我们定义为特征层。由于数据集中的材料具有不同数量的原子,导致不同材料的描述符的维度不一致。为了利于机器学习模型学习,每个材料的描述符矩阵都会扩展为48×48×7的大小,其中48是材料中包含的最大原子数。
图3. 机器学习测试结果和材料描述符CGMD重要性分析
a) 特征层选择结果。每个目标材料性质都由三个最重要的特征层进行定义。b) 具有迭代反馈回路的机器学习流程图。c) 机器学习分类模型在热力学稳定性水平,磁基态和带隙方面的测试性能。d) 针对磁性基态分类和带隙分类,每个特征层在对应的CGMD中的相对重要性。每个矩阵元素中颜色的深度与其对相应材料性质的相对重要性成正相关。每个重要的特征矩阵仅显示其中的一半,阴影部分表示省略了的上三角矩阵(由于晶体结构具体对称性)。总相对重要性定义为所有下三角矩阵元素的相对重要性之和。图3显示了机器学习测试结果和材料描述符CGMD重要性分析。在材料数据和描述符准备好的情况下,我们分别使用GBC(gradient boosting classification, 梯度增强分类器)分类算法对于热力学稳定性、磁基态和带隙进行特征层选择。
如图3a所示,所有三种目标材料性质的CGMD都包含门捷列夫数特征层,它描述了晶体结构的原子局部环境。除此之外,未配对电子数特征层也成为描述磁基态和带隙的最重要的三个特征之一。这一特征层通过考虑金属原子的未配对电子数和非金属电子中的未占据轨道数来描述材料的电子配位情况,这对于电子性质和磁性质非常重要。原子化焓(化学键形成或者断裂过程中焓的变化)通常描述键的强度,对热力学稳定性和磁性非常重要。
此外,电负性特征层包含在热力学稳定性以及带隙的CGMD中,反应了元素的电子性质。显然,这些筛选出的特征层在很大程度上与我们的物理化学直觉相符,表明我们特征选择方法的准确性。构建了每个目标性质的最佳CGMD之后,分别训练GBC模型来预测材料的热力学稳定性、磁基态和带隙。
在机器学习过程中,为了提高GBC模型的泛化能力,改善训练/测试集的不完备性,我们采用了迭代反馈回路。在每个循环中,如果材料性质的某个类别的分类概率误差大于10%时,则通过第一性原理计算进行详细验证,然后把计算结果作为训练数据反馈到下一个循环里。最终,机器学习分类模型在三个目标性质上都得到了90%以上的预测准确率。
此外,通过机器学习模型中的特征层相对重要性排序,我们可以更好地理解模型的结果。如图3d所示,近邻原子(矩阵中的非对角线元素)之间的相互作用对于相应的材料属性(磁基态以及带隙)明显要比每个单独元素(矩阵得对角线)的属性更为重要。在磁基态分类中,门捷列夫数特征层在磁性/非磁性分类中起着最重要的作用,而未配对电子数特征层在铁磁/反铁磁分类中起着最重要的作用。在带隙分类中,除了门捷列夫数特征层外,未配对电子数特征层对半导体/金属和半金属/金属分类都有重要影响。从机器学习模型获得的这些结果表明,我们的模型可以有效地从数据中提取物理化学知识,并构建具有相应材料性质的映射,从而获得良好的预测性能。
在包含3759种材料的预测集中,有1424种材料具有较高的热力学稳定性(占总数的37.5%);在磁基态预测中,有252种材料具有本征铁磁性(占总数的6.7%);在带隙预测中,有1574种材料是二维半导体(占总数的42.1%)。
综合来看,共有125种材料是铁磁半导体,40种材料是铁磁半金属。元素丰度分析表明铁磁材料多含有V、Cr等3d过渡金属,而氧化物和卤化物半导体的数量多于包含S,Se,Te,N,C等元素的半导体数量。最后,作者交叉筛选出了93种具有优异热力学稳定性的二维铁磁半导体/半金属/金属。图4. 机器学习预测结果的统计分析
要点五:
图5. 第一性原理计算验证结果
结论
综上所述,作者开发了一种能够对不同二维晶体结构的不同复杂性质进行智能化筛选的材料设计平台。该平台将机器学习算法与第一原理高通量计算相结合,实现了对二维磁性材料的高效筛选。筛选发现的大量二维铁磁材料将为实验和理论磁性研究提供丰富的研究对象。同时,设计的新型材料描述符将助力其他二维功能材料的筛选与设计。
https://onlinelibrary.wiley.com/doi/10.1002/adma.202002658
免责声明:部分资料来源于网络,转载的目的在于传递更多信息及分享,并不意味着赞同其观点或证实其真实性,也不构成其他建议。仅提供交流平台,不为其版权负责。如涉及侵权,请联系我们及时修改或删除。邮箱:chen@chemshow.cn
扫描二维码
关注我们
微信号 : Chem-TTC
诚邀投稿
欢迎专家学者提供化学化工产学研方面的稿件至chen@chemshow.cn,并请注明详细联系信息。化学技术转移中心®会及时推送。