Nature Com.: 深度神经网络准确预测材料结构稳定性
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
预测材料结构稳定性是材料科学核心问题之一。传统预测稳定性的方法是通过第一性原理计算。然而随着晶体原子数和结构复杂度的增加,这样的计算会变得十分昂贵。近年来,机器学习因其能从已知数据中分析规律,并对未知数据进行预测的能力而备受瞩目。
加州大学圣地亚哥分校Shyue Ping Ong教授课题组利用机器学习中的神经网络模型,实现了准确预测晶体材料的形成能。以C3A2D3O12石榴石和ABO3钙钛矿为示例,其预测误差分别在7-10 meV/atom和20-34 meV/atom之内。
图1:C3A2D3O12石榴石和ABO3钙钛矿晶体结构。
采用机器学习来预测材料结构能量近年来十分热门,然而大多数工作的预测误差都在70-100 meV/atom,使得其很难用于有效预测材料的稳定性。来自加州大学圣地亚哥分校的Shyue Ping Ong课题组认为,较高的误差可能来自于对特征向量,学习目标以及算法的不当选择。该课题组研究人员从Pauling规则和Goldschmidt半径规则中汲取灵感,选择了晶体中占据每个Wycoff位置原子的电负性和离子半径作为晶体的特征元素,进行模型优化。同时,他们重新定义了以二元化合物为参照物的形成能作为模型学习目标。在算法方面,研究人员在确定了特征向量和学习目标之间为复杂非线性关系之后,合理选择了可以模拟任意复杂度非线性方程的神经网络模型(图2)。
图2:神经网络结构
基于以上设定,针对635个unmix(各wycoff 位置为单一元素占据)石榴石,研究人员实现了 7-10 meV/atom的预测误差(图3),远低于现有模型 (误差约100meV/atom)。在加入了772个mix(其中一个Wycoff位置以特定比例为两种元素占据)石榴石结构后,研究人员引入了新颖的二进制独热编码,以增加最少特征元素为原则,编码对应mix化学式的穷举得到的结构,得到的误差也与unmix模型接近(图3)。
图3:神经网络模型预测C3A2D3O12石榴石和ABO3钙钛矿形成能
基于对形成能的准确预测,研究人员进一步用预测的形成能计算出Ehull, 并作为判断结构是否稳定的判据。从图4可以看出,在严格选择Ehull = 0 为稳定相的判据时,用最优化的模型对各种石榴石结构稳定性的预测准确率均在90%以上。 在穷举的8427个混合石榴石化学式中,基于Ehull预测得到2307个潜在的稳定结构。
为证明该方法的普适性,研究人员用包含240个unmix和302个mix钙钛矿数据集,用相同的方式训练了三个模型。模型对于unmix和整体数据集的预测误差都在21-39 meV/atom内(图3)。类似的,基于Ehull=0为判据预测稳定相的准确率达到了80%以上。
图4:基于Ehull预测晶体稳定性准确率
该工作实现了机器学习预测材料稳定性的高准确度,可实现取代高通量第一性原理计算的目标,大大加速新材料的发现。更重要的是,该方法指出了在应用机器学习解决化学问题时,应理性选择晶体特征向量,善用领域知识,以得到最紧凑、有效的晶体结构特征表达,避免得到包含多达几十甚至几百参数的臃肿特征向量。其次,对于学习目标的选择,也应妥善考虑目标值域,并加以变通。另一方面,该方法提出了对于含有混合占有率的无序结构进行特征编码的新颖方法,使得对该类结构的预测保持与有序结构接近的误差水平。这大大扩展了模型的可预测化学空间,极大提高了预测新材料的效率。最后,虽然文章只用了两种石榴石和钙钛矿结构所谓演示,但理论上该方法可适用于任意结构模型。
Ye, Weike, et al. "Deep neural networks for accurate predictions of crystal stability." Nature communications 9.1 (2018): 3800.
扩展阅读
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方