香港城大赵仕俊团队综述：机器学习方法在高熵陶瓷材料的应用！

材料科学与工程 2023-02-26

传统陶瓷因其易于制造，是人类最早使用的材料之一，其中碳化物、硼化物和氮化物现已被广泛应用于金属切割和热电保护层等。现代社会对新型陶瓷材料提出了更高的要求，例如，下一代核能技术的服役条件将更为苛刻（高温、高压和强辐照），用于其中的核用陶瓷材料需要能够承受这些极端环境。为了达到新兴技术对陶瓷材料更高的要求，研究者不仅需要优化传统陶瓷材料，更需要提出全新的材料设计方法。为此，高熵陶瓷材料提供了一个广阔的新材料理性设计平台。近年来，该类材料受到了学界的广泛关注。然而，如果仅靠传统的试错法，高熵陶瓷背后巨大的相空间将严重阻碍高性能陶瓷材料的开发与探索。为此，研究者可以借助机器学习这个有力工具加速高熵陶瓷的设计和筛选。

近日，香港城市大学赵仕俊团队（通讯作者）综述了机器学习在高熵陶瓷领域内的应用。作者首先总结了该领域机器学习的通用流程。然后，文章强调了现阶段数据集产生的窘境：缺乏高质量数据集。而后，作者重点讨论了该领域机器学习模型的特征工程方法，包括特征选择与输入特征的预处理，紧接着讨论了模型的泛化、解释和迁移。作者进一步总结了近些年发表的用于设计高熵陶瓷材料的机器学习模型。最后，作者提出了现阶段高熵陶瓷机器学习模型的挑战，并展望了机器学习在该领域内未来的发展方向。相关内容以“Rational design of high-entropy ceramics based on machine learning – A critical review”为题发表在知名期刊《Current Opinion in Solid State & Materials Science》。

论文链接：

https://doi.org/10.1016/j.cossms.2023.101057

图 1 应用于设计高熵陶瓷材料的机器学习工作流程。

高熵陶瓷机器学习流程主要包括数据集收集、特征工程、模型训练与选择、模型部署、实验验证和数据集补充。若使用非经验输入特征，可跳过特征工程步骤。

图 2 三种获得输入特征的方法。

高熵陶瓷描述符（特征）可以根据其获取的难易程度分为三类。第一类为非经验特征，如独热码。该类特征不包含陶瓷材料的物理特性。第二类为原子/前驱体特征。该类特征不需要额外的实验与模拟即可获取，但包含一定的物理意义。第三类为通过实验或模拟获得的特征信息。该类特征成本高昂，不适合用来作为输入，而可以用来作为模型的输出。

图 3 熵形成能力（EFA）强弱示意图。

EFA值越大，说明不同构型的准基态能量越相近，体系越容易达到不同构型。因此，体系中的原子排布越趋向于随机。

图 4 价电子浓度（VEC）与弹性常数C44、硬度和G/B比值的关联。

对于非高熵体系（金属元素种类低于三），陶瓷材料的价电子浓度与材料的各项性能高度相关。如弹性常数、硬度和G/B比值均随VEC的增加而降低。

图 5 五折交叉验证、过拟合和模型高精度预测区域（模型舒适区）的示意图。

由于缺乏高质量数据库，已发表文章使用的数据集通常比较小。在这种情况下，数据集分割可能对模型的训练及预测产生比较显著的影响。为此，现有高熵陶瓷机器学习往往采用交叉验证的方法训练模型。在训练过程中，训练损失将随着迭代轮数的增加而降低，而验证损失一般高于训练损失。二者之间的差值是由过拟合导致的。由于数据集在相空间中的分布不均一，模型对各个组分的关注程度也不同。因此，训练好的模型往往存在一个“舒适区”，在“舒适区”内，模型表现良好；而在该区域外，应当审慎地理解模型预测结果。

图 6 用于预测高熵陶瓷材料单相稳定性的机器学习模型。

图 7 用于设计高熵陶瓷材料的深度学习模型。

展望：

建立高质量共享数据库、无监督学习、多功能机器学习模型、机器学习逆向设计、可解释机器学习模型、机器学习结合的高通量实验。

招生：

论文通讯作者赵仕俊团队长期招收计算材料和机器学习方向的博士生，欢迎优秀学生联系 shijzhao@cityu.edu.hk。赵老师主页：https://scholars.cityu.edu.hk/en/persons/shijun-zhao(b956b94f-a138-4df9-880b-f82528cb3ecb).html

*感谢论文作者团队对本文的大力支持。

推荐阅读：

麻省理工：核辐射居然也可能缓解晶界腐蚀

欢迎微信后台回复“应聘编辑”加入我们