查看原文
其他

威斯康星大学麦迪逊分校Ying Li课题组 CEJ: 使用可解释机器学习及高通量筛选发现多功能聚酰亚胺结构

高分子科技 高分子科技 2023-05-03
点击上方“蓝字” 一键订阅


近期,威斯康星大学麦迪逊分校Ying Li课题组利用机器学习和分子动力学模拟,建立了一个针对聚酰亚胺结构的机器学习预测框架,可高效地筛选新型高性能聚酰亚胺材料,为加速高性能聚酰亚胺材料的发展提供了理论指导。聚酰亚胺因其优异的机械和热性能而在现代工业中得到广泛应用,但其开发和应用往往需要耗时数年甚至数十年。为了解决传统试验研究的长周期与高成本问题,Ying Li课题组提出了可显著地加速新型高性能聚酰亚胺材料的设计—可解释的机器学习筛选框架。具体来说,首先,以已有的2000种聚酰亚胺高分子化学结构为依据,采用深度神经网络模型建立聚合物的“结构 - 性能”内在联系,并解释了机器学习模型物理意义。其次,通过优化不同的深度神经网络模型参数,构建了聚合物的7种热力学模型。然后,通过数值交联不同原材料小分子建立了一个包含800万个假想聚酰亚胺结构的数据集(图1),并使用训练好的机器学习模型对其7种热力学性质进行了预测与评估。最终从中筛选出超出目前已有聚酰亚胺性能的新型高强耐高温材料(图2)。为了方便查询已筛选出的高性能聚酰亚胺材料,研究团队创建了一个在线平台https://polyimide-explorer.herokuapp.com/,该平台嵌入了开发的机器学习模型,并提供了交互式可视化功能。此外,数值交联时所使用的原料小分子都是现有且可购买,所以这些假想聚酰亚胺结构不仅理论上可行,而且可进行试验验证。根据高通量筛选的结构,该研究组成功合成了一种新型聚酰亚胺结构,并通过试验验证了其耐高温性能,进而论证了所建立机器学习模型的准确性(图3)。这项工作建立了一个大型的聚酰亚胺结构数据集,并实验验证了其筛选出的新型高性能结构,为高性能聚合物材料的开发与测试提供了科学的理论指导,该工作以“Discovery of Multi-Functional Polyimides through High-Throughput Screening using Explainable Machine Learning”为题发表在《Chemical Engineering Journal》上。文章共同第一作者是康涅狄格大学机械工程系博士后Lei  Tao博士,威斯康星大学麦迪逊分校机械工程系博士后Jinlong He博士,以及弗吉尼亚理工大学化学系博士生Nuwayo Eric Munyaneza。该研究得到美国空军研究实验室和美国国家科学基金会的支持。


首先,聚酰亚胺主要通过两种类型的缩聚反应形成:二酸酐和二胺间的缩聚反应并移除一个水分子形成(图1a),或者二酸酐和二异氰酸酯间的缩聚反应移除二氧化碳分子(图1b)。因此,聚酰亚胺含有两个互相连接的酰亚胺基团,(图1a-d中以红色阴影突出显示)。基于实验记录的高分子数据库——PoLyInfo数据库,图1c展示了数据库中收集的2233种真实的聚酰亚胺结构。当将这些2233种真实的聚酰亚胺映射到二维化学空间中,他们发现它们在结构上非常相似(图1e中的绿色点)。这表明真实聚酰亚胺的多样性仍然有限,远未覆盖所有潜在的聚酰亚胺化学结构。目前,基于如图1a-b所示的合成路线,通过使用不同的二酸酐和二胺/二异氰酸酯组合,试验中已经成功合成多种聚酰亚胺,如KaptonTm、UPILEXTm、AvimidTm等。由于二酸酐、二胺和二异氰酸酯间存在许多不同的组合,所以在实验上很难合成所有可能的组合。例如,在世界上最大的有机分子数据库中——PubChem数据库,二酸酐、二胺和二异氰酸酯的数量分别超过了200种、30000种和10000种。因此,二酸酐和二胺的组合将导致超过600万种潜在的聚酰亚胺,而二酸酐和二异氰酸酯的组合甚至超过200万种潜在的聚酰亚胺。尽管实验中不可能合成所有800万种聚酰亚胺,但是当酰亚胺官能团可正确形成时,这800万种聚酰亚胺的化学结构计算上可以被获取。图1d展示了一些获得的假想的聚酰亚胺的化学结构。这个假想的数据集包含了更多多样性的聚酰亚胺结构,占据了更广泛的化学空间(图1e中的红色点)。从真实聚酰亚胺的局部区域扩展到假想聚酰亚胺的更广泛区域,有助于我们更有可能发现具有期望的多功能性能的新型聚酰亚胺材料。尽管对这800万种假想的聚酰亚胺进行详尽的搜索在实验上是不现实的,但是机器学习模型技术可以避免这些挑战。

 

1 数值交联所得800万个假想聚酰亚胺结构与现有2000聚酰亚胺结构的结构多样性比较。


然后,基于上述构建的800万假想的聚酰亚胺数据库,研究团队建立了单任务的机器学习模型。单任务的机器学习模型使得他们可以在给定新的聚酰亚胺时评估其特定性能。当他们将训练好的机器学习模型应用于这800万种假设性聚酰亚胺时,可以得到它们的屈服强度、杨氏模型和玻璃转化温度的估计值,从而可以发现新型的多功能高性能的聚酰亚胺材料。由于这三个热力学特性的相互竞争,化学的设计空间变成了三维空间,如图2所示。在真实聚酰亚胺数据集中,一些聚酰亚胺只有一个或两个热力学性能的实验记录。然而,在这个三维空间中,需要其全部三个热力学性能。因此,对于那些没有记录的热力学性能,可使用机器学习模型的预测值进行补充。进而使用完整的屈服强度、杨氏模型和玻璃转化温度数据,将所有真实聚酰亚胺在图2中相应地标出。尽管得到的设计空间基于实验值和机器学习预测值的混合,但考虑到机器学习模型具有很高准确度的预测性能,此方法构建的设计空间是良好且可靠。

 

图2 筛选的聚酰亚胺结构与现有聚酰亚胺结构的性能比较(弹性模量,屈服强度和玻璃转化温度)。

 

图3 基于机器学习筛选的新型聚酰亚胺结构的实验合成与测试。


在检查所有假想聚酰亚胺材料的机器学习预测的屈服强度、杨氏模型和玻璃转化温度时,其中一些可以被称为Pareto frontiers,这意味着在不降低其他性质的情况下无法改善其中任何一个性质。这组假设聚酰亚胺材料的Pareto frontiers定义了三个热力学特性(屈服强度、杨氏模型和玻璃转化温度)的边界。在假想的聚酰亚胺材料的Pareto frontiers中,选择了三种表现最佳的假想聚酰亚胺材料(同时具有高屈服强度、杨氏模型和玻璃转化温度)。类似地,基于所有真实聚酰亚胺材料的三个热力学特性,可以确定一个新的Pareto frontiers,它定义了真实聚酰亚胺材料的性能边界(如图2所示)。图2还展示了所有真实聚酰亚胺材料在三个平面上的投影。在每个平面上,二维Pareto frontiers更加直观,杨氏模型-玻璃转化温度、杨氏模型-屈服强度屈服强度-玻璃转化温度的组合是三维设计空间中的特殊情况之一。当从800万个假想的聚酰亚胺材料中发现的三种性能最佳的新型聚酰亚胺材料(用红色星号表示),发现这些假想的聚酰亚胺材料超出了真实聚酰亚胺材料的Pareto frontiers,表明其性能更为优越。它们的化学结构显示在图2的右侧。与图2左侧Pareto边界附近的三种真实聚酰亚胺的化学结构相比,发现共同的结构特征,如主链骨架中的芳香环和硫和氧之间的磺酰双键。这种相似性表明了该机器学习模型在抓取关键结构的精确性。此外,影响聚酰亚胺热力学性能的重要亚结构包含在这些发现的新型聚酰亚胺中。它们位于真实聚酰亚胺设计空间的Pareto frontiers之外,表明高性能聚酰亚胺试验合成的可行性。如果基于更多的热力学性能,7个性能属性的雷达图展示了三个高性能的假想的聚酰亚胺。就它们在t-SNE化学空间中的位置而言,这三种新型聚酰亚胺接近真实聚酰亚胺。更重要是,这三个假想的聚酰亚胺具有超越其他真实聚酰亚胺材料的热力学性能。


为了验证所筛选聚酰亚胺结构具有优越的热力学性能,基于分子动力学模拟与机器学习预测的匹配程度,研究者对新型聚酰亚胺#2进行了实验合成和测试,以验证聚酰亚胺的性能。根据前述的反应路线和反应组分,从Sigma Aldrich购买了所有所需的化学品。发现的聚酰亚胺#2的反应组分是1,4,5,8-naphthalenetetracarboxylic dianhydride (1,4,5,8 NTDA) and p-Phenylenediamine (p-PDA)。此外,甲酚或对氯苯酚被用于提高反应组分的溶解性,如图3a所示。对甲酚(99%)由Thermo Fisher Scientific供应。溶剂和1,4,5,8 NTDA未经进一步纯化即可使用,而p-PDA在使用前在150°C下升华。一方面,尽管合成可行性分数表明这些潜在的高性能聚合物的合成是可行的,但仍然很难找到优秀的溶剂来溶解反应物;另一方面,力学测试需要更多样品,并进一步加工成狗骨样本。因此,试验中着重测量聚酰亚胺的玻璃化转变温度。在合成的反应中,将1,4,5,8 NTDA 1.00克、p-PDA 0.403克和对氯苯酚50.0克加入干燥的两颈瓶中,并装备有磁力搅拌器,然后转移到加热到240°C的油浴中。随着反应的进行,溶液的颜色从棕色变为深红色,最终变为暗紫色。为了确保整个聚合过程中的惰性条件,反应在氮气缓慢流动下进行回流。经过15小时,反应混合物冷却至室温,并在8000转/分钟的离心机中离心,以分离聚合物沉淀物。随后,将残渣在50°C的对氯苯酚中搅拌,然后再次离心以去除未反应的单体。最后,将聚合物在240°C的真空烘箱中烘干24小时。对于在对甲酚中采用类似的聚合反应。其产率为:对氯苯酚反应为34.0%,对甲酚反应为31.8%。图3c展示了聚酰亚胺#2的样品,产物在反应中约20分钟沉淀,导致最终样品的低分子量。最后使用差示扫描量热法(DSC)和热重分析(TGA)测试了热性能。DSC实验在Discovery DSC2500上进行,温度范围为20-400摄氏度,升温速率为10摄氏度/分钟或50摄氏度/分钟。TGA实验在Discovery TGA5500热重分析仪上进行,温度范围为30-1000摄氏度,升温速率为10摄氏度/分钟。图3d展示了TGA实验结果,得到热分解温度为550摄氏度,与ML模型预测的536摄氏度吻合较好。测试的玻璃化转变温度为275摄氏度,低于ML模型预测的383摄氏度,这是由于较低的聚合物的分子量。基于Fox和Loshaek提出的经验方程,玻璃化转变温度谁分子量或交联度的较小而降低。通过进一步的分子动力学模拟,对不同分子量的模型进行了玻璃化转变温度为性能拟合,如图3b所示,结果符合Fox和Loshaek方程。当ML模型预测的玻璃转变温度趋近于非常高的分子量极限时,实际样品的分子量或交联度会显著影响其玻璃化转变温度。图3e展示了从DSC实验结果进一步测得的玻璃化转变温度为值,得到了类似的玻璃化转变温度为响应值,为275摄氏度。


原文链接:

https://www.sciencedirect.com/science/article/abs/pii/S1385894723016807



Dr. Ying Li是威斯康星大学麦迪逊分校机械工程副教授。目前的研究方向是:多尺度建模、计算材料设计、聚合物力学与物理、机器学习加速聚合物设计等方向。该课题组长期招收博士和博士后若干。感兴趣的请直接邮件联系Dr. Ying Li, yli2562@wisc.edu.


【博士招生要求】

1. 在工程力学、土木、材料、机械、化学或相关的领域具有本科或硕士学位。

2. MATLABFortranC/C++ Python 的编程技能熟悉或者感兴趣。

3. 对分子动力学模拟、有限元分析以及机器学习熟悉或者感兴趣。

4. 计算材料科学和聚合物物理学的广泛知识将是一个加分项。


【博士后招收要求】

1、所需学位:力学,化学,机械或土木,材料,凝聚态物理或计算化学的博士学位

2、熟悉或者感兴趣的方向:(1) 多尺度建模,如分子动力学粗粒度技术和连续介质力学等; (2) 计算材料和高分子物理领域; (3) 在多物理场环境中进行计算分析; (4) 高分子物理 -- 固态力学; (5)聚合物或其复合材料的本构模型; (6) 机器学习及其在各个领域的应用。其中熟悉机器学习将是一个加分项。


相关资讯

威斯康星大学麦迪逊分校 Dr. Ying Li 课题组招收博士生、博士后 - 工程力学、土木工程、材料科学、机械工程、化工等

康涅狄格大学Ying Li课题组 Sci. Adv.: 可解释的机器学习模型发现用于气体分离膜的新型高分子结构

高分子科技原创文章。欢迎个人转发和分享,刊物或媒体如需转载,请联系邮箱:info@polymer.cn

诚邀投稿

欢迎专家学者提供稿件(论文、项目介绍、新技术、学术交流、单位新闻、参会信息、招聘招生等)至info@polymer.cn,并请注明详细联系信息。高分子科技®会及时推送,并同时发布在中国聚合物网上。

欢迎加入微信群 为满足高分子产学研各界同仁的要求,陆续开通了包括高分子专家学者群在内的几十个专项交流群,也包括高分子产业技术、企业家、博士、研究生、媒体期刊会展协会等群,全覆盖高分子产业或领域。目前汇聚了国内外高校科研院所及企业研发中心的上万名顶尖的专家学者、技术人员及企业家。

申请入群,请先加审核微信号PolymerChina(或长按下方二维码),并请一定注明:高分子+姓名+单位+职称(或学位)+领域(或行业),否则不予受理,资格经过审核后入相关专业群。

这里“阅读原文”,查看更多


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存