查看原文
其他

Energy Fuels:利用机器学习技术高通量筛选分离乙烷和乙烯的金属有机骨架

MOFs在线 2023-02-21

Title: High-Throughput Screening of Metal−Organic Frameworks for Ethane−Ethylene Separation Using the Machine Learning Technique

Author: Prosun Halder and Jayant K. Singh

To be cited as: Energy Fuels202034, 14591−14597.

01

引言

利用机器学习算法和分子模拟相结合的混合方法,筛选金属有机框架(h- MOFs)数据库,以获得分离乙烷(C2H6)和乙烯(C2H4)的最佳材料。从h-MOFs数据集中随机选取8%的h-MOFs作为训练集,在298 K和1 bar下,用多组分巨正则蒙特卡罗方法模拟了C2H6/C2H4的选择性。在训练集的基础上,建立了随机森林(RF)模型来预测剩余的h-MOFs的选择性。在所有的化学和结构性质中,空隙率对C2H6/C2H4的平衡选择性起着重要的预测作用。训练后的机器学习模型可以合理预测剩余h-MOFs材料对C2H6/C2H4选择性,RF得分为0.89,筛选出了四种性能较好的h-MOFs,并与已发现的分离材料进行了比较。最后,在不同压力下进一步模拟了这四种h-MOFs的吸附等温线,并且还分析了二次结构单元的能量贡献和局部密度分布,从而了解h- MOFs与C2H6之间相互作用。


02

图文解析

1. 背景

全世界乙烯(C2H4)的产量超过1.5亿吨,使其成为了工业生产的主要有机化合物。乙烯主要用作石化工业的原料,在其中它经历聚合反应生成聚乙烯,聚乙烯是广泛使用的含有不同链长的聚合物链的塑料。工业上乙烯是通过石脑油或乙烷(C2H6)的蒸汽裂解和热分解制得的,产物中存在一定量的C2H6残渣,需要分离制得聚合物级C2H4。 传统的工业分离过程是乙烷/乙烯的低温蒸馏分离,是最耗能的化工过程之一。因此,有必要找到一种替代技术来最大限度地减少能源消耗。在近年来发展起来的技术中,变压吸附、变温吸附、膜分离等吸附分离技术有望取代传统的工业分离方法。

利用这种简单的方法,理想的吸附剂应该具有高的C2H4选择性和高的C2H4吸收率。在此背景下,众多的研究者研究了C2H4、C2H6及其混合物在各种吸附剂上的吸附现象。吸附剂有γ-Al2O3、ITQ-5、沸石材料、金属有机骨架等。目前研究最多的纳米材料有金属有机框架、共价有机框架、活性炭、沸石、沸石咪唑骨架和多孔聚合物网络。在众多的吸附剂中,MOFs以其合成简单、比表面积大、孔隙率高等优点引起了人们的广泛关注。 许多研究集中在寻找吸附CO2、CH4以及分离CO2/CH4、CO2/N2的最佳MOFs材料上,对于分离C2H4/C2H6的潜在吸附剂的开发也进行了大量的研究。然而,对于计算研究来说,MOFs可以由模块化的分子构建块(通常是金属簇和有机连接物)构建。 这些构件可以组装成几乎无限数量的MOFs。实验发现和计算生成的MOFs数据库以百万计,但是,C2H6/C2H4分离的最佳材料仍然是一个悬而未决的问题。

在此背景下,将机器学习算法与分子模拟相结合的混合方法可能是筛选材料的有效方法。众所周知,MOFs的化学性质和结构性质直接影响气体的吸附和分离。数学模型可以根据吸附气体的化学性质和结构性质来预测吸附气体的数量或选择性。在文献中,已经有几项研究显示了机器学习技术的力量。例如,Haranczyk等人利用随机森林(RF)算法筛选了约67万个纳米孔材料基因组(NMG)数据库,用于氙/氪分离。同样,Smit等人使用神经网络算法筛选包含超过85万份材料的同一NMG数据库,探索H2存储的极限。

在这项工作中,作者的重点是利用分子模拟结合机器学习算法从h- MOFs数据库中识别出最好的MOFs材料。特别地,作者将理顺h- MOFs的结构和化学性质与C2H6/C2H4选择性之间的关系。

2. 模型和方法

为了训练和验证机器学习算法,作者使用了由Snurr小组创建的h-MOFS数据库,数据库由137,953个h-MOFs组成,这些MOFs是从构建块库中生成的。 然后,将生成的MOFs与实验和能量优化结构进行了比较,再利用Materials Studio的Forcite模块对各MOFs结构进行几何优化。结构和化学性质描述符通常与多孔材料的选择性或吸附容量有关,本工作中的化学和结构性质列表分别列在表1和表2中。ZEO++,是一个开放源码软件,用于计算所有的结构描述符,此外,它还可以提供关于吸附气体可以到达的区域的信息。为了避免不必要的时间和资源来测试气体吸附或分离研究中最差的材料,从数据集中删除了可达表面积为零的h-MOFs。在去除具有100%不可接近表面积的h-MOFs后,机器学习算法用于其余115,302个h-MOFs材料。

表1. MOFs的化学描述符。


表2. MOFs的结构描述符。


采用多组分巨正则蒙特卡罗(M-GCMC)计算了MOFs模拟中C2H6和C2H4的平衡吸附数据。选取了9224个h-MOFs材料(占h-MOFs数据集的8%)作为训练集。在298 K和1 bar下,研究了C2H6和C2H4的50:50摩尔混合物。

MOFS采用通用力场建模,另一方面,用TraPPE力场模拟乙烷和乙烯分子。利用Lorentz-Berthelot混合规则计算了不同原子间的Lennard-Jones(LJ)参数。 所有的模拟都使用了12.0°LJ电位截止距离。 盒子长度是LJ电位截止距离的两倍,以满足最小图像约定。

在本研究中,作者使用RF回归算法预测C2H6/C2H4的选择性。在RF算法中,作者使用250棵树来生成森林。采用置换特征重要度模型检验技术计算特征重要度。另外,还使用n_split值为10shuffle split交叉验证策略执行了一个交叉验证分析。每个分裂中的训练集作为训练数据集的10%。在高通量筛选中,作者要求执行最佳数量的模拟,以最大限度地提高机器学习的精度,并限制计算成本。此外,较大的训练集可能不会显著提高机器学习模型的精度。作者用分别占h-MOFs数据集6%8%10%的训练数据对机器学习模型进行了测试,并比较了模型的精度。 随着训练集规模的增大,当训练数据量为h-MOFs数据集的8%时,机器学习模型的精度达到最大。训练数据量的进一步增加并不能提高模型的精度。因此,选择了8%h-MOFs作为训练集。

3. 结果和讨论

分子筛选。描述分离效率的重要参数是吸附选择性,如方程1所示。

        X(i = C2H6, C2H4)是吸附相中的摩尔分数,Yi是体相中的摩尔分数。

        通过GCMC模拟,作者得到了乙烷吸收率和乙烷选择性。一个好的MOFs将具有高的选择性和高的C2H6吸收率。从图1可以看出,大量的MOFs具有良好的选择性,但乙烷吸收量较少。少数MOFs有大量的乙烷吸收量。选择性小于1.0的MOFs是乙烯选择性材料。由于作者的兴趣是找到最佳的MOFs,它将具有最高的C2H6选择性,所以应该关注图1的右上角区域。

图1. 训练数据的性能图(9224个h-MOFs)。


为了评估RF模型的性能,计算了R2值,如方程2所示。

NMOFStrueSpredictSmean分别表示在RF模型中获得的MOFs数、模拟选择性、预测选择性和平均选择性。

首先,使用RF模型,以化学性质作为描述符。在这种情况下,RF评分很低,约为0.36。因此,仅以化学性质作为描述符的RF模型不适合于进行预测。类似地,RF模型只用于结构特性,在这种情况下,RF评分明显改善到0.70。为了提高RF分数,作者结合了结构和化学性质。使用shuffle split交叉验证方法,RF评分提高到0.89。

同时,作者计算了RF的决策树回归模型中的平均特征的重要性。具有较高特征重要性的描述对改进RF模型更为关键。从图2中,可以清楚地得出结论,空隙率(VF)是最重要的特征。VF后,钒原子数、最大的包括球直径(Di)和金属百分含量(mperc)对预测也有重要作用。

图2. RF的决策树回归中平均特征的重要性。


为了找出特征重要性和模型性能的物理意义,作者绘制了C2H6/C2H4选择性与该RF模型最重要的特征VF之间的关系。从图3中作者可以观察到MOFs材料的VF与C2H6/C2H4选择性之间有很强的相关性。随着VF的增加,C2H6/C2H4选择性增加。但当VF达到一定值后,选择性开始逐渐下降。类似地,其他描述符也与乙烷选择性有一定的相关性。

图3. VF对C2H6/C2H4的选择性影响。


进一步,作者在测试数据集上测试了射频模型的性能。作者从测试数据集中随机选取2000种MOFs材料进行模拟。同时,将RF模型应用于随机选择的2000种MOFs材料。模拟的C2H6/C2H4选择性与预测的C2H6/C2H4选择性作了对比,如图4所示。45°斜线表示模拟的选择性和预测的选择性相等,均方根误差为0.89。

图4. 模拟C2H6/C2H4选择性与预测C2H6/C2H4选择性的对称图。


最好的材料。用RF模型预测剩余h- MOFs材料的C2H6/C2H4选择性。随后,对预测的最佳性能材料进行了分子模拟。在这些材料中,只有4种h- MOFs材料的C2H6/C2H4选择性大于2.7,如图5所示,图中蓝色原子和绿色原子分别代表乙烷和乙烯分子。可以清楚地看到,气体的吸附发生在有机连接体附近。作者在1 bar和298 K下比较了最佳h- MOFs材料与现有纳米孔材料的选择性。选择性比较如图6所示。只有一种材料的性能超过了本文所鉴定的材料。

图5. 在1 bar和298 K下,性能最好的h-MOFS。


图6. 在1 bar和298 K下,C2H6/C2H4的选择性与以前报道的最佳材料C2H6/C2H4的选择性进行了比较。红色和蓝色填充圆圈分别代表先前报道的性能最好的材料和性能最好的h-MOFs。


在0.1~1.0 bar的不同压力下,对前四种h- MOFs体系进行了模拟,得到了C2H6和C2H4的吸附等温线。从图7a可以清楚地看出,在前四种材料中,NMGC-353295的C2H6吸附量最好,即在298 K和1 bar下的C2H6吸附量为55.06 cm3/g。在较低的压力下,各h- MOFs体系的C2H6/C2H4选择性较高。然而,随着压力的增加,C2H6/C2H4选择性降低。

图7. (a) 性能最好的h-MOFs的吸附等温线;(b) 性能最好的h-MOFs的选择性比较。


表3给出了NMGC-353295与C2H6和C2H4在1 bar和298 K下的二次生成单元的相互作用能。相互作用能表明,C2H6原子更有利于实现更高的吸附。由于含金属节点附近空间有限,节点与C2H6和C2H4之间的能量贡献最低。在所有的SBUs中,Linker-1的贡献最大,因为它有更多的结合位点。

表3.  NMGC-353295与C2H6和C2H4的SBU在1 bar和298 K下的能量贡献。


进一步,作者从SBUs中计算了C2H6和C2H4的局部密度分布,如图8所示。在每种情况下,C2H6密度都高于C2H4密度。第一个峰暗示了SBUs表面附近的一级吸附层,这也符合SBU与C2H6和C2H4的能量相互作用数据。

图8. 在1 bar和298 K下,C2H6和C2H4的局部密度与NMGC-353295与SBUs的距离有关。


03

结论与展望

在本研究中,作者能够利用RF算法将MOFs的化学和结构性质与C2H6选择性相关联。利用h-MOFs数据库中8%C2H6选择性值模拟RF。具有化学性质或结构性质的RF模型在预测C2H6/C2H4选择性方面表现不佳。而将化学性质和结构性质综合考虑后,R2值显著提高到0.89。使模型成功的最重要的特征是h-MOFSVF。此外,作者还得到了前四种h-MOFs材料对C2H6C2H4的吸附等温线。所有MOFs都对C2H6气体分子有亲和力。在SBUs中,金属节点与C2H6C2H4的相互作用能最小。与C2H4相比,有机连接剂对C2H6气体分子的亲和力最大。因此,为了进一步提高C2H6/C2H4的选择性,有机连接剂的系统改性应该是下一步的目标。

04

作者简介

Jayant K.Singh,印度理工学院


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存