查看原文
其他

东京工业大学的Jeffrey S. Cross等Bioresource Technology基于机器学习的催化木质素解聚反应分析

sliu527 生物质前沿 2023-03-27

背景介绍


木质素是占木质纤维素类生物质总重量的15%~30%,总能量的40%,是唯一具有芳香结构性质的生物质可再生资源。若能通过适当的解聚,就能从木质素中获取大量的芳香族化合物中间体,从而获得某些有机化学产品和生物液体燃料,具有很好的应用前景。木质素的解聚方法众多,但由于木质素高分子结构的复杂性,弄清木质素的催化解聚机理和化学键的演变规律与断裂途径具有一定困难。近年来, 随着计算算法的发展和成熟和大量实验数据的积累,机器学习逐渐应用于化学、化工领域。基于此,东京工业大学的Jeffrey S. Cross等人使用具有良好数学可解释性的随机森林(RF)算法探究催化剂表面性质、木质素的平均分子量等变量对生物油产量、结焦量等的影响。

图文解读


首先,作者将搜集到的数据进行处理,分成了催化剂表面积,催化剂孔径,氢分压等15个特征,相应的Pearson相关系数如图1所示:生物油产率和结焦率呈现强烈的负相关性质。这是由于在产量一定的条件下,产物不是生物油就是焦炭(和少量气体产物)。除金属/溶剂比催化剂/木质素比”2个特征外,其余特征与生物油(结焦率)均呈现正相关性。

在确定各个特征与生物油产率和结焦率的相关性后,作者将生物油产率和结焦率作为目标值,使用随机森林算法对数据进行线性回归处理。首先探究了各个特性与生物油产率之间的关系。在包括所有设定的特征作为生物油产率的描述符的模型中,其决定系数均方根误差分别为0.7786和9.2687。过多的特征可能会导致机器学习的训练效率低下,同时影响预测的准确度。基于此,根据第一次模型训练的结果,作者去除了与目标值(生物油产率)相关性不大或者为负的一些特征,如木质素的平均分子量、催化剂表面积、催化剂孔径等,对模型进行再次训练,优化后的模型决定系数提高至0.9062,而均方根误差则降低到6.0316,表明模型的准确度得到提升,如图3所示。优化模型表明,溶剂、温度、反应时间是对木质素解聚制备生物油产量影响最大的变量,该三者的重要性占模型所有特征重要性总和的62%。之后,作者使用同样的方法,就各个特征对结焦产率的影响进行了研究。结果表明,温度,氢分压、溶剂、反应时间及木质素/溶剂比是对结焦率影响较大,其总和占所有特征重要性的77%。

总结


本文使用随机森林回归方法建立了反应中各个变量与生物油产率、焦炭产率之间的关系,模型发现在木质素解聚反应中溶剂的作用远大于催化剂。本文的研究为设计木质素解聚反应提供了新思路。

原文链接:

https://doi.org/10.1016/j.biortech.2021.126503 


 往期推荐 

天大齐崴教授团队和新加坡国立颜宁教授团队合作Green Chemistry-木质素衍生物儿茶酚制备高纯度吩嗪

广西大学李志礼教授团队:一种无定形介孔地质聚合物块用以催化解聚木质素制备单酚

Industrial Crops & Products:木质素在缓释肥料制备中的应用现状与展望

Green Chem. 二维GC定性定量分析木质素优先降解产物中单体和低聚物


本公众号现全面开放投稿,希望文章作者讲出自己的科研故事,分享论文的精华与亮点。投稿请联系小编(微信号:biomass12345)


为了增加生物质领域科研人员的交流与合作,我们编辑部目前组建了生物质前沿微信交流群,欢迎相关领域研究人员入群讨论,共同进步。

进群方式:添加小编为好友(微信号:biomass12345),邀请入群。

请备注:姓名+单位+研究方向。


另外,本公众号还友情为国内外有需求的实验室免费发布招聘信息,也可为学术机构发布相关学术会议信息



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存