查看原文
其他

Nat. Comm中使用“机器学习”结合计算化学的研究案例

唯理计算 科学指南针一模拟计算联盟 2022-07-09

对于分子和材料中电子的薛定谔方程的精确解,将极大地提高我们发现化学物质的能力,但计算的成本使这成为不可能。自从狄拉克第一次劝我们找到合适的近似来绕过这一成本以来,人类已经取得了很大的进展,但在可预见的未来仍有很多事情是无法实现的。机器学习(ML)的核心希望是,通过对少数几种情况的特性进行统计学习,我们可能会跳过这一过程中最严重的瓶颈。


在过去的十年里,我们目睹了越来越多的机器学习应用于化学科学的各个方面。在这里,我们通过按时间顺序考虑选定的电子结构、原子间势和化合物空间的研究,突出了机器学习模型在计算化学领域的具体成就。


今天,我们就一起来回顾一下机器学习在计算化学中的最新进展

通过利用深度迁移学习的计算和实验数据增强材料性能预测



目前应用于密度泛函理论(DFT)计算的预测建模技术,主要通过提供显著更快的方法来扫描候选材料,帮助加速了材料发现的过程,从而减少了未来DFT计算和实验的搜索空间。然而,除了对DFT计算特性的预测误差外,这些预测模型还继承了DFT计算与实验测量特性的差异。在此,来自美国西北大学的Ankit Agrawal等研究者,为了解决这一挑战,证明了使用深度迁移学习,现有的大型DFT计算数据集(如开放量子材料数据库(OQMD))可以与其他较小的DFT计算数据集以及可用的实验观测,一起利用来构建稳健的预测模型。研究者建立了一种高精度模型,可根据材料成分来预测形成能;利用1,643个观测数据集,该方法的平均绝对误差(MAE)为0.07 eV/atom,这明显优于现有的基于DFT计算的机器学习(ML)预测模型,可以与DFT计算本身的MAE相媲美。


参考文献:Jha, D., Choudhary, K., Tavazza, F. et al. Enhancing materials property prediction by leveraging computational and experimental data using deep transfer learning. Nat Commun 10, 5316 (2019). https://doi.org/10.1038/s41467-019-13297-w原文链接:https://www.nature.com/articles/s41467-019-13297-w#citeas


无监督发现固态锂离子导体



尽管机器学习在发现功能材料方面获得了极大的兴趣,但可用材料属性数据的缺乏阻碍了可靠模型的发展。在此,来自美国马里兰大学的Yifei Mo &丰田北美研究院的Chen Ling等人,提出并演示了一种使用无监督学习独特的材料发现方法,它不需要标记数据,从而缓解了数据稀缺性挑战。利用固态锂离子导体作为模型问题,“无监督材料发现”利用有限数量的电导率数据,从广泛的含锂材料中筛选候选名单,以进一步精确筛选。该无监督学习方案发现了16个新的快速锂导体,电导率为10−4-10−1 S cm−1,这是从头分子动力学模拟预测的。这些化合物具有不同于已知体系的结构和化学性质,证明了无监督学习的能力,可以在广阔的材料空间和有限的属性数据中发现材料。


参考文献:Zhang, Y., He, X., Chen, Z. et al. Unsupervised discovery of solid-state lithium ion conductors. Nat Commun 10, 5260 (2019). https://doi.org/10.1038/s41467-019-13214-1原文链接:https://www.nature.com/articles/s41467-019-13214-1#citeas


可合成材料发现的网络分析



利用计算评估无机材料的合成能力,是加速发现它们的一个重大挑战。材料的合成是一个复杂的过程,它不仅取决于其相对于其他材料的热力学稳定性,而且还取决于从动力学到合成技术的进展,到前体的可用性等因素。这种复杂性使得一般理论或第一性原理的合成方法的发展,在目前是不切实际的。在此,来自北美丰田研究所的Muratahan Aykol等人,展示了如何从材料稳定网络的动力学中出现预测合成性的另一种途径:通过结合高通量密度泛函理论计算的无机材料的凸自由能面从引用中提取的实验发现时间线构建无标度网络。潜在网络特性的时间演化,允许研究者使用机器学习来预测假设的、计算机生成的材料,在实验合成中获得成功的可能性。


参考文献:Aykol, M., Hegde, V.I., Hung, L. et al. Network analysis of synthesizable materials discovery. Nat Commun 10, 2018 (2019). https://doi.org/10.1038/s41467-019-10030-5原文链接:https://www.nature.com/articles/s41467-019-10030-5#citea


用于二氧化碳还原的强大的合成光催化剂:一项数据驱动材料的发现



光催化将温室气体二氧化碳转化为碳氢化合物和酒精等化学燃料,是一项有前景的可再生能源发电技术。目前已知的二氧化碳还原电催化剂,在提高效率和产品选择性方面取得了重大进展,然而,要实现经济可行的工业规模的二氧化碳花园,还需要发现新型材料。在此,来自美国加州大学伯克利分校&劳伦斯伯克利国家实验室的Kristin A. Persson等人,报道了迄今为止最大的CO2光电阴极搜索,从68860种候选材料开始,使用一种合理的第一性原理计算筛选策略来评估材料的合成性耐腐蚀性可见光吸收性以及电子结构与燃料合成的兼容性。结果证实了,文献观察到的很少有材料符合严格的CO2光电阴极要求,只有52种材料符合所有要求。与文献相比,结果得到了很好的验证,其中9种材料已被研究用于二氧化碳减排,其余43种材料是研究者从分析中发现的,值得进一步研究。


参考文献:Singh, A.K., Montoya, J.H., Gregoire, J.M. et al. Robust and synthesizable photocatalysts for CO2 reduction: a data-driven materials discovery. Nat Commun 10, 443 (2019). https://doi.org/10.1038/s41467-019-08356-1原文链接:https://www.nature.com/articles/s41467-019-08356-1#citeas


机器学习在固体分子中的化学位移



由于其强烈依赖于局部的弛豫环境,NMR化学位移是粉末固体或非晶材料结构阐述中最强大的工具之一。不幸的是,使用它们来确定结构取决于计算它们的能力,而这是以高精度第一性原理计算为代价的。最近,机器学习已经成为一种克服量子化学计算需求的方法,但对于固体中的化学位移,化学位移对环境的依赖性很强,而且缺乏变化的实验数据库。它受到了由固体分子构成的化学空间和组合空间的阻碍,在此,来自瑞士洛桑联邦理工学院的Michele Ceriotti & Lyndon Emsley等人,提出了一种基于局部环境的机器学习方法,以精确预测固体分子及其晶型的化学位移达到DFT精度。研究者还证明,根据训练模型能够根据实验测量和ML-预测位移之间的匹配,从而确定了可卡因和药物4-[4-(2-金刚酰基氨基甲酰)-5-叔丁基吡唑-1-基]苯甲酸的结构。


参考文献:Paruzzo, F.M., Hofstetter, A., Musil, F. et al. Chemical shifts in molecular solids by machine learning. Nat Commun 9, 4501 (2018). https://doi.org/10.1038/s41467-018-06972-x原文链接:

https://www.nature.com/articles/s41467-018-06972-x#citeas


另:本公号长期招小编,大家如果对本公号内容感兴趣,并想加入我们,快快联系我们吧~


唯理计算小福利

针对模拟计算我们有专门的沟通群,想进群的小伙伴加微信


17812574221


备注:模拟计算进群

群里可以和老师一起探讨问题,老师也会帮助解答问题的哦~


   推荐阅读:


END


  你“在看”我吗

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存