查看原文
其他

《自然通讯》机器学习与计算化学相辅相成,助力科研新发展

唯理计算 科学指南针一模拟计算联盟 2022-07-09


分子模拟提供了超越直接实验测量的化学过程的深刻见解,为加速分子和材料的发现带来了重大希望。在本文集中,编辑重点介绍了最近发表在《自然通讯》杂志上的一些计算研究,包括计算化学方法的进展、材料建模的应用,以及可转移到新的化学过程和系统的机器学习模型的进展。


作为时下最热门的新兴的研究领域,机器学习可谓是无孔不入,它已经渗透到今天人类几乎所有的理工科的学科之中,它的渗透速度令人咂舌。前期,咱们公众号之前也介绍过一些机器学习在计算化学领域中的发展,原本以为只是个别现象,现在看来那仅仅是个开始,机器学习与计算化学可谓是相互成就,互惠互利。


今天,我们一起来回顾一下机器学习在计算化学中的最新进展后半部分。


前半部分可点击下方蓝字跳转:

《自然通讯》:科研新风口—机器学习,助力计算新发展

镓的从头算相图与成核



元素镓具有一些有趣的特性,如低熔点、密度异常和共价与金属共存的电子结构。在此,为了模拟这个复杂的系统,来自瑞士苏黎世联邦理工学院的Haiyang Niu & Michele Parrinello等研究者,通过对神经网络进行密度泛函理论计算的训练,建立了一个从头算质量相互作用势。研究表明,液体镓, α-Ga, β-Ga和Ga-II之间的相对平衡是很好的描述。所得相图与实验结果一致。此外,研究者分析了液态镓的局域结构及其在α-Ga和β-Ga中的成核。研究发现,亚稳态β-Ga的生成比热稳态α-Ga的生成更有利。最后,研究者提供了对极端过冷的液体Ga实验观察的见解。


参考文献:Niu, H., Bonati, L., Piaggi, P.M. et al. Ab initio phase diagram and nucleation of gallium. Nat Commun 11, 2654 (2020). https://doi.org/10.1038/s41467-020-16372-9

原文链接:

https://www.nature.com/articles/s41467-020-17112-9#citeas


从头算电子结构的费米电子神经网络状态



神经网络量子态已经成功地应用于各种格点和连续空间问题的研究中。尽管在方法论上有了很大的发展,但表征费米子物质仍是早期的研究活动。在此,来自瑞士苏黎世大学的Kenny Choo &美国IBM托马斯沃森研究所的 Antonio Mezzacapo & 美国熨斗研究所的Giuseppe Carleo等人,提出了一个扩展的神经网络量子态,可用于模拟相互作用费米问题。研究者借用量子模拟的技术,直接将费米子自由度映射到自旋,然后使用神经网络量子态来进行电子结构计算。对于几个双原子分子在最小基集,研究者将其本身的方法与广泛使用的耦合聚类方法,以及多体变分状态进行了基准测试。在一些测试分子上,研究者系统性地改进了耦合团簇法和Jastrow波函数,达到了更高的化学精度。最后,研究者还讨论了该方法未来的发展方向和改进方向。


参考文献:Choo, K., Mezzacapo, A. & Carleo, G. Fermionic neural-network states for ab-initio electronic structure. Nat Commun 11, 2368 (2020). https://doi.org/10.1038/s41467-020-15724-9

原文链接:

https://www.nature.com/articles/s41467-020-15724-9#citeas


预测有机均解键离解焓接近化学精度与亚秒计算费用



有机分子的键离解焓(BDEs)在决定化学反应活性和选择性方面起着重要作用。然而,在足够高的量子力学理论水平上进行BDE计算需要大量的计算资源。在此,来自美国可再生能源国家实验室的Peter C. St. John和Seonah Kim&美国科罗拉多州立大学和牛津大学的Robert S. Paton等人,开发了一个机器学习模型,在几分之一秒之内,能够准确预测有机分子的BDEs。为此,研究者对42,577个小有机分子在M06-2X/def2-TZVP水平上,进行了自动密度泛函理论(DFT)计算,得到290,664个BDEs。在这些结果的子集上训练的图形神经网络,对于看不见的分子的BDEs获得了0.58 kcal mol−1(vs DFT)的平均绝对误差。研究者进一步论证了该模型在两个方面的应用:第一,研究者快速准确地预测了药物类分子代谢中提取氢的主要位置;第二,研究者确定了烟灰形成过程中的主要分子裂解途径。


参考文献:St. John, P.C., Guan, Y., Kim, Y. et al. Prediction of organic homolytic bond dissociation enthalpies at near chemical accuracy with sub-second computational cost. Nat Commun 11, 2328 (2020). https://doi.org/10.1038/s41467-020-16201-z

原文链接:

https://www.nature.com/articles/s41467-020-16201-z#citeas


深度神经网络统一机器学习和量子化学应用于分子波函数



通过在量子化学计算的基础上实现大规模的化学空间探索,机器学习推进了化学和材料科学的发展。虽然这些模型提供了原子化学性质的快速和准确的预测,但它们没有明确地捕获分子的电子自由度,这限制了它们在反应化学和化学分析方面的适用性。在此,来自卢森堡大学的A. Tkatchenko & 德国柏林工业大学的A. Tkatchenko &英国华威大学的R. J. Maurer等人,提出了一个深度学习框架,用于在原子轨道的局部基础上预测量子力学波函数,所有其他的基态性质都可以推导出来。这种方法通过波函数保持了对电子结构的完全访问,并以解析可微的表示捕获了量子力学。通过几个例子,研究者证明了,这为实现分子结构的逆设计以优化电子性能,开辟了广阔的道路,也为提高机器学习和量子化学的协同作用,开辟了一条清晰的道路。


参考文献:Schütt, K.T., Gastegger, M., Tkatchenko, A. et al. Unifying machine learning and quantum chemistry with a deep neural network for molecular wavefunctions. Nat Commun 10, 5024 (2019). https://doi.org/10.1038/s41467-019-12875-2

原文链接:

https://www.nature.com/articles/s41467-019-12875-2#citeas


通过迁移学习达到具有通用神经网络的潜力,以接近耦合簇精度



原子分辨率的化学和生物系统的计算建模是化学家工具箱中的一个关键工具。计算机模拟的使用需要在成本和精度之间取得平衡:量子力学方法提供了很高的精度,但计算成本高昂,且难以扩展到大型系统,而经典力场则廉价且可扩展,但缺乏向新系统的可转移性。机器学习可以用来实现这两种方法的最佳效果。在此,来自美国洛斯阿拉莫斯国家实验室的Sergei Tretiak &北卡罗来纳大学的Olexandr Isayev&佛罗里达大学的Adrian E. Roitberg等人,训练一种通用神经网络电位(ANI-1ccx),在反应热化学异构化类药物分子扭力的基准上达到了CCSD(T)/CBS的精度。这是通过训练一个网络到DFT数据,然后使用转移学习技术对黄金标准QM计算(CCSD(T)/CBS)的数据集进行再训练来实现的,该数据集最优地跨越了化学空间。由此产生的潜力被广泛应用于材料科学、生物学和化学,并且比CCSD(T)/CBS计算速度快数十亿倍。



参考文献:Smith, J.S., Nebgen, B.T., Zubatyuk, R. et al. Approaching coupled cluster accuracy with a general-purpose neural network potential through transfer learning. Nat Commun 10, 2903 (2019). https://doi.org/10.1038/s41467-019-10827-4

原文链接:

https://www.nature.com/articles/s41467-019-10827-4#citea




唯理计算小福利

针对模拟计算我们有专门的沟通群,想进群的小伙伴加微信


17812574221


备注:模拟计算进群

群里可以和老师一起探讨问题,老师也会帮助解答问题的哦~


推荐阅读:

【限时免费】超人气计算公开课,4天8小时,听课+抽奖!

【经典收藏】2005年NCHC的VASP workshop,好资源不过时

我错了!BFDH预测晶体形状的问题我应该早点分享

Nat. Comm.:聚焦科研未来—解读材料建模应用的最新进展

文章要发表,但是这个事情不知道?小心进入黑名单!


END


  你“在看”我吗

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存