查看原文
其他

研究前沿:AI 提供强大化学工具,开拓理解电子相互作用之路

The following article is from 集智俱乐部 Author 梁金、徐恩峤


导语


从研发药物,到开发超导体,都需要设计具有特定性能的新材料。而要了解材料和物质的结构和性质,需要对其中的电子进行模拟。不过,即使在简单的分子中,电子和原子核之间也充满了复杂的相互作用,模拟这样的量子多体系统一直是一项重大挑战。DeepMind 团队进行了一次雄心勃勃的尝试——用人工智能模拟电子间的相互作用。在12月9日发表于 Science 杂志的一项最新研究中,他们宣布开发了一个深度学习框架 DM21,不仅大幅提高了计算的准确性,还可以更好地模拟先前难预测的复杂化学系统。


研究领域:量子多体系统,深度学习,计算化学,量子力学

梁金、徐恩峤 | 作者

邓一雪 | 编辑



论文题目:

Pushing the frontiers of density functionals by solving the fractional electron problem

论文链接:

https://www.science.org/doi/10.1126/science.abj6511

 



一、电子组成的多体系统




超导体中电子毫无阻碍传输电流,石墨烯中碳原子形成规则的六角形晶格,身体中的蛋白质、DNA 折叠成特定结构——我们的世界由丰富多彩的材料构成,而这些材料之所以具有独特的性质,很大程度上是因为其中的电子会形成多种多样的结构。电子控制着金属中的电流流动,也是把分子粘在一起的“胶水”。理解分子中的电子如何运动,电子之间如何相互作用因而至关重要。


图1. 电子是把分子粘在一起的“胶水”。| 来源:Nobelprize.org


在量子力学中,薛定谔方程确定电子波函数的演化,告诉我们在空间特定位置找到一个电子的概率。原则上,有了量子力学,我们就可以确定电子和原子核如何相互作用形成化学键,让原本孤立的原子结合起来,形成各种分子和材料。


但要描述分子中大量电子的量子力学行为实际上非常具有挑战性。如果从第一原理出发,追踪分子中每一个电子的行为,只会带来一场计算噩梦。我们可以深入量子尺度,想象分子内部的混乱场景:所有带负电荷的电子相互排斥,它们又和带正电荷的原子核有着致命的吸引——到底该如何描述如此复杂的量子多体系统呢?


一种名为密度泛函理论(Density Functional Theory,DFT)的技术提供了强大的工具。1964年,Walter Kohn 和 Pierre Hohenberg 证明,只要知道电子在整个分子中的总体分布,即平均电荷密度,就足以精确计算所有相互作用。更准确地说,只要知道系统的基态电子密度 ρ,就可以确定一个泛函 E[ρ],给出对应的基态能量。这里的泛函实际上就是“函数的函数”,由于能量是电子密度的函数,而电子密度又是空间坐标的函数,所以称为泛函。Kohn 因为这项工作获得了1998年诺贝尔化学奖。


DFT 将包含电子-电子相互作用的多体问题简化为一个没有相互作用的电子在有效势场中运动的单体问题,电子间的相互作用只是作为一个误差项出现在这个有效势场中,比从基本量子理论开始的计算高效得多。


科学家们提出了许多近似方法来逼近精确的泛函,尽管存在一定程度的近似,DFT仍然成为所有科学领域中应用最广泛的技术之一。但这些近似方法都存在系统性误差,不能捕捉到泛函的一些关键性质,甚至无法准确模拟像氢分子这样简单的物质。因此,长期困扰科学家的问题是:如何确定密度泛函的精确形式,也就是电子密度和相互作用能之间的映射?


 



二、确定精确的泛函




人们很早就发现,如果近似方法满足精确泛函的更多约束条件、拟合更多系统,近似的准确度就会提高。传统泛函存在的许多系统性误差,根源在于忽略了两类分数电子约束:具有非整数总电荷的分数电荷(FC, Fractional Charge)系统,和具有非整数自旋的分数自旋(FS, Fractional Spin)系统。


虽然分数电子系统是虚构的,但真实的电荷密度可能产生具有类似特征的情况。例如,我们通常认为电子是在特定的轨道上运动,即任意时刻下一个电子处于且仅处于一个轨道;化学反应意味着轨道重组,电子在这些轨道上重新排布——那么问题来了,实际的反应过程当然是连续发生的,电子从一个轨道迁移至另一轨道的过程如何定量描述?于是,承认假想的电子连续变化,成为正确模拟这些情形的必要条件,有助于确保泛函适用于各种物质和材料。而如果忽略分数电子约束,则会导致两个基本问题:


(1)离域误差。在DFT计算中,泛函通过寻找让系统能量最低的电子构型,来决定分子的电荷密度。因此,泛函的误差会导致计算出的电子密度存在误差。大多数现有的密度泛函近似方法倾向于让电子密度分散在几个原子或分子上,以至于模拟电子实际较为定域的系统存在较大误差。


(2)自旋对称性破缺。现有泛函在描述化学键断裂时,倾向于自旋对称性破缺的电子构型。由于对称性在物理和化学过程中发挥着至关重要的作用,这种并非实际存在的对称性破缺表明,传统的泛函存在关键缺陷。


诚然,计算化学家们很早就意识到了分数电子问题对于模拟反应过程以及特殊化学体系的必要性,也尝试了各种方式“连接”相邻的整数状态,但能够接近实际的却少之又少。深度学习框架非常适合解决这类问题,只要将约束表示为数据,用大量精确的数据训练神经网络,就可以用训练好的神经网络计算系统的各种性质。


图2. 利用神经网络学习泛函,建立电子密度和基态能量之间的映射。| 来源:DeepMind

 



三、DM21:神经网络学习泛函




DeepMind 团队开发了这样一个深度学习框架——DeepMind 21(DM21),结合分子数据和两类分数电子约束来训练神经网络,逼近精确的泛函。


研究人员利用了来自2235个化学反应的数据集,其中1074个反应是以往未考虑分数电荷和分数自旋约束时难以准确模拟的难例。新的泛函弥补了传统泛函的重要缺陷,在广泛的大规模基准测试中显示出高度的准确性。用于训练的特征包括但不限于空间各处的电子密度、密度梯度以及动能密度等精确数据。


图3. 深度学习框架 DM 21 通过训练神经网络来学习精确的泛函,由于结合分子数据和约束,克服了传统泛函的局限性。


DM21 能够更好地模拟复杂系统,表明深度学习方法可以捕捉到泛函的一些确切性质。研究人员将它应用于三类不同系统。对于带电荷的DNA碱基对,传统泛函预测电荷分散在两个分子上,但 DM21 正确地预测电荷主要定域在一个分子上(图4)


图4. DFT预测电子密度在带电荷的DNA碱基对之间的分布,左边是胸腺嘧啶T,右边是腺嘌呤A。(左)传统的泛函(B3LYP)预测电荷分散在两个相邻的分子上。(右)神经网络学习的泛函 DM21 正确地将电荷定域在右边的分子上。| 来源:DeepMind


对于由24个氢原子高度压缩而成的氢原子链,传统的无约束泛函预测出现自旋对称性破缺,导致氢原子链中出现明显的磁化,DM21 的预测则不会出现这种自旋极化(图5)。此外,由于忽略分数自旋约束,传统泛函会高估双环丁烷开环反应中的势垒,DM21 的预测更接近真实情况。


图5. 24个氢原子组成的氢原子链。(上)传统的PBE泛函预测出现自旋对称性破缺,导致氢原子链出现自旋极化。(下)DM21 预测中不会出现这种问题。


这项工作成功地证明,深度学习可以为改进泛函提供一个框架,帮助我们更好地理解电子间的相互作用,探索物质的内部结构。由于这种方法依赖于数据和约束条件,在领域数据持续积累的当下自然能够不断改进,因而代表了一条通向实际泛函的可行路径


更长远看来,无论是建造稳固的桥梁,还是将火箭发射到太空,在现代工程中,计算机模拟发挥着核心作用。为了探索材料、药物和催化领域中涌现出的新问题,如今的技术更加深入量子尺度。这项工作表明,深度学习对于在量子尺度准确模拟物质具有广阔前景。



参考链接

[1] https://deepmind.com/blog/article/Simulating-matter-on-the-quantum-scale-with-AI
[2] https://www.nature.com/articles/d41586-021-03697-8
[3] Pushing the frontiers of density functionals by solving the fractional electron problem.
https://www.science.org/doi/10.1126/science.abj6511
[4] https://www.nobelprize.org/uploads/2018/06/advanced-chemistryprize1998.pdf


本文转载自微信公众号集智俱乐部。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存