Nature|DeepMind用深度学习改进化学中的密度泛函理论
在过去的30年里,密度泛函理论(density functional theory,DFT)已经成为预测化学、生物学和材料科学中各种系统特性的最广泛使用的电子结构方法。尽管有很长的成功历史,然而最先进的DFT函数有关键的局限性。特别是,对于涉及移动电荷和自旋的电荷密度,可以观察到明显的系统误差。
在2021年12月9日发表的Science文章 Pushing the frontiers of density functionals by solving the fractional electron problem 中,来自DeepMind的Kirkpatrick等人开发了一个框架,在准确的化学数据和分数电子约束上训练一个深度神经网络。由此产生的函数在主族原子和分子的全面基准上优于传统函数。这项工作为DFT中一个长期存在的关键问题提供了一个解决方案,并证明了DFT与现代机器学习方法相结合的成功。
2021年12月10日,Nature杂志发表文章,对12月9日发表在Science杂志的这篇文章进行了评述。
以下是全文内容。
由总部位于伦敦的人工智能公司DeepMind的科学家领导的一个团队开发了一个机器学习模型,可以通过预测分子内的电子分布来计算分子的性质。这种方法可以比现有技术更准确地计算出一些分子的特性(12月10日出版的Science杂志中有描述)。
人工智能预测分子内的电子分布(图示),并利用它来计算物理特性
维也纳大学的材料科学家Anatole von Lilienfeld说:"使它像他们所做的那样准确是一项壮举。"
波兰罗兹科技大学的计算化学家Katarzyna Pernal说,这篇论文是"一项坚实的工作"。但她补充说,机器学习模型在对计算化学家有用之前还有很长的路要走。
预测性质
原则上,物质和分子的结构完全由量子力学决定,特别是由薛定谔方程决定,它制约着电子波函数的行为。这些是描述在空间的一个特定位置找到一个特定电子的概率的数学小工具。但是,由于所有的电子都相互作用,从这种第一性原理出发计算结构或分子轨道是计算上的一个噩梦,而且只能对最简单的分子(如苯)进行计算,DeepMind的物理学家James Kirkpatrick说。
为了解决这个问题,研究人员(从药理学家到电池工程师,其工作都依赖于发现或开发新分子)几十年来一直依赖一套称为密度函数理论(DFT)的技术来预测分子的物理特性。该理论并不试图对单个电子进行建模,而是旨在计算电子的负电荷在整个分子中的整体分布。Kirkpatrick说:"DFT着眼于平均电荷密度,所以它不知道单个电子是什么。然后,物质的大多数性质可以很容易地从该密度中计算出来。"
自从20世纪60年代开始,DFT已经成为物理科学中使用最广泛的技术之一:Nature新闻团队在2014年的一项调查发现,在前100篇被引用最多的论文中,有12篇是关于DFT的。现代物质性能数据库(如Materials Project)在很大程度上由DFT计算组成。
但这种方法有其局限性,而且对某些类型的分子,甚至像氯化钠这样简单的分子,都会给出错误的结果。而且,尽管DFT计算比那些从基本量子理论出发的计算效率高得多,但它们仍然很麻烦,而且往往需要超级计算机。因此,在过去十年中,理论化学家们越来越多地开始尝试使用机器学习,特别是研究物质的化学反应性质或其导热能力等性质。
是机器学习的理想问题
DeepMind团队已经做出了可能是迄今为止最雄心勃勃的尝试,部署人工智能来计算电子密度,这是DFT计算的最终结果"。这算是机器学习的理想的问题:你知道答案,但不知道你想应用的公式",长期从事DFT工作的理论化学家Aron Cohen说,他现在在DeepMind。
该团队在来自薛定谔方程的1161个精确解的数据上训练了一个人工神经网络。为了提高准确性,他们还将一些已知的物理定律硬塞进网络。然后他们在一组经常被用作DFT基准的分子上测试了训练有素的系统,结果令人印象深刻,von Lilienfeld说,"这是业界所能想到的最好的结果,而且他们以一定的优势战胜了它。"
von Lilienfeld补充说,机器学习的一个优势是,虽然需要大量的计算能力来训练模型,但这个过程只需要做一次。然后可以在普通的笔记本电脑上进行个别预测,与每次都要从头开始计算相比,大大降低了成本和碳排放。
Kirkpatrick和Cohen说,DeepMind正在发布他们训练好的系统,供任何人使用。作者说,目前,该模型主要适用于分子,而不是物质的晶体结构,但未来的版本也可以适用于物质。
参考资料
Castelvecchi D. DeepMind AI tackles one of chemistry's most valuable techniques. Nature. 2021 Dec 10. doi: 10.1038/d41586-021-03697-8.
----------- End -----------
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或
姓名-学校-职务/研究方向。
- 历史文章推荐 -
【AlphaFold】
●迈入世界领先梯队!天壤自研蛋白质结构预测平台 TRFold,单张 GPU 16 秒实现精准预测
●对标AlphaFold2!深势科技发布Uni-Fold蛋白结构预测工具,并开源训练代码
●BioRxiv|利用AlphaFold-Multitimer进行蛋白质复合物预测
●谷歌母公司推出AI驱动的药物发现初创公司Isomorphic Labs
●Nat Rev Drug Discov|AlphaFold对药物发现意味着什么?