DeepMind使用AI首次在量子尺度上模拟物质?俄科学家:NO!
2021年12月,谷歌旗下人工智能公司DeepMind宣布其使用人工智能首次在量子尺度上模拟物质,相关研究发表在《科学》[1]杂志上。他们提出一个神经网络模型DM21以近似密度泛函理论(DFT)的能量密度泛函分量(energy density functional component),DFT描述了分子的量子力学行为。今年2月,DM21正式开源。
简单来说,DeepMind团队展示了如何使用神经网络比现有方法更准确地描述化学系统中的电子相互作用。《自然》杂志甚至将其誉为化学领域最有价值技术之一。
现在,8位俄罗斯研究人员在《科学》[2]杂志上评论称,DeepMind AI概括此类系统行为的能力并不能从已发表的结果中得出,需要重新审视。
01
密度泛函理论(DFT)
解决21世纪的一些重大挑战,如生产清洁电力或开发高温超导体,需要我们设计具有特定性质的新材料。要在计算机上做到这一点,需要模拟电子,这种亚原子粒子控制着原子如何结合形成分子,也负责固体中的电流。
了解电子在分子中的位置可以大大有助于解释其结构、性质和反应性。化学家使用密度泛函理论(DFT)方法,对分子和材料建立精确且计算效率高的模型。
DFT实际上是薛定谔方程的近似。近百年前,埃尔温·薛定谔提出了用于描述量子粒子行为的薛定谔方程。然而,将这个方程应用于分子中的电子是具有挑战性的,因为所有的电子都相互排斥。这似乎需要追踪每个电子位置的概率——即使对少量的电子来说,这也是一项非常复杂的任务。
一个重大突破出现在20世纪60年代,当时Pierre Hohenberg和Walter Kohn两人意识到没有必要单独追踪每个电子。相反,知道任何电子在每个位置的概率(即电子密度)就足以精确计算所有的相互作用。Kohn在证明了这一点后获得了诺贝尔化学奖,从而创立了密度泛函理论(DFT)。
但在一些众所周知的情况下,DFT工具会失败。一是预测原子如何共享电子;在一个著名的例子中,DFT方法错误地预测,即使氯原子和钠原子相距无限远,氯原子仍保留钠原子的一部分电子。出现这样的错误是因为DFT方程只是物理现实的近似。而DeepMind机器学习项目的研究人员表示,他们的神经网络消除了部分电子误差,并且比传统的DFT方法做出更准确的预测。
DeepMind表示,他们解决了传统泛函的两个长期存在的问题:
首先是离域误差:在DFT计算中,泛函通过找到能量最小化的电子构型来确定分子的电荷密度。因此,泛函中的误差可能导致计算的电子密度中的误差。大多数现有的密度泛函近似更倾向于将电子密度不切实际地分散在几个原子或分子上,而不是正确地定位在单个分子或原子周围,如下图。
然后是自旋对称性破缺:当描述化学键的破缺时,现有的泛函倾向于不切实际地倾向于一种被称为自旋对称性的基本对称性破缺的构型。由于对称性在我们对物理和化学的理解中起着至关重要的作用,这种人为的对称性破缺揭示了现有泛函的一个重大缺陷。
左:传统泛函(B3LYP)预测电荷被涂抹在两个相邻的分子上。右:学习泛函(DM21)正确地将电荷定位在一个分子上。
DeepMind表示,这些长期存在的挑战都与泛函在呈现具有“分数电子特征”的系统时的行为有关。通过使用神经网络表示泛函,并调整他们的训练数据集,以捕捉精确泛函的分数电子行为,从而解决离域和自旋对称破缺的问题。“我们的泛函在广泛的大规模基准测试中也显示出高度的准确性,这表明了这种数据驱动的方法可以捕捉到迄今为止难以捉摸的精确泛函的各个方面。”
02
DeepMind的方法只是背答案?
为了证明其优越性,作者在一组拉伸的二聚体(称为BBB集)上测试了DM21,例如,两个氢原子相距很远,总共有一个电子。
DeepMind得出结论,DM21泛函在BBB测试集上表现出优异的性能,远远超过所有测试的经典DFT泛函和DM21m(与DM21相同,除了在训练集中没有分数电子系统)。
但问题就出在这里,8位俄罗斯研究人员表示,虽然这看起来像是DM21已经理解了分数电子系统背后的物理学,但是更仔细的观察显示BBB集中的所有二聚体都变得非常类似于训练集中的系统。事实上,由于电弱相互作用的局域性,原子间的相互作用只有在短距离内才会很强,在短距离外,两个原子的行为基本上就像它们没有相互作用一样,如下图。
俄罗斯研究人员表示,在他们看来,DM21在BBB测试数据集上的性能相对于DM21m的改进可能是由一个更平淡无奇的原因引起的:训练数据集和测试数据集之间的意外重叠。
BBB测试系统与来自训练集的分数电荷原子之间的关系。
俄罗斯科学院泽林斯基有机化学研究所Michael Medvedev解释说,“在某些方面,神经网络就像人类一样:他们更喜欢通过发现错误来获得正确的答案,然后反过来。因此,训练一个神经网络并不那么困难,因为它是为了证明它已经学会了物理定律,而不是记住正确的答案。在训练期间看到的系统上测试神经网络,类似于检查一个小学生,他在五分钟前看到老师解决了一项任务。”
根据研究人员的说法,“BBB测试集不是一个合适的测试集,因为它不测试DM21对分数电子系统的理解:DM21可以很容易地通过记忆获得。而且对DM21处理此类系统的其他四个证据的彻底分析也没有得出决定性的结论:只有它在SIE4x4集合上的良好精度可能是可靠的,但是即使存在误差随距离增长的明显趋势,也表明DM21并非完全没有分数电子系统的问题。”
如果俄罗斯研究人员的说法是正确的,这就意味着DeepMind实际上并没有通过训练神经网络预测量子力学。
对此,DeepMind回应称[3],DM21并不是通过记忆数据实现性能提升的,“我们不同意他们的分析,并认为提出的观点要么不正确,要么与论文的主要结论和DM21的总体质量评估无关。”
截至光子盒发稿,还未看到俄罗斯团队的进一步反驳。
参考链接:
[1]https://www.science.org/doi/10.1126/science.abj6511
[2]https://www.science.org/doi/10.1126/science.abq3385
[3]https://thenextweb.com/news/deepmind-feuds-russian-scientists-over-quantum-ai-research