又到栀子花开的季节,又是一年毕业季!研究生们给自己的科研生涯留下怎样的浓墨重彩呢?让我们拭目以待吧!
1.Nature Communications:机器学习共价键碳的亚稳态相图
传统的相图生成,包括实验来提供热力学上可接近的相集及其边界的初始估计,然后使用唯象模型在可用的实验数据点之间插值,并外推到实验无法接近的区域。这种方法,结合高通量第一性原理计算和数据挖掘技术,已经产生了详尽的热力学数据库(例如与CALPHAD方法兼容),尽管重点是在不同的热力学平衡中观察到的减少的相集。相反,材料在其合成、操作或加工过程中,可能不会达到热力学平衡状态,而是停留在局部(亚稳态)自由能的最小值,这可能会表现出理想的性质。在此,来自美国阿贡国家实验室的Jianguo Wen & Pierre Darancet和美国伊利诺伊大学的Subramanian K.R.S. Sankaranarayanan等研究者,引入了一个自动化的工作流程,将第一性原理物理、原子模拟与机器学习(ML)和高性能计算集成在一起,以允许快速探索亚稳相,为远非平衡的材料构建“亚稳”相图。利用碳作为一个原型系统,研究者演示了自动构建亚稳相图,以映射从接近平衡到远离平衡的数百个亚稳态(400 meV/原子)。研究者将自由能计算纳入基于神经网络的状态方程学习,从而允许有效地构建亚稳态相图。研究者利用亚稳相图,确定了亚稳材料的相对稳定性和可合成性的区域。利用石墨样品上的金刚石顶锤单元进行的高温高压实验,结合高分辨率透射电子显微镜(HRTEM)证实了研究者的亚稳相预测。特别地,研究者确定n-金刚石以前的模糊结构为三次模拟的类似于diapite -like lonsdaelite相。Srinivasan, S., Batra, R., Luo, D. et al. Machine learning the metastable phase diagram of covalently bonded carbon. Nat Commun 13, 3251 (2022).https://doi.org/10.1038/s41467-022-30820-8https://www.nature.com/articles/s41467-022-30820-82.Nature Communications:语言模型可以学习复杂的分子分布
分子的深度生成模型越来越受欢迎,训练相关的数据集,这些模型被用于搜索化学空间。生成模型对新型功能性化合物逆向设计的下游效用,取决于它们对分子训练分布的学习能力。最简单的例子是一个语言模型,它采用循环神经网络的形式,并使用字符串表示生成分子。自从它们最初的使用以来,后续的工作已经表明语言模型是非常强大的,特别是最近的研究已经证明了它们在低数据领域的效用。在此,来自加拿大多伦多大学的Daniel Flam-Shepherd & Alán Aspuru-Guzik等研究者分析了简单语言模型学习更复杂的分子分布的能力。为此,研究者引入了几个具有挑战性的生成式建模任务,通过编译更大、更复杂的分子分布,并评估语言模型在每个任务上的能力。结果表明,语言模型是强大的生成模型,能够熟练地学习复杂的分子分布。语言模型可以准确生成:ZINC15中得分最高的惩罚LogP分子分布,PubChem中多模态分子分布以及最大分子分布。结果突出了一些最流行的和最近的图形生成模型的局限性——其中许多不能扩展到这些分子分布。Flam-Shepherd, D., Zhu, K. & Aspuru-Guzik, A. Language models can learn complex molecular distributions. Nat Commun 13, 3293 (2022). https://doi.org/10.1038/s41467-022-30839-xhttps://www.nature.com/articles/s41467-022-30839-x3.Nature Communications:超高强度材料的同素异构性
在许多材料中,应力的应用,可以驱动同素异构相变;对于压力驱动的转换,这一点已经得到了充分的证明。近年来,在强化材料方面取得的进展,使得应用非常大的剪应力成为可能,同时也开辟了巨大的新的应力空间区域。这意味着应力空间是六维的(而不是压力的一维),相变取决于晶体/晶粒的取向。在此,来自香港大学的David J. Srolovitz等研究者提出了一种新的方法来预测整个应力张量对任何材料中所有方向晶粒相变的作用。这种多尺度方法是以非线性弹性理论为基础和指导的密度泛函理论。研究者的重点是应力张量依赖的同素异向相变铁在高压和超细晶粒镍和钛。结果与在这些不同系统中的一系列实验观测结果在定量上是一致的。这种方法使高强度高延性材料的平衡设计成为可能。Pattamatta, A.S.L.S., Srolovitz, D.J. Allotropy in ultra high strength materials. Nat Commun 13, 3326 (2022). https://doi.org/10.1038/s41467-022-30845-zhttps://www.nature.com/articles/s41467-022-30845-z4.Nature Communications:参考文献的作用以及化学键的难以捉摸的性质
化学键理论对化学是至关重要的,一个标准的范式,其中量子力学干涉导致两个接近的碎片动能降低的标准范式已经出现。在此,来自西班牙奥维多大学的Ángel Martín Pendás等研究者,报告了内部和外部参考偏差仍然存在于这个模型中,留下了许多未探索的领域。研究者展示了前偏差如何影响波函数干涉的概念,这据称是公认的最基本的结合机制。后者影响如何选择键合模型。研究者证明使用真实空间分析是尽可能少的参考,提倡使用它们。离域作为无参考的等效干扰和结合的最终根源出现。分子中的原子(或碎片),应该被理解为在电子数、自旋等方面不同的组分的统计混合物。Martín Pendás, Á., Francisco, E. The role of references and the elusive nature of the chemical bond. Nat Commun 13, 3327 (2022). https://doi.org/10.1038/s41467-022-31036-6https://www.nature.com/articles/s41467-022-31036-65.JACS:预测有机溶质在大范围溶剂和温度下的溶解度极限
有机分子的溶解度,在有机合成和工业化学中至关重要;它在许多相分离和净化装置的设计中很重要,它控制着许多物种向环境中的迁移。为了决定哪些溶剂和温度可以用于新工艺的设计,经常使用反复试验,因为选择受到未知的固体溶解度限制。在此,来自美国麻省理工学院的William H. Green等研究者,提出了一种快速和方便的计算方法,来估计固体中性有机分子在水和许多有机溶剂中广泛的温度范围内的溶解度。该模型是通过结合基本热力学方程和机器学习模型来开发的,包括溶剂化自由能、溶剂化焓、亚伯拉罕溶质参数和298 K时的水固溶解度。研究者提供免费的开源和在线工具,用于预测固溶性极限,并收集了包括5000多个用于验证模型的实验固溶性值的数据(SolProp)。该模型的预测对于含水体系和550 K或更高范围的有机溶剂都是准确的。本文还提出了通过提供有关溶质,在另一种溶剂中或溶质升华焓的实验数据,来进一步改进固体溶解度预测的方法。Florence H. Vermeire, Yunsie Chung, and William H. Green. Predicting Solubility Limits of Organic Solutes for a Wide Range of Solvents and Temperatures. Journal of the American Chemical Society Article ASAP DOI: 10.1021/jacs.2c01768https://pubs.acs.org/doi/10.1021/jacs.2c01768