查看原文
其他

复旦大学徐昕团队Precision Chemistry | 基于¹³C化学位移的机器学习模型解析复杂有机化合物结构

ACS Publications ACS美国化学会 2023-03-12

英文原题:Elucidating structures of complex organic compounds using a machine learning model based on the 13C NMR chemical shifts

通讯作者:徐昕,复旦大学化学系教授

作者:Anan Wu (吴安安), Qing Ye (叶青), Xiaowei Zhuang (庄晓维), Qiwen Chen (陈齐文), Jinkun Zhang (张金坤), Jianming Wu (吴剑鸣)

文章亮点


复旦大学徐昕教授团队将密度泛函与支持向量机(SVM)相结合,提出了一种基于13C化学位移的有机物结构解析的高效且精准的方法,称为SVM-M。利用SVM方法中的决策值的双重作用,SVM-M不仅可以判断单个候选结构是否正确,同时在有多个相似候选结构下也可以判断哪个结构更为正确。在一组包含760个分子的分子集中,该方法的精度高达99%,这使得SVM-M有望成为有机物结构解析的高效准确的常规工具。相关工作以“Elucidating structures of complex organic compounds using a machine learning model based on the 13C NMR chemical shifts”为题,发表于Precision Chemistry


研究背景


探究构效关系,即研究化学结构与生理活性和药理活性之间的关系,是深入研究有机物,揭示其生理学和药理学内涵及潜在应用的核心课题。其中,对于有机物结构的解析是这一研究得以顺利进行并向纵深扩展的前提。近年来,随着核磁技术和密度泛函方法的发展,核磁共振化学位移测定和基于密度泛函的化学位移计算相结合,形成了计算辅助的有机物结构解析,并逐步走向自动化。这已逐渐成为了解析有机物结构的重要手段之一。


在基于核磁共振谱的有机物结构解析领域中,时常需要判断一个给定结构正确与否;另一方面,由于有机物具有结构多样性,其不同异构体通常具有相似的核磁谱图,因此在有机物结构解析中还需要判断在多个相似候选结构中哪个结构更为正确。前者被称为分类问题,而后者被称为比较问题。纵观现有的各种计算辅助的天然产物结构解析方法,人们尚未建立一种方法能够同时解决天然产物结构解析中的比较问题和分类问题。因此,构建一种既能解决比较问题又能解决分类问题的模型方法是十分重要且必要的。


内容介绍



对于二分类问题,SVM已经被证明是最好的监督学习方法之一。事实上,SVM中最重要的参数,决策值,有着双重作用。一方面其符号(上图用红蓝球颜色示意)决定给定对象的类别(正确或错误);另一方面其值的大小(上图用球到分割面的距离来示意)反映了分类的效果,其值越大则表明分类置信度越高。SVM的这种特性,使其特别适合处理有机物结构解析领域中所面临的两个问题,即判断一个给定结构正确是否和哪个结构更为正确。将密度泛函与SVM相结合,我们首次提出了一种基于13C化学位移的有机物结构解析的高效且精确的方法,SVM-M。



上图是文章中具体应用的一些分子。相较于基于比较的方法(如著名的DP4系列),SVM-M不仅可以通过直接分类来协助实验,以发现结构解析中的错误,如发现实验在Gunnilactam B结构解析中的错误。在有机物立体结构解析中由于不同异构体通常具有相似的核磁谱图,因此分类问题不能解决哪个异构体更接近实验谱图。利用决策值的大小,SVM-M可以高效且精准地从多个相似结构中发现正确的结构。


如上图所示,在有机物立体结构解析应用中,SVM-M明显优于DP4系列方法。这使得SVM-M有望成为有机物结构解析的高效且准确的常规工具。


作者团队简介


复旦大学徐昕课题组(课题组网页:www.xdft.org)的主要研究方向为理论方法开发(如密度泛函理论的新泛函、氧化物SPC嵌入簇模型方法、XO组合方法、X1系列热力学校正方法,动力学蒙特卡洛方法XPK等),及其在多相催化、均相催化、(催)组装体系等方面的应用,取得了一系列国内外同行公认的科研成果,部分科研成果获2019年教育部高等学校科学研究优秀成果奖——自然科学一等奖(题目:密度泛函理论新进展)。徐昕教授现为JACS Au副主编。与厦门大学吴安安课题组长期合作,开发了OPBE、xOPBE、FPA-M等系列方法,用于13C化学位移的高精度计算。


扫描二维码阅读英文原文

Precis. Chem. 2023, ASAP

Publication Date: February 15, 2023

https://doi.org/10.1021/prechem.3c00005

Copyright © 2023 The Authors. Co-published by University of Science and Technology of China and American Chemical Society


关于 Precision Chemistry

Precision Chemistry 将发表化学及交叉领域中以精准化为导向的高水平的具有重要意义和吸引广泛兴趣的原创研究,包括但不限于计算、设计、合成、表征、应用等方面的前沿性研究成果,将秉承尊重科学、兼容并包的态度,为全球科研人员提供高质量的、开放的学术交流平台,服务于广大的化学和科学界。期刊将发表原创论文、快报、综述、展望、以及多样化的短篇社评。

  • 首期上线:2023年3月

  • 首年接受发表的文章免收文章出版费(APC)

点击“阅读原文”

你“在看”我吗?


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存