查看原文
其他

BIB文章|深势科技Uni-GBSA:为高通量虚拟筛选设计的结合自由能计算工具

开拓创新的 深势科技 DP Technology 2024-03-29

 导语 

在药物虚拟筛选中,结合自由能计算是评估蛋白-小分子结合强度的重要方法。然而,精确的结合自由能计算方法,例如自由能微扰(free energy perturbation,FEP)[1]和热力学积分(thermodynamic integration,TI)[2],由于计算效率问题,不适用于评估大量蛋白质-配体体系的结合自由能;而使用简单的经验打分函数(scoring function),例如Vina Score[3]、X-Score[4]和GlideScore[5]尽管高效,但结果通常不太可靠。分子力学泊松-玻尔兹曼表面积(MM/PBSA)和分子力学广义玻尔兹曼表面积(MM/GBSA),由于兼顾了效率和精度,在虚拟筛选场景下得到了广泛的应用。目前已有的开源工具,如g_mmpbsa[6]和MMPBSA.py[7]等,使用流程复杂、入手门槛较高,难以应用于大规模虚拟筛选计算。

2023年6月17日,深势科技在Briefings in Bioinformatics上发表了一篇题为"Uni-GBSA: an open-source and web-based automatic workflow to perform MM/GB(PB)SA calculations for virtual screening"[8]的文章,发布了Uni-GBSA——结合自由能自动计算套件(可点击文末“阅读原文”查看全文)。Uni-GBSA可以自动地完成MM/GB(PB)SA计算的拓扑准备、结构优化和结合自由能计算整个流程。在有若干化合物亲和力实验数据的蛋白体系中,Uni-GBSA可以自动进行结合自由能计算参数扫描,挑选最优的参数组合。此外,为了在虚拟筛选中快速评估大量蛋白-配体复合物的结合自由能,Uni-GBSA还提供了一种并行批处理模式,可以在虚拟筛选的场景下同时评估大批量分子。这项工作降低了结合自由能计算工具的使用门槛,为结合自由能计算虚拟筛选中的广泛应用提供了高效的计算工具。

功能



Uni-GBSA是一个开源的、为高通量虚拟筛选设计的、用户友好的结合自由能计算工具,通过端到端的自动工作流实现,大大降低了进行MM/GB(PB)SA计算的门槛。Uni-GBSA具有以下功能特性:

1. 结合自由能计算自动工作流(Automatic Workflow):

  • 支持不同的力场和小分子电荷方法自动进行拓扑准备;

  • 支持自动开展分子动力学模拟对结构进行优化;

  • 支持不同的溶剂模型(GB和PB)计算结合自由能;

  • 支持结合自由能的能量分解分析;

2. 参数扫描(Parameter Scanning):

当对单个蛋白受体具有多个通过实验验证的配体结合亲和力数据时,支持自动开展MM/GB(PB)SA的参数设置调优,提供最适合该体系的参数组合;
3. 批处理模式(Batch Mode):
支持在单个蛋白受体上对大批量配体自动开展并行MM/GB(PB)SA计算。

Uni-GBSA流程图

结果

针对不同的蛋白受体,MM/GB(PB)SA结合自由能计算在拓扑构建、结构优化、溶剂模型等步骤使用的参数上有着很大的组合空间。
为了确定一套通用的MM/GB(PB)SA计算参数,使Uni-GBSA的默认参数设置能在绝大多数体系上有可靠的表现,研究团队在包含1864个蛋白质-配体复合物体系的PDBBind-2011 refine-set[9-10]上进行了系统化的参数测试。通过比较不同参数组合下实验获得的化合物pIC50值和MM/GB(PB)SA计算结果的皮尔逊相关系数,研究团队获得了一套在大多数体系上都有可靠表现的MM/GB(PB)SA的计算参数组合(图中蓝色条块对应参数),设置为Uni-GBSA的默认参数。这套参数在PDBBind-2020 refine-set[9-10]上可以得到实验与计算的皮尔逊相关系数为0.487,其中对分子量小于800的体系相关系数为0.501。

Uni-GBSA在PDBBind-2011 refine-set上的参数测试结果

Uni-GBSA在PDBBind-2020 refine-set上的效果表现

为了验证Uni-GBSA在虚拟筛选中的应用效果,研究团队还在BACE-1数据集[11]上评估了Uni-GBSA在特定蛋白受体上对配体结合亲和力高低的排序能力。研究团队以分子对接软件Uni-Dock[12]预测的top-1结合构象为起始结构,比较了Vina打分函数和Uni-GBSA的MM/GB(PB)SA计算结果在不同采样率(1%、5%、10%、15%、20%)下的富集因子(Enrichment Factor,EF)。其中,富集因子的定义如下:

对于Uni-GBSA方法,研究团队对一个包含273个具有已知晶体结构的BACE-1复合物子集进行了参数扫描,得出了适用于BACE-1的MM/GB(PB)SA计算参数,并用于计算BACE-1完整数据集的MM/GB(PB)SA。结果表明,在所有采样率下,使用Uni-GBSA挑选的真阳性分子的数量始终高于使用Vina评分函数挑选的真阳性分子的数目。这表明Uni-GBSA在虚拟筛选中具有更好的分子富集性。

Uni-GBSA在BACE-1数据集上的排序能力

总结



深势科技研发团队发布了Uni-GBSA——一款结合自由能计算工具,为研究人员更容易地开展MM/GB(PB)SA结合自由能计算提供了优选方案。Uni-GBSA为完成结合自由能计算提供了端到端的自动化工作流,大大降低了研究人员的使用门槛和时间成本。通过系统化测试,Uni-GBSA的默认参数设置可以在绝大多数体系上获得可靠的结果,同时Uni-GBSA提供了参数扫描等实用工具,助力研究人员更好地使用结合自由能计算来解决实际问题。研究团队验证了Uni-GBSA结合自由能计算在虚拟筛选上的可靠性,并提供了批处理模式以在虚拟筛选中快速评估大量蛋白-配体复合物的结合自由能。

One More Thing


Uni-GBSA现已开源!在遵从Apache 2.0开源协议的前提下,用户可以在从深势科技Github仓库获取Uni-GBSA的源代码,将Uni-GBSA应用在科研和工作中。

深势科技Github仓库:https://github.com/dptech-corp/Uni-GBSA

如果您是一个初学者,想学习Uni-GBSA的使用方法,完成结合自由能计算从提交任务到结果回收分析等一系列工作,可以按照Bohrium® Notebook上的Uni-GBSA使用案例,一步一步地学习如何完成这些工作。

Bohrium®  Notebook Uni-GBSA使用案例:https://nb.bohrium.dp.tech/detail/1290

如果您想用Uni-GBSA完成一个虚拟筛选工作,但手头没有合适的计算资源,您可以在深势科技Bohrium® App上提交您的虚拟筛选作业,平台会将您的任务自动分配计算资源,快速完成虚拟筛选并返回结果。

深势科技 Bohrium® Apphttps://app.bohrium.dp.tech/uni-gbsa
如果您不仅想使用Uni-GBSA开展虚拟筛选,还想在可视化界面上查看和分析蛋白-配体复合物的结合姿势,并开展例如蛋白结构预测、蛋白配体对接、自由能微扰FEP计算、分子性质预测、抗体人源化设计与性质预测等进一步评估和分析工作,您可以登录深势科技药物计算设计平台Hermite®(hermite.dp.tech),获取一站式药物设计解决方案。Hermite®提供了基于网页的交互式全新分子展示体验,为药物研发科学家带来了跨窗口智能化协作,多样的分子展示和操作功能,方便了使用者对蛋白、药物分子及其模拟数据的查看、分析和分享,同时支持本地和云上的私有化部署。

参考文献

[1] Zwanzig RW. High-temperature equation of state by a perturbation method. i. Nonpolar gases. JChemPhys1954; 22(8): 1420–6.

[2] Jorge M, Garrido NM, Queimada AJ, et al. Effect of the integration method on the accuracy and computational efficiency of free energy calculations using thermodynamic integration. JChem Theory Comput 2010; 6(4): 1018–27.

[3] Trott O, Olson AJ. Autodock vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. JComputChem2010; 31(2): 455–61.

[4] Wang R, Lai L, Wang S. Further development and validation of empirical scoring functions for structure-based binding affinity prediction. J Comput Aided Mol Des 2002; 16(1): 11–26.

[5] Halgren TA, Murphy RB, Friesner RA, et al. Glide: a new approach for rapid, accurate docking and scoring. 2. Enrichment factors in database screening. J Med Chem 2004; 47(7): 1750–9.

[6] Kumari R, Kumar R. Open source drug discovery consortium, and Andrew Lynn. g_mmpbsa: a gromacs tool for high-throughput mm-pbsa calculations. J Chem Inf Model 2014; 54(7): 1951–62.

[7] Bill R, Miller T, III, Jr DMG, et al. Mmpbsa. Py: an efficient program for end-state free energy calculations. J Chem Theory Comput 2012; 8(9): 3314–21. 11.

[8] Yang M, Bo Z, Xu T, Xu B, Wang D, Zheng H. Uni-GBSA: an open-source and web-based automatic workflow to perform MM/GB(PB)SA calculations for virtual screening [published online ahead of print, 2023 Jun 16]. Brief Bioinform. 2023;bbad218.[9] Wang R, Fang X, Yipin L, Wang S. The pdbbind database: collection of binding affinities for protein- ligand complexes with known three-dimensional structures. J Med Chem 2004; 47(12): 2977–80.[10] Wang R, Fang X, Yipin L, et al. The pdbbind database: methodologies and updates. J Med Chem 2005; 48(12): 4111–9.[11] Subramanian G, Ramsundar B, Pande V, Denny RA. Computational modeling of β-secretase 1 (bace-1) inhibitors using ligand based approaches. J Chem Inf Model 2016; 56(10): 1936–49.[12] Yu Y, Cai C, Wang J, Bo Z, Zhu Z, Zheng H. Uni-Dock: GPU-Accelerated Docking Enables Ultralarge Virtual Screening. J Chem Theory Comput. 2023;19(11):3336-3345.

上下滑动查看更多

关于深势科技

深势科技是“AI for Science”科学研究范式的引领者和践行者,致力于运用人工智能和分子模拟算法,结合先进计算手段求解重要科学问题,为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。

我们开创性地提出了「多尺度建模+机器学习+高性能计算」的革命性科学研究新范式,并推出了Bohrium®微尺度科学计算云平台、Hermite®药物计算设计平台、RiDYMO™强化动力学平台及电池材料计算设计平台等微尺度工业设计基础设施,颠覆了现有研发模式,打造“计算引导实验、实验优化设计”的全新范式。

深势科技是国家高新技术企业、北京市“专精特新”中小企业,总部位于北京,并在上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中公司的博士及博士后占比超过35%。核心成员获得过2020年全球计算机高性能计算领域的最高奖项“戈登贝尔奖”,相关工作当选2020年中国十大科技进展和全球AI领域十大技术突破。

↓↓点击“阅读原文”,浏览完整文章

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存