查看原文
其他

手把手教你用云E(二):VINA分子对接

云端软件 北鲲云 2023-01-17


1.前言

抗白血病药物格列卫是ABL激酶抑制剂,1IEP晶体结构为格列卫(STI, GLEEVEC)与ABL激酶的复合物结构。在本练习中,我们在云E算力平台上已经预装好的OpenBael与分子对接软件完成:1)蛋白结构准备;2)配体结构准备;3)分子对接参数设置;4)分子对接;5)结果文件的格式转化;6)可视化分析。


本教程需要了解的预备技能:

1) 对Linux的shell命令有初步了解;

2) 知道分子可视化软件Pymol有初步了解


本教程用到的软件:

1)     PYMOL:在本地机器上使用

2)     OpenBabel:用于格式转化

3)     Vina:分子对接


2.操作步骤

2.1蛋白-配体复合物结构的准备

  • 从PDB数据库上下载格列卫与ALB的复合物结构

    在PYMOL的命令行键入:fetch 1iep

  • 提取CHAIN A,并创建为一个对象1iepA

    在PYMOL的命令行键入:create 1iepA, chain A

  • 删除对象1iep,仅保留CHAIN A

    在PYMOL的命令行键入:delete 1iep

  • 删除水分子

    在PYMOL的命令行键入:remove resn HOH

  • 添加极性氢原子

    在PYMOL的命令行键入:h_add elem O or elem N


2.2 保存复合物结构的配体结构

  • 创建对象ligand,保存复合物结构的配体STI

    在PYMOL的命令行键入:create ligand, resn STI

  • 保存配体结构到本地文件

    在PYMOL的命令行键入:save d:/work/docking/ligand.pdb, ligand

2.3保存复合结构中的蛋白结构

  • 创建对象protein,保存复合物结构的蛋白部分

    在PYMOL的命令行键入:create protein, 1iepA and not resn STI

  • 保存蛋白结构到本地文件

    在PYMOL的命令行键入:save d:/work/docking/protein.pdb, protein

2.4 输入文件的准备

在2.2与2.3小节,我们从复合物结构里提取出了配体与蛋白的PDB文件,分别为ligand.pdb与protein.pdb。现在假设我们已经将这两个文件上传到了云E算力平台的下的一个文件夹里,开始准备Vina计算用的文件。

  • 加载openbabel

    在云E算力平台,openbabel已经通过Anacona安装于rdkit虚拟环境下,因此需要加载Anaconda3,并激活rdkit环境,依次键入如下命令:

    >module add Anaconda3/2020.02

    >source activate

    >conda activate rdkit

    加载成功后,会出现类适于下面的shell界面:


  • 准备蛋白的PDBQT文件

    >obabel -ipdb protein.pdb -o pdbqt -xr -O protein.pdbqt


  • 准备分子对接配置文件

    配置文件需要设定结合位点的中心点以及box尺寸,其中从2.2提取配体的质心是可靠结合位点中心,用openbabel可以获得box文件:

    obabel -ipdb ligand.pdb -obox


出现如下提示:

我们需要用到第二行的最后3列数,分别为中心点的X,Y,Z坐标。

现在,可以创建配置文件:

>touch config.txt

>vim config.txt

输入如下内容:

  • 准备配体文件

    在2.2获得ligand.pdb主要用来定义config.txt的中心坐标用,而不是做为本次计算的输入文件用。我们可以用Chem3D绘制imatinib的3D结构,优化(Optimization)之后保存为mol2文件备用。也可以从PubChem上下载一个3D结构保存为sdf文件备用。总的来说,无论是自己画的,还是下载的,保存为sdf或mol2都可以方便的用openbabel转化为vina可用的文件。在这个算例里,我们从ZINC下载ZINC19632618化合物,保存为mol2。现在用openbabel转化为pdbqt格式:

    >obabel –imol2 ZINC000019632618.mol2 –opdbqt –o ZINC000019632618.pdbqt

2.5分子对接

现在我们准备好了三个关键文件:

蛋白结构:protein.pdbqt

待对接化合物:ZINC000019632618.pdbqt

VINA配置文件:config.txt

确保三个文件在同一目录里,键入如下命令开始对接计算:

>vina –config config.txt –ligand ZINC000019632618.pdbqt


计算完毕,获得vina.log与vina.pdbqt两个输出文件。其中vina.pdbqt为docking的pose,可以用来分析docking预测的相互作用模式。

2.6可视化分析

为了便于可视化分析,需要先将vina.pdbqt转化为sdf等更通用的文件格式:

>obabel -ipdbqt vina.pdbqt -osdf -O vina_out.sdf


现在,将vina_out.sdf文件下载;用PYMOL依次读入protein.pdb与vina_out.sdf可以分析结合模式,如下图2.1所示。

图2.1 VINA分子对接预测的结合模式  / 图片来源于网络


3.小结

在本教程中,我们用Pymol下载复合物结构,并进了蛋白结构准备,对A链加极性氢并保存为protein.pdb,并用openbabel转化为vina可用的受体结构文件。


还用PYMOL将复合物结构的配体提取出来,保存为ligand.pdb,并用openbabel计算其质心用来定义VINA对接配置文件的中心坐标。


还用openbabel将从ZINC上下载的Imatinib 3D结构转化为PDBQT格式。最后,进行了分子对接计算,并将结果转化为通用的sdf格式用PYMOL进行可视化分析。


相关

VirtualFlow 实现超高通量虚拟筛选


用FLARE FEP计算相对结合自由能

最新

云端软件冯建新:力推硬科技发展,打造高性能云计算“新基建”


《药物开发中的人工智能:现状与未来展望(上)》


《药物开发中的人工智能:现状与未来展望(下)》

技术

侧链虚拟筛选:全PDB和ChEMBL数据分析


关于云端

深圳云端软件有限公司(Cloudam)是弹性算力与云成本优化的技术领导者,为企业打造一站式的算力云平台及自动化云成本优化服务。云端软件推出的云E算力平台整合了全球主流公有云近50个地域的高性能计算资源,能为人工智能、仿真模拟、生物科技、材料化学等行业提供弹性、高效、经济的算力支持。


Cloudam成立于瑞典斯德哥尔摩,在深圳及斯德哥尔摩两地运营,团队核心成员来自于Oracle、Ericsson、IBM、华为等知名企业,拥有15年以上的世界500强企业技术服务经验和研发背景,已成功为欧洲及中国多家企业提供产品和技术服务。

分享、在看与点赞

了解更多高性能计算与云的知识

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存