蛋白结构预测工具SWISS-MODEL和Phyre2
蛋白质是生命活动的基本单位,其结构决定了功能,对蛋白质结构的研究有助于对其功能的研究。而目前蛋白质结构数据库 PDB中所存储的蛋白质三维结构主要通过X射线晶体衍射和核磁共振成像技术得到,两种实验方法均成本不菲。近年来,随着计算机技术的快速进步极大促进了蛋白质结构预测的发展,目前蛋白质结构预测方法有三种,即同源建模法、折叠识别法和从头预测法。
( 1 )同源建模法:
同源建模法也称比较建模法,是基于知识的蛋白质结构预测方法。根据PDB数据库中的蛋白质结构比较分析研究得知,任何一对蛋白质,只要序列长度达到一定程度,序列相似性超过30%,就可以保证它们具有相似的三维结构。因此对于一个未知的结构的蛋白质,如果找到一个已知结构的同源蛋白质,就可以该蛋白质为模板,构建模型。
折叠识别法也称反向折叠法、串线算法等。该方法基于很多没有序列相似性的蛋白质具有相似的折叠模式。因此可以开发序列结构比对的方法,通过目标蛋白质的氨基酸序列和已知折叠模式的逐一对比,根据特定的计分函数找出最有可能的未知序列折叠模式。
(3)从头预测法:
科学出版社生物信息学(第二版)
SWISS-MODEL
SWISS-MODEL是一款用同源建模法预测蛋白质三级结构的全自动在线软件。 建立同源模型包括四个主要步骤:1、识别结构模板;2、比对目标序列和模板结构;3、建立模型;4、模型质量评价。以上每一步都可以交互重复,直到得到满意的建模结果。
SWISS-MODEL网址:
https://swissmodel.expasy.org/
SWISS-MODEL操作
2、在红框中输入目标蛋白的氨基酸序列,创建标题,填写邮箱,创建模型
>CAG38767.1 HBB [Homo sapiens]
MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH
3、等待约5分钟后,获得结果
A、GMQE(全局模型质量估计)是一种结合目标-模板对齐方式和模板搜索方法的属性的质量估计。QSQE得分在0-1之间,QSQE值越高越好,而在建模过程中,如果QSQE值大于0.7,则可以认为是准确的,GMQE分数估计了结果模型的第三级结构的准确性。
B、QMEANDisCo global的得分也在0-1之间,没有明确的依赖值。
4、如果出现多个预测结果,根据以上得分选择结果最好的模型
5、默认模型为cartoon,可使用鼠标转动模型
6、根据所需调整模型为surface(红色箭头),并保存图片(蓝色箭头)
Cartoon backbone representation is one way to represent a 3D protein structure that puts emphasis on secondary structure. Showing all of the atoms in a protein structure can be confusing due to the complexity of the structure, so backbone representations, like the cartoon backbone representation, simplify the picture by showing only a trace that connects the alpha-carbons in the structure. The cartoon backbone representation depicts alpha-helices using flat helical sheets and beta-sheets via flat level sheets, many times with arrows to indicate the N->C direction of the helices or sheets.
The surface representation of a protein, in PyMol, shows the "Connolly surface" or the surface that would be traced out by the surfaces of waters in contact with the protein at all possible positions.
Phyre2
Phyre2网站基于折叠识别法预测蛋白结构,由Lawrence Kelley博士(Structural Bioinformatics Group, Imperial College, London)设计和编写的。Phyre2通过hidden Markov models via HHsearch1(隐马尔科夫模型的一种)进行比对,显著提高比对精度和检测率。还加入了新的从头计算折叠模拟,以模拟与已知结构无同源性的蛋白质区域。
Phyre2网址:
http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index
Phyre2操作
3、查看PSI-Blast多序列比对结果
4、使用PyMOL可视化
5、Phyre2的新消息
可能是由于Lawrence Kelley博士退休,目前Phyre2的部分功能不能使用。
SWISS-MODEL与Phyre2预测结果比较
另外,根据之前经验,有些蛋白在SWISS-MODEL中不能拿到很好的结果,但Phyre2可以。Phyre2的缺点是耗时过长。
校对:宋红卫