查看原文
其他

组学专题-蛋白质组学

王hh 生信菜鸟团 2020-02-03

简介

蛋白质组学(英语:proteomics,又译作蛋白质体学),是对蛋白质特别是其结构和功能的大规模研究,是在90年代初期,由Marc Wikins和学者们首先提出的新名词。更重要的是,基因组是相当稳定的实体,而蛋白质组通过与基因组的相互作用而不断发生着改变。一个生命体在其机体的不同部分以及生命周期的不同阶段,其蛋白表达可能存在巨大的差异。 一个生命体在其整个生命周期中所拥有的蛋白质的全体,或者在更小的规模上,特定类型的细胞在经历特定类型刺激时所拥有的蛋白质的全体,分别被称为这个生命体或细胞类型的蛋白质组。 随着人类基因组草图的完成,现在许多学者开始探索基因与蛋白质如何通过相互作用来形成其它蛋白质。 蛋白质组学研究的关键技术包括质谱分析、X射线晶体学、核磁共振和凝胶电泳。


Protein structural levels of interest in proteomics



分类

Structural proteomics -in-depth analysis of protein structure

Expression proteomics - analysis of expression and differential expression of proteins

Interaction proteomics -- analysis of interactions between proteins to characterize complexes and determine function.

方法

Targeted mass spectrometry.gif 活体样品研究和重组蛋白合成。在第二种情形下,用遗传工程方法来克隆待合成的DNA模板,以及把这些基因剪切到宿主细胞(典型的是细菌)中,后者被培养用于大规模蛋白表达。 接着,被合成蛋白需要被从宿主细胞中提取和纯化。纯化的蛋白随后通过结晶(及X-射线晶体衍射)或核磁共振来确定其结构。

Broad-Based Proteomics: one as a whole



蛋白质组数据库

https://www.ebi.ac.uk/ 有很多相关的数据库。

  • UniProtKB。 包含Swiss-prot手动注释的蛋白质信息;以及TrEMBL包含计算机注释的信息,相比Swiss-prot中记录的蛋白质的信息量多(因此也损失了精度)。其中85%的记录来自于公共核苷酸数据库(如ENA/GenBank/DDBJ等)提交的蛋白质编码序列,这些序列会经过UniprotKB的工作人员手动整合添加。该数据库可以用于验证蛋白质的结构功能,查找蛋白质在细胞内的定位等等,当然最基础的同源序列比对是必备功能。

  • IntAct 顾名思义,该数据库记录的是互作分子的关系,特别是蛋白质间的互作关系。互作的数据来自于文献或者专家检索,并符合国际标准(IMEx Consortium规定)。

  • Reactome 记录了人类生化代谢过程中的各种蛋白质,收集过程和IntAct相似。但相比IntAct,Reactome更关注生物学过程,把每个过程中分解成若干分子活动,因此底物和产物信息也有记录。

  • PRIDE 官网说明中指出PRIDE是一系列PRoteomics IDEntifications的数据库。主要包含蛋白质和多肽(另有转录后修饰信息)的记录信息,同时包含支持这些记录的质谱信息。简而言之就是一个质谱数据库,每个蛋白质都附有试验方法的描述,pubmed ID。


参考

  1. https://en.wikipedia.org/wiki/Gelelectrophoresisof_proteins

  2. https://en.wikibooks.org/wiki/Proteomics/IntroductiontoProteomics

  3. https://www.ebi.ac.uk/

还有更多文章,请移步公众号阅读

如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。

如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存