查看原文
其他

蛋白质组学搜库数据下载 | 云课堂(19)

云平台 联川生物 2022-05-21

一直关注联川公众号的小伙伴们都知道,联川云平台已于2018年12月6日正式上线(http://www.lc-bio.cn/index.html);

还没使用过的小伙伴,赶紧点开大显身手一番~使用指南详情请戳此链接:联川生物云平台使用指南

联川云平台包含FAQ/SOP和云平台双重功能:丰富的FAQ/SOP,助你快速上手入门,更有详尽的分析技能小技巧等你来学习;云平台中包含科研中经常用到的分析绘图软件,可对实验数据进行统计分析、绘图等。

今天小编将与大家一起分享云平台里的蛋白质组学搜库数据下载,一起学起来吧~


蛋白组学的搜库数据来源主要有以下几个途径:

1. 指定数据库,

2. Uniprot 数据库,

3. NCBI 数据库,

4. Ensembl 数据库,

5. 其他。

通过上述途径获得目标物种的蛋白数据库FASTA 文件,用于蛋白鉴定过程的搜库依据。搜库前首先要确定目标物种的拉丁名,作为搜索时的依据。

1. 指定数据库

如果给出了自己要求的数据库,要根据指定的数据库名称或链接下载相应的物种数据库。

2.  Uniprot 数据库(https://www.uniprot.org/)

Uniprot 数据库是最常用的蛋白搜库数据库。如无特别要求,蛋白的搜库 FASTA 文件一般在该网站下载。以葡萄(对应拉丁名为 vitis vinifera)为例,具体的 FASTA 文件下载步骤如下。

在网站页面搜索框输入物种拉丁名,点击搜索: 

在搜索结果页面左侧的选项栏中选择相应的物种:

在搜索结果页面点击 Download,选择 Download all,Format 选项选择文件格式为 FASTA,最终点击 GO 按钮,下载文件。

最终下载获得的文件内容如下:

每个“>”号后为一个蛋白的信息。

sp 表示 Swiss-Prot 数据库,此处还可能是tr,表示TrEMBL 数据库;

P28343是蛋白在UniProt数据库中的ID号,THS1_VITVI 是蛋白在UniProt上的登录名;

Stilbene synthase 1是蛋白的名称;

OS 表示 Organism,也就是物种名称,这里的 vitis vinifera 跟我们搜索时使用的拉丁名应该保持一致;

GN 表示 gene name,即基因名称;

PE 表示 ProteinExistence,即蛋白的可靠性,可以是 1~5 中的任意整数,数字越小可靠性越高;

SV 表示 Sequence Version,即蛋白的序列版本。

最终下载的 FASTA 文件要检查蛋白数目是否下全,即是否和下载时网页中显示的数目一致,并且要检查每个蛋白的所属物种是否为目标物种。

3.  NCBI 数据库(https://www.ncbi.nlm.nih.gov/)

打开 NCBI 网站首页,在搜索框输入比如葡萄的拉丁名——vitis vinifera,在下拉列表中选择数据库类 型 Genome,点击 Search。

在搜索结果页面选择 protein,就可下载到物种的蛋白搜库文件。 

4.  Ensembl 数据库

这里以玉米(zea_mays)为例,Ensembl有专门的植物数据库,登录 Ensembl plant网站,在搜索框输入目标物种拉丁名——zea_mays

在结果页面选择 downloads 选项:

在弹出的页面选择 FTP server: 

在 FTP 页面依次选择 fasta、zea_mays、pep:

下载相应路径下的文件即可。 

5. 其他

对于仅在特定的数据库或网站中才有蛋白库文件的物种,要根据相应数据库的具体要求下载 FASTA 文 件,并对下载文件进行检查。


蛋白质组学搜库数据下载就分享完了,除了本教程联川云平台还有很多小技能供学习哦~下载本教程请至云平台:http://www.lc-bio.cn/faq/sop_detail.php?id=83或直接点击文末左下角“阅读原文”下载~


云平台登录和注册的流程


云平台目前只针对联川客户开放,注册需用正确的合同号进行注册哦,有多个合同的填写任意一个合同号即可。暂不能体验的小伙伴也别着急,随着平台的优化,也会逐步对全员开发的~注册链接如下:

http://www.lc-bio.cn/index.html

也欢迎给位给我们的云平台留言、提建议

在大家的督促下,我们的云平台会越做越好


相关阅读

 

脚踏七彩祥“云”为您打造生物信息分析的“梦幻花园”

联川生物云平台使用指南

云平台|Haploview绘制曼哈顿图小技巧

云平台 | LEfSe在线分析教程

MEGA软件下载安装&序列处理&进化树绘制&Newick格式介绍

云平台|bio-Venn在线绘制Venn图

云课堂(5) | Circos画图入门教程

云课堂(6) | FigTree构建进化树(圆形)教程

云课堂(7) | FigTree构建进化树(柱状)教程

云课堂(8)|MetaboAnalyst使用教程-Enrichment Analysis模块

云课堂(9)|MetaboAnalyst使用教程-Pathway Analysis模块

云课堂(10) | MicrobiomeAnalyst在线绘图教程

云课堂(11) | 真菌FUNGuide功能预测使用指南

云课堂(12) | 如何通过PS软件设置图片分辨率及拼图

云课堂(13) | 高通量测序数据NCBI GEO数据库上传指南

蛋白质组数据上传指南 | 云课堂(14)

NCBI-SRA数据上传指南 | 云课堂(15)

微生物基因组数据上传指南 | 云课堂(16)

云课堂(17) | Cytoscape内插stringAPP完成PPI蛋白互作分析指南

Enrichment Analysis 模块 | 云课堂(18)

干货合集|2018年的科研技巧全在这儿了

干货合集|2017年的科研小技巧全在这儿了

干货合集|2017年的案例解析全在这儿了

科研圈高质量公众号大汇总|资料篇

联川生物2018年最全新品&用户文章汇总|年终盘点

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存