蛋白质组学搜库数据下载 | 云课堂(19)
一直关注联川公众号的小伙伴们都知道,联川云平台已于2018年12月6日正式上线(http://www.lc-bio.cn/index.html);
还没使用过的小伙伴,赶紧点开大显身手一番~使用指南详情请戳此链接:联川生物云平台使用指南;
联川云平台包含FAQ/SOP和云平台双重功能:丰富的FAQ/SOP,助你快速上手入门,更有详尽的分析技能小技巧等你来学习;云平台中包含科研中经常用到的分析绘图软件,可对实验数据进行统计分析、绘图等。
今天小编将与大家一起分享云平台里的蛋白质组学搜库数据下载,一起学起来吧~
蛋白组学的搜库数据来源主要有以下几个途径:
1. 指定数据库,
2. Uniprot 数据库,
3. NCBI 数据库,
4. Ensembl 数据库,
5. 其他。
通过上述途径获得目标物种的蛋白数据库FASTA 文件,用于蛋白鉴定过程的搜库依据。搜库前首先要确定目标物种的拉丁名,作为搜索时的依据。
1. 指定数据库
如果给出了自己要求的数据库,要根据指定的数据库名称或链接下载相应的物种数据库。
2. Uniprot 数据库(https://www.uniprot.org/)
Uniprot 数据库是最常用的蛋白搜库数据库。如无特别要求,蛋白的搜库 FASTA 文件一般在该网站下载。以葡萄(对应拉丁名为 vitis vinifera)为例,具体的 FASTA 文件下载步骤如下。
在网站页面搜索框输入物种拉丁名,点击搜索:
在搜索结果页面左侧的选项栏中选择相应的物种:
在搜索结果页面点击 Download,选择 Download all,Format 选项选择文件格式为 FASTA,最终点击 GO 按钮,下载文件。
最终下载获得的文件内容如下:
每个“>”号后为一个蛋白的信息。
sp 表示 Swiss-Prot 数据库,此处还可能是tr,表示TrEMBL 数据库;
P28343是蛋白在UniProt数据库中的ID号,THS1_VITVI 是蛋白在UniProt上的登录名;
Stilbene synthase 1是蛋白的名称;
OS 表示 Organism,也就是物种名称,这里的 vitis vinifera 跟我们搜索时使用的拉丁名应该保持一致;
GN 表示 gene name,即基因名称;
PE 表示 ProteinExistence,即蛋白的可靠性,可以是 1~5 中的任意整数,数字越小可靠性越高;
SV 表示 Sequence Version,即蛋白的序列版本。
最终下载的 FASTA 文件要检查蛋白数目是否下全,即是否和下载时网页中显示的数目一致,并且要检查每个蛋白的所属物种是否为目标物种。
3. NCBI 数据库(https://www.ncbi.nlm.nih.gov/)
打开 NCBI 网站首页,在搜索框输入比如葡萄的拉丁名——vitis vinifera,在下拉列表中选择数据库类 型 Genome,点击 Search。
在搜索结果页面选择 protein,就可下载到物种的蛋白搜库文件。
4. Ensembl 数据库
这里以玉米(zea_mays)为例,Ensembl有专门的植物数据库,登录 Ensembl plant网站,在搜索框输入目标物种拉丁名——zea_mays:
在结果页面选择 downloads 选项:
在弹出的页面选择 FTP server:
在 FTP 页面依次选择 fasta、zea_mays、pep:
下载相应路径下的文件即可。
5. 其他
对于仅在特定的数据库或网站中才有蛋白库文件的物种,要根据相应数据库的具体要求下载 FASTA 文 件,并对下载文件进行检查。
蛋白质组学搜库数据下载就分享完了,除了本教程联川云平台还有很多小技能供学习哦~下载本教程请至云平台:http://www.lc-bio.cn/faq/sop_detail.php?id=83或直接点击文末左下角“阅读原文”下载~
云平台目前只针对联川客户开放,注册需用正确的合同号进行注册哦,有多个合同的填写任意一个合同号即可。暂不能体验的小伙伴也别着急,随着平台的优化,也会逐步对全员开发的~注册链接如下:
http://www.lc-bio.cn/index.html
也欢迎给位给我们的云平台留言、提建议
在大家的督促下,我们的云平台会越做越好
MEGA软件下载安装&序列处理&进化树绘制&Newick格式介绍
云课堂(8)|MetaboAnalyst使用教程-Enrichment Analysis模块
云课堂(9)|MetaboAnalyst使用教程-Pathway Analysis模块
云课堂(10) | MicrobiomeAnalyst在线绘图教程
云课堂(13) | 高通量测序数据NCBI GEO数据库上传指南
云课堂(17) | Cytoscape内插stringAPP完成PPI蛋白互作分析指南
Enrichment Analysis 模块 | 云课堂(18)