查看原文
其他

凌波微课|NCBI数据批量下载,你会了吗?

Young 凌波微课 2023-06-15


学生信,做分析,就上凌波微课



NCBI批量下载数据实操

经过分离、实验室纯化培养、基因组测序,小Young终于拿到了心心念念的菌株的基因组序列,迫不及待的要开展分析,呃……16S rRNA、功能基因进化树来一个,同源基因、共线性分析走起。哎,等等,这些分析都属于比较基因组分析,需要首先选择合适的参考物种基因组,可是一个一个查找下载太麻烦,有什么办法一键批量下载呢?

本期凌波微课为大家介绍两种数据批量查找和下载的方法,具体操作猛戳上方视频哦~

 

Batch Entrez简介


网址:https://www.ncbi.nlm.nih.gov/sites/batchentrez?
Batch Entrez是NCBI的一个检索系统,它提供了批量的ID检索,在小数据量的时候使用起来是非常方便的。这里可以通过ID检索NCBI下面的几乎所有的子数据库,包括Nucleotide、Protein、PubMed、Gene等。Batch Entrez下载时最好使用google浏览器。


Genome数据库简介


网址:https://www.ncbi.nlm.nih.gov/genome/

该数据库包含了NCBI目前收录的所有物种的基因组数据,Browse by Organism提供了通过物种拉丁文名称进行过滤检索物种信息,并给出了序列登录和FTP站点地址,适用于大批量的数据查找和下载。

更多精彩内容加入“凌波微课交流群”,满满的干货不容错过,独乐乐不如众乐乐哦~


 

 

注意事项
1.  Batch Entrez下载时最好使用google浏览器,准备的list文件使用excel表格编辑,填写基因组、蛋白质或者基因序列的登录号ID,保存为制表分隔符的文本文档如下:
2.  Batch Entrez下载时需要选择好检索的子数据库,例如NucleotideProteinGenomeGene,一次检索一类数据。
3.  Genome数据库通过物种拉丁文名称检索同源物种数据,得到登录号之后可以选择通过Batch Entrez批量下载;或者下载检索表格,将基因组ftp站点链接整理为一个list,通过linuxwget命令下载,示例命令如下:
  • 单个下载命令:
wget -c ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/004/214/875/GCF_004214875.1_ASM421487v1/*左右滑动查看


  • 批量下载命令:

wget -c -r -i list左右滑动查看



list文件示例如下:



往期精彩


1.凌波微课|Mauve共线性分析,你值得拥有!2.凌波微课|还不会序列比对?试试本地BLAST吧3.凌波微课|如何消除数据的批次效应?选对工具很重要4.凌波微课|SnapGene带你自定义绘制小基因组图谱5.凌波微课|CGView——给你一个定制化的基因组图谱!6.凌波微课|高颜值Seqlogo图,我也会做!7.凌波微课|一节课让你学会MEGA构建系统发育进化树并美化(二)8.凌波微课|一节课让你学会MEGA构建系统发育进化树并美化(一)‍



END







凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。

凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。


关注我

发现更多精彩

关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存