怎么在 UCSC 官网下载基因组和注释文件?
星星之火可以燎原
1、引言
高通量测序数据分析上游,一般需要下载相应的 基因组 和 注释文件 ,方便后续的 比对(mapping)
步骤,基因组主要用来 构建索引 文件,用于 fastq 数据的比对,注释文件主要用来对基因进行 定量 。
今天介绍一下如何从 怎么在 UCSC 官网下载基因组和注释文件? 官网下载自己物种的基因组和注释文件。
2、下载
首先进入 UCSC 官网:http://genome.ucsc.edu/ :
然后点击 Downloads — genome data :
然后就可以看到不同物种的链接:
我们选择相应物种进入,比如选择 人 ,进入后可以看到有不同版本的,如 hg38、hg19 等等,其中主要关注的是 第一个 ,第二个主要是分别每个染色体的 fasta 文件,点击星号标记的选项进入:
拉到最下面,红色标记的为我们下载的基因组文件,二选一即可,其它文件的具体区别上面有具体说明,大家可以去查看:
我们点击 genes
查看注释文件,有 4 种注释文件 ,具体区别可以看画横线的网址:https://genome.ucsc.edu/FAQ/FAQgenes.html#ensRefseq :
3、注释文件使用
不同数据库注释文件的差异:
Ensembl, GENCODE 和 RefSeq 之间的区别:
NCBI RefSeq 和 UCSC RefSeq 的区别:
4、记夏日的栖霞山
时代在变,人也在变。
欢迎加入生信交流群。加我微信我也拉你进 微信群聊 老俊俊生信交流群
哦。
群二维码:
老俊俊微信:
知识星球:
所以今天你学习了吗?
欢迎小伙伴留言评论!
今天的分享就到这里了,敬请期待下一篇!
最后欢迎大家分享转发,您的点赞是对我的鼓励和肯定!
如果觉得对您帮助很大,赏杯快乐水喝喝吧!
往期回顾
◀Ribo-seq 质控软件:ribosomeProfilingQC
◀...