查看原文
其他

推荐|TCGA数据下载工具

2017-07-14 生信人 弗雷赛斯

1、TCGA简介

美国政府发起的癌症和肿瘤基因图谱(Cancer Genome Atlas,TCGA)计划,试图通过应用基因组分析技术,特别是采用大规模的基因组测序,将人类全部癌症(近期目标为50种包括亚型在内的肿瘤)的基因组变异图谱绘制出来,并进行系统分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后可以勾画出整个新型“预防癌症的策略”。

TCGA 使命:提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力

TCGA 目标:完成一套完整的与所有癌症基因组改变相关的“图谱”。



TCGA数据源大部分都是公开的,如何有效的进行收集和预处理 是一个头疼 的问题。今天和大家介绍下下载数据的工具,其各有优缺点:

(1)直接去官网下载。这个具体参考其官网的操作文档就可以啦。

(2)cBioPortal


点击下载数据按钮之后,可以按照目前研究的癌症的类型和发表的年代进行选择,然后选择相应的数据类型,比对snp突变,拷贝数变异和表达谱数据等。

这个工具最好的地方在于 ,你可以选择你感兴趣的基因,然后点击submit提交,坐等下载就可以啦。当然这个工具还是支持一些在线分析的。

(3)ICGC


ICGC 可以在搜索框中直接搜索你感兴趣的癌型。然后回车,选择相应的数

据。

选择相应的数据,然后点击下载。

然后选择想要下载的数据类型。


然后坐等下载,就可以啦。

(4)TCGA-Assembler

可以使用TCGA-Assembler这软件去下载TCGA的数据http://www.compgenome.org/TCGA-Assembler/。TCGA-Assembler不但可以很方便的下载数据,还能对数据进行初始化处理,非常方便。下载完后,我们使用首先要安装一些依赖包。通过下面的命令:
install.packages(c("HGNChelper", "RCurl", "httr", "stringr", "digest", "bitops"), dependencies=T)

安装完了依赖包,我们进入刚才下载的TCGA-Assembler的目录,使用setwd(C:/Users/cloud/Desktop/TCGA-Assembler)设置TCGA-Assembler的目录为工作目录,接下来,我们就可以下载数据了。我们需要下载什么数据,就选择相应的脚本。具体代码见丁香网有具体的讲解

(5)GenePattern。小编没有具体用过,大家伙自己去尝试吧

这些工具使用起来还是有其局限性,都不能够轻易获取每个癌症类型的二维数据矩阵(例如基因为rows,样本为columns)。


参考资料:

http://www.cbioportal.org/public-portal/cgds_r.jsp

http://dcc.icgc.org/download/current

http://www.compgenome.org/TCGA-Assembler/ 

http://www.broadinstitute.org/cancer/software/genepattern/download/index

http://www.dxy.cn/bbs/topic/31315813

http://emuch.net/html/201403/7089959.html

生信人


生信人团队是国内最早专注生信技术服务的先驱,其具有丰富的数据挖掘能力和个性化定制经验;同时其“解决生信入门最后一公里”的理念和Freescience践行的科学自由理念一脉相承。

目前网络上有关生物信息学入门及进阶的有偿课程很多,鱼龙混杂,多有重复,非编程的不够用,涉及R语言等编程语言的,对“非专业的小伙伴”来说又是个头痛的事儿。

双方商定将进行深度合作,后续,生信人将自行开发免编程的生信可视化软件,独创“一个软件操作=N篇文章思路”的全新实例演示方法,结合线上、线下,为广大生信小白提供一系列完全免费绝对实用、实操性极强的生信技能。

Freescience精彩内容回顾(点击即达)


论文信号通路图,模式图,全搞定 | 谷歌不能上?有这个,一劳永逸 | 临床统计傻瓜式解决 | 外文写作润色神器 | 不花钱下载SCI全文黄金攻略! |  PubMed有哪些被你忽视的细节? | SCI文献管理之黄金攻略!| 卸载Visio—超赞的在线流程图制作工具 | 论文查重!关键是不要钱!| 神器!分分钟找到高质量的目标文献!|生存分析从理解到作图妥妥的 | 科研作图神器GraphPad |菜鸟写国自然-4:立项依据的写作 | 零基础不一样的实验protocol:开篇引言 | 引物设计?现成的随便拿啦!| 实验技能:小鼠尾静脉注射 | Western百败百战老学姐的心酸笔记|零基础Meta系列(十):一般套路(纯干货)一盏茶一篇meta(四)—SNP Meta,数据库寻找靶基因|网状meta分析(NMA)-第一卷基本技能 | 段子手韩春雨老师 | 不得不扒的女神--胡海岚 |扒一扒你所不知道的浙大PMCB团队(内嵌新春大红包!)实例讲解:基因数据库的利用(二)| 生物医学大数据解读和分析——构建生物网络实践


科研路,不孤单!^ ^

Freescience医学科研联盟全国火热招募ing

50家高校及医院的小伙伴已经加入啦,点这里

Bioart/Freescience科研沙龙,详情进入沙龙QQ群,点这里(进入后,扫底部二维码)

FS科研软件库,集合60+医学科研必备神器,现在统统打包分享点这里

有质、有趣的科研问答平台—研论(点此进入)

如何自动获取文献进展和内容速读

给小伙伴们提供一个展示的平台

 

科学自由共享

投稿请扔至:freescience@zju.edu.cn

未经许可 不得转载

长按二维码关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存