查看原文
其他

TCGA三级数据下载攻略

2017-08-29 Freescience联盟 生信草堂
freescience联盟 

由高校、医院FS公众号和科研技能公众号等百家单位联合创建的科研交流分享平台;联盟的宗旨:“公正至上,自由分享,平等共赢”。欢迎您的关注,让我们共同学习进步。戳这里Freescience联盟公众号原文,请多关注哦~

TCGA三级数据下载攻略

公共数据库挖掘

TCGA数据库并入GDC以后,以前的有些链接失效,导致很多战友不知道如何下载TCGA三级数据。有些战友怀疑老美故意借此机会坑害中国科研人员,其实是不可能的,仔细想想这个账划不来。我坚信有链接能够找到三级数据,花了两个小时,找到了链接,还发现这种方法比assembler下载更方便,能用上迅雷。网速可以得话,三个小时,能够下载所有的TCGA三级数据,结果就是这么任性!其实任何生物信息的网站使用都比较简单,大家耐心的多看看help,多摸索几次,还是很容易上手的。

    


点击 launch data portal



点击 Analysis



点击Broad Firehose


大家注意

这个页面中在firehose的上面一个按钮,可以进入熟悉的在线分析界面(cBioPortal)



这个界面可以清楚地看到数据版本是2016年1月28日;
在select cohort下面有很多分析内容,可以直接分析,但我没尝试过。在这一列的右边,我们可以看到很多肿瘤的相关数据,都是三级数据。我们选择宫颈癌为例(CESC)为例下载数据。

点击SELECT COHORT

这时候会出现很多肿瘤的下拉列表,在里面选择你想要的癌症类型(我们选择宫颈癌)。这时候,我们看到很多宫颈癌的数据,307例临床数据,295例SNP数据,还有甲基化,突变,miRseq,mRNAseq的数据等等。怎么下载了?


非常容易,想下载什么数据,就点击什么数据,例如我们下载临床数据,就点击clinical后面的深蓝色条条,弹出的窗口是


临床数据已经出来了,想下载那个,就选择哪个。我选择合并的数据。点击merge-clinical即可,记住右键点击可以迅雷下载!

我们选择mRNAseq数据下载,点击后面的红色条条,出来的结果是这样的:



结果就出来了,选择自己需要的哪一个就行了。这是我常用的数据类型
illuminahiseq_rnaseqv2-RSEM_genes  (MD5)
至于为什么这个数据类型,其实我不是很懂,我用assembler下载数据的时候,也是用的这个数据类型。这里面有原始数据,和归一化的数据。

FS数据挖掘主编

赵忻艺,将大数据应用于医学科研,主要包括临床医学数据的挖掘、收集、整理和利用(标准化和科学化的数据库),医学分子大数据的整理、利用及研究(基因、蛋白及代谢)。特别针对肿瘤个体化的基因测序和数据快速处理,寻找个体化的分子标志物、药物靶标和治疗方案。目前,已建立浙大大数据挖掘团队,旨在降低研究者学习大数据的门槛,推动大数据共享与研究协作,发表更高质量的研究成果,为科研决策提供精准的预测和实验证据。


生信草堂

将会与更多的优秀微信公众号合作,把最优秀的微信推文呈现给大家,希望可以帮助读者更多的了解生信技术,培养和提高读者的生信分析能力!

号外,号外,号外

你想和生信分析大神做好朋友么?

你想认识更多爱好生信分析的小伙伴么?

你想让自己的生信分析走上快车道么?

那就赶快加入我们的微信群吧:生信草堂交流群

或加我们的微信,请标注“加入生信草堂”,我们会把您拉入我们的社区:Edison686868;mly-1800




学术手拉手



 长按关注生信草堂

长按关注Freescience联盟



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存