查看原文
其他

这是数据更新最实时的TCGA网站,功能强大

陈同 生信宝典 2022-03-28

TCGA是研究肿瘤相关机制的重要资源。在线数据库更新改版都比较快,使用时需要参照最新的线上数据教程。不过癌症相关的数据库操作起来也都比较类似,输入一个或多个关注的目的基因,查看基因的功能注释,基因在哪些样品中存在突变,突变位点的分布,共表达网络,生存分析等。


本系列包括了TCGA本站中数据的浏览、下载,尤其是TCGA改版后的功能介绍(增加了OncoGrid展示),然后是cBioPortal,TCGA数据在线提供的分析类型最多的一个平台,再是FIREBROWSE,比较不错的在线展示和方便的数据下载功能。

TCGA主站

TCGA分析了11,000个病人的33种肿瘤的7个不同层面的数据,共获得2.5 PB数据。意在解析癌症发生的分子接触、肿瘤的亚型和治疗靶点等。TCGA网站主要提供的是数据的浏览和下载功能,可以根据项目、个体、数据类型、肿瘤类型等筛选需要的数据,使用TCGA提供的工具下载,进一步分析。TCGA项目促成了不少的高水平文章,对这些文章的阅读是对癌症知识的学习,也可以很好的扩展研究思路。如果你需要帮助,WIKI是最好的伙伴。最新版的TCGA增加了一些分析的功能,主要是展示基因的信息、突变频率、突变位点分布、OncoGrid信息等。

在搜索框搜索基因癌症类型个体编号会有不同的结果体验。查看基因在哪种癌症中突变最频繁突变位点在基因和功能域的分布,纵轴表示突变个体数目。基因每个位点的突变频率,为上图纵轴信息的表格展示。乳腺癌中突变频率最高的基因和病人生存曲线500个突变最多的个体和50个最高突变的基因,顶部柱状图代表每个个体中这50个基因的突变位点数目,右侧柱状图表示含有每个基因突变位点的个体数目,热图不同颜色代表不同的突变类型,下方2个颜色条代表临床信息和数据类型,右侧的第一个颜色条代表该基因是否是Cancer Gene Census (The Cancer Gene Census is a list of genes with substantial published evidence in Oncology.),第二个颜色条代表突变影响到的个体数。


(点点固然好,批量最是爽,

点击图片查看最近关于GEO TCGA数据挖掘的培训课程

R统计和作图


这么好玩的数据库,也搞一个吧,功在当代,利在千秋


更多阅读


画图三字经 生信视频 生信系列教程 

心得体会 TCGA数据库 Linux Python 

高通量分析 免费在线画图 测序历史 超级增强子

生信学习视频 PPT EXCEL 文章写作 ggplot2

海哥组学 可视化套路 基因组浏览器

色彩搭配 图形排版 互作网络

自学生信

后台回复“生信宝典福利第一波”获取教程合集

听说分享到朋友圈的朋友会在公众号周年庆时中奖 (大家还记得去年的大放送吧,不记得查查历史)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存