UCSC XENA - 集大成者(TCGA, ICGC)
TCGA
有自己的一批工具,ICGC
也有自己的网站,但好的资源都是要整合起来,整合越多越好(虽然事实不一定如此,但有这个想法的人不少),用着才更方便。这就靠今天介绍的UCSC XENA
来实现了。
首先说下UCSC
,对于生物、医学的研究者来说,并不陌生,无论是这个学校还是这个网站。
数据分析所用的参考基因组序列、基因注释信息、重复序列信息、区域保守性信息、CpG岛信息都可在UCSC的FTP服务器或TableBrowser获取。当然也可以在ENSEMBLE,详细阅读 NGS基础 - 参考基因组和基因注释文件。
UCSC基因组浏览器是基因组测序数据可视化的一个标志性工作。漂亮的图形展示,PDF出图,便捷的在线操作,丰富的调控信息,繁多的公共数据集,特有的多样品Overlay展示等,都是其特色。也可以在本地安装UCSC基因组浏览器,用于测序数据可视化 (三) - UCSC genomebrowser。
然后就是隆重出场的UCSC Xena
了。
UCSC Xena
功能基因组浏览器是集分析、可视化、Galaxy与一体的新一代在线数据分析和可视化平台。现有91个队列的1098个公共数据集包括 TCGA, ICGC, TARGET, GTEx, CCLE等都进行了标准化处理。因此不同的数据集之间可以组合比较。
热图的方式可以进行单基因和多基因的表达、突变、拷贝数变异、样品属性的关联展示。
对任何展示的变量(不同表型病人的比较,不同基因表达的比较,突变有无的比较,甲基化水平的变化)都可以进行生存分析,绘制KM-plot,计算其对病人生存率的影响。
热图可以根据任一变量排序,然后查看其它变量的变化。如根据药物处理状态排序,查看基因的表达或修饰的变化。
另外 Xena 提供了ICGC Data Portal
的Chrome
扩展,可以在ICGC
的界面加入XENA的Heatmap
展示,不过没有测试成功。
这次测试Xena插件时,去ICGC的官网又看了下,网站又更新了。好在变化不是特别大,之前ICGC数据库的使用和TCGA数据库在线使用都还可以用。
数据库的使用主要靠自己去多操作,仔细读,多看文档,不要想着一下就可以找到想要的内容,尤其是刚接触时,就当看小说,多浏览几页,就知道都有什么了。在熟悉了几个基本操作,几种常见的数据类型和展示方式之后,数据库再怎么改版也一样操作了。
XENA
提供的这个视频对熟悉XENA
的使用提供了很多帮助,剩下的就看你要解决什么问题了。
https://v.qq.com/txp/iframe/player.html?vid=s0542655ca4&width=500&height=375&auto=0