GEPIA|神一样的TCGA可视化网站
作者:苑晓梅 协和
编辑:生信宝典
GEPIA|神一样的TCGA可视化网站
TCGA肿瘤数据的分析网站有很多,但看见这个网站,我还是被激灵了一下!
把可视化和生存分析做的如此漂亮,你简直是医学界一道光!(哈哈哈,原谅我这么直白,就是酱紫)
最关键的是,是我们中国人做的,be proud!
作为一名学医学到头鵚的我,仿佛看到了救星一般,没有课题,永远是我们的硬伤。。。
hahaha,下面我就开始以HER2
为例,介绍一下GEPIA,全名应该叫Gene Expression Profiling Interactive Analysis (http://gepia.cancer-pku.cn/):
看,作者把Gene
的别名和brief description
都列了出来(这里面的部分是和Pubmed不一样的);而简介部分和Pubmed是一样的(告诉大家个秘密,其实Pubmed在索引方式方面叫做半自动手检,所以如果想要使自己检索的文献更为精确,可以使用Mesh词表
进行检索,至于如何使用,百度有教程哒)。
右面的小红人和小绿人分别代表在肿瘤患者(红色)和正常人体(绿色)的表达分布,HER2
在乳腺,食管和肺肿瘤中等均有表达;
然后这张图表示在不同的肿瘤和正常组织中基因的TPM
表达量,我们发现BRCA
中HER2
的显著高表达。
你是不是不知道BRCA
是什么肿瘤? 在网站置顶区点击Click here 获得肿瘤缩写和全称的对应关系:
也可以有不同的展示方式,如barplot
,都发现BRCA
确实在HER2
的表达中独占鳌头啊!
如果你只想要HER2
在乳腺癌中的表达情况,我们可以通过Expression DIY窗口进入,将BRCA
的数据集添加进去,就可以出图啦!
里面的|Log2FC| Cutoff
和p-Value Cutoff
默认值设置为1
和0.01
,可以进行调整,结果已箱线图形式展示:
小提琴图可以描述不同等级的乳腺癌中HER2的表达情况:
然后我们进行生存分析:
发现HER2
表达情况的高低对早期生存状况并没有太大影响,但在后期我们发现HER2
表达高的肿瘤患者的生存率明显降低,但统计检验不显著。也许安表达量做一个三段式分组会更明显一些。
你以为这样就完了,并没有!!!
还可以找在乳腺癌中与HER2
表达相似的gene
,如下:
还可以做gene与gene之间的相关性分析,我以ERBB2
和ERBB2
为例,俺就是喜欢试一试:(我们知道他们其实是同一个gene,其实我就是想检查一下会不会出现bug哒)
PCA功能我没有运行成功,大家可以试一试。
其实,设计人员已经更新了第二版,应该还是demo版本,需要进行进一步调试。
我想说
第一,不得不说,这确实是TCGA
肿瘤可视化的一个神器,但前提是你要找到一个sigificant gene
,我看到一些文章最多会用该可视化网站做部分gene的验证,当然,也看到了有人拿它发IF低
的文章 2019最新影响因子。
第二,我想说的是你找到的所谓的sigificant gene
虽然可能在各个方面都可能有提示意义,但他不一定可以作为biomarker
使用,需要进行一些机制方面的湿实验的验证;
第三,该数据库结构如下(也许有代码)
Schema describing data processing and data display for the GEPIA visualization tool.
参考文献
Tang Z, Li C, Kang B, Gao G, Li C, Zhang Z. GEPIA: a web server for cancer and normal gene expression profiling and interactive analyses. Nucleic Acids Res.2017 Jul 3;45(W1):W98-W102. doi: 10.1093
生物信息分析离不开数据资源和数据库,生物信息学数据库分类概览 (第一版)系统梳理了常用功能数据库。
下面再分析2个NAR发表的新数据库,以飨读者。
中医药方剂的数据库,收录方剂、药材、靶点、疾病、通路等信息,
网站古色古香,设计精美,交互探索,网络大气,
高颜值是很好的敲门砖,
于2018年发表于NAR杂志。
表格展示太枯燥,关键信息交互式饼图展示,查看,点击筛选~~
现在数据库升级第二版,更多功能,更多展示 (网络图比下面这个更漂亮,更有生物意义,更有交互性,只是暂时还不能释放 o(╥﹏╥)o)。
另一个是`Prophage hunter`,在细菌基因组中寻找活性噬菌体。
页面极简,但设计精良,定制基因组浏览器交互,
于2019年发表于NAR杂志。
表格和基因组浏览器的双向控制
做的更多的还是分子数据的展示,如转录组相关数据的展示。
首先展示下首页,专业设计师私人定制,可以传统,可以现代;可以功能为主,也可以轮播酷炫。
首页搜索框全局搜索,类似谷歌,输入基因名、通路名、功能关键词皆可搜索。
小轮播展示网站可做的分析和结果展示,差异基因富集全套,还是交互式的。
四个饼图联动展示数据库收录的样品和属性信息,高端大气显内涵。
那搜索一下,都展示哪些信息?
基因,别名,公共数据库链接,功能注释,表达分布,PPI网络,共表达网络,想放啥放啥!
一个基因嫌少,来绘制一组基因的表达谱,修饰谱;同时展示甲基化修饰与基因表达的关系。
图就不展示了,绝对心中所想!
搜索太简单了(其实功能很强大),可否更多条件搜索?
多组学如何展示?基因组浏览器可否嵌入?
基因组浏览器是多组学的展示利器,更多见:
ChIP类数据同时展示IP
, Input
样品丰度 (这个双峰图可拆可合)和peak
信息,见下图。
展示同源物种,也可以~
更多在线功能,样品聚类、筛选、差异基因(样品特异性基因)、功能富集 (一个小的云平台出来了)
更多交互式图,染色体图谱、饼图、箱线图、交互式表
数据库收录样本信息更多互动展示
这也是一个主页风格,随您定制。
更多地图展示
时间轴变化来一个
访问量统计页来一个 (这是高颜值可定制在线绘图工具-第三版的用户访问,总访问量近10万,给您做个友情链接,也能推广带动访问)
以上列出一部分,更多数据库还在建设中,发表后慢慢释放,更多展示和需求也等您提出。
如果您也有建设的需求,欢迎联系我们。
易生信系列培训课程,扫码获取免费资料
更多阅读
后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集