查看原文
其他

GEPIA|神一样的TCGA可视化网站

生信宝典 生信宝典 2022-03-29
  • 作者:苑晓梅 协和

  • 编辑:生信宝典

GEPIA|神一样的TCGA可视化网站

TCGA肿瘤数据的分析网站有很多,但看见这个网站,我还是被激灵了一下!

可视化和生存分析做的如此漂亮,你简直是医学界一道光!(哈哈哈,原谅我这么直白,就是酱紫)

最关键的是,是我们中国人做的,be proud!

作为一名学医学到头鵚的我,仿佛看到了救星一般,没有课题,永远是我们的硬伤。。。

hahaha,下面我就开始以HER2为例,介绍一下GEPIA,全名应该叫Gene Expression Profiling Interactive Analysis (http://gepia.cancer-pku.cn/):

看,作者把Gene的别名和brief description都列了出来(这里面的部分是和Pubmed不一样的);而简介部分和Pubmed是一样的(告诉大家个秘密,其实Pubmed在索引方式方面叫做半自动手检,所以如果想要使自己检索的文献更为精确,可以使用Mesh词表进行检索,至于如何使用,百度有教程哒)。

右面的小红人和小绿人分别代表在肿瘤患者(红色)和正常人体(绿色)的表达分布,HER2在乳腺,食管和肺肿瘤中等均有表达;

然后这张图表示在不同的肿瘤和正常组织中基因的TPM表达量,我们发现BRCAHER2的显著高表达。

你是不是不知道BRCA是什么肿瘤? 在网站置顶区点击Click here 获得肿瘤缩写和全称的对应关系:


也可以有不同的展示方式,如barplot,都发现BRCA确实在HER2的表达中独占鳌头啊!

如果你只想要HER2在乳腺癌中的表达情况,我们可以通过Expression DIY窗口进入,将BRCA的数据集添加进去,就可以出图啦!

里面的|Log2FC| Cutoffp-Value Cutoff默认值设置为10.01,可以进行调整,结果已箱线图形式展示

小提琴图可以描述不同等级的乳腺癌中HER2的表达情况:

然后我们进行生存分析

发现HER2表达情况的高低对早期生存状况并没有太大影响,但在后期我们发现HER2表达高的肿瘤患者的生存率明显降低,但统计检验不显著。也许安表达量做一个三段式分组会更明显一些。

你以为这样就完了,并没有!!!

还可以找在乳腺癌中与HER2表达相似的gene,如下:

还可以做gene与gene之间的相关性分析,我以ERBB2ERBB2为例,俺就是喜欢试一试:(我们知道他们其实是同一个gene,其实我就是想检查一下会不会出现bug哒)

PCA功能我没有运行成功,大家可以试一试。

其实,设计人员已经更新了第二版,应该还是demo版本,需要进行进一步调试。

我想说

第一,不得不说,这确实是TCGA肿瘤可视化的一个神器,但前提是你要找到一个sigificant gene,我看到一些文章最多会用该可视化网站做部分gene的验证,当然,也看到了有人拿它发IF低的文章 2019最新影响因子

第二,我想说的是你找到的所谓的sigificant gene 虽然可能在各个方面都可能有提示意义,但他不一定可以作为biomarker使用,需要进行一些机制方面的湿实验的验证;

第三,该数据库结构如下(也许有代码)

Schema describing data processing and data display for the GEPIA visualization tool.

参考文献

Tang Z, Li C, Kang B, Gao G, Li C, Zhang Z. GEPIA: a web server for cancer and normal gene expression profiling and interactive analyses. Nucleic Acids Res.2017 Jul 3;45(W1):W98-W102. doi: 10.1093

生物信息分析离不开数据资源和数据库,生物信息学数据库分类概览 (第一版)系统梳理了常用功能数据库。


下面再分析2个NAR发表的新数据库,以飨读者。


中医药方剂的数据库,收录方剂、药材、靶点、疾病、通路等信息,

网站古色古香,设计精美,交互探索,网络大气,

高颜值是很好的敲门砖,

于2018年发表于NAR杂志。



表格展示太枯燥,关键信息交互式饼图展示,查看,点击筛选~~



现在数据库升级第二版,更多功能,更多展示 (网络图比下面这个更漂亮,更有生物意义,更有交互性,只是暂时还不能释放 o(╥﹏╥)o)。



另一个是`Prophage hunter`,在细菌基因组中寻找活性噬菌体。

页面极简,但设计精良,定制基因组浏览器交互,

于2019年发表于NAR杂志。



表格和基因组浏览器的双向控制



做的更多的还是分子数据的展示,如转录组相关数据的展示。

首先展示下首页,专业设计师私人定制,可以传统,可以现代;可以功能为主,也可以轮播酷炫。

  • 首页搜索框全局搜索,类似谷歌,输入基因名、通路名、功能关键词皆可搜索。

  • 小轮播展示网站可做的分析和结果展示,差异基因富集全套,还是交互式的。

  • 四个饼图联动展示数据库收录的样品和属性信息,高端大气显内涵。


那搜索一下,都展示哪些信息?

基因,别名,公共数据库链接,功能注释,表达分布,PPI网络,共表达网络,想放啥放啥!



一个基因嫌少,来绘制一组基因的表达谱,修饰谱;同时展示甲基化修饰与基因表达的关系。


图就不展示了,绝对心中所想!


搜索太简单了(其实功能很强大),可否更多条件搜索?


多组学如何展示?基因组浏览器可否嵌入?

基因组浏览器是多组学的展示利器,更多见:

ChIP类数据同时展示IPInput样品丰度 (这个双峰图可拆可合)和peak信息,见下图。

展示同源物种,也可以~



更多在线功能,样品聚类、筛选、差异基因(样品特异性基因)、功能富集 (一个小的云平台出来了)


更多交互式图,染色体图谱、饼图、箱线图、交互式表


数据库收录样本信息更多互动展示



这也是一个主页风格,随您定制。



更多地图展示


时间轴变化来一个



访问量统计页来一个 (这是高颜值可定制在线绘图工具-第三版的用户访问,总访问量近10万,给您做个友情链接,也能推广带动访问)


以上列出一部分,更多数据库还在建设中,发表后慢慢释放,更多展示和需求也等您提出。


如果您也有建设的需求,欢迎联系我们。



易生信系列培训课程,扫码获取免费资料

更多阅读

画图三字经 生信视频 生信系列教程 

心得体会 TCGA数据库 Linux Python 

高通量分析 免费在线画图 测序历史 超级增强子

生信学习视频 PPT EXCEL 文章写作 ggplot2

海哥组学 可视化套路 基因组浏览器

色彩搭配 图形排版 互作网络

自学生信 2019影响因子 GSEA 单细胞 

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存