这个分析可以提升转录组逼格,联川即将更新(文末有彩蛋) | 转录调控专题
通常转录组测序中常用的数据库及注释分析包Gene Ontology、KEGG Pathway等。研究基础医学和生物化学的老师可能还会用到GSEA分析。
所以GO、KEGG、GSEA被称为转录组基因注释和富集分析的三板斧。
但是我们也知道,事实上KEGG虽然有免费的在线网页信息可查询,可毕竟有些功能也是需要收费的。
那么假如没有钱购买更多的KEGG通路注释信息该怎么办呢?
今天在这边就给大家推荐另一款非常强大的信号通路数据库,名为Reactome(https://reactome.org/)。这个数据库以及对应的功能非常强大,而且是开源免费的。一些知道Reactome的小伙伴,可能已经使用了里面的精美通路插图。但是这个插图只能说非常小的一个附带功能,更加强大的是在于这是一款非常重要的可视化生信工具。
Reactome既有可视化的在线操作界面,也有线下的数据库可供使用。功能包括通路互作可视化,在线分析工具(包括基因表达、通路合并等),肿瘤等其他疾病通路注释以及线下数据库信息归档等。
该数据库覆盖了19个常规物种的通路研究,一些我们在KEGG中常见的经典代谢通路、基因上下游调控等都被一一收录在其中。其中人类的通路数据已更新到2553条之多,互作信息及蛋白信息已更新到上万条。此外小分子注释、药物注释以及权威的参考文献信息在该数据库依旧在不断更新中。目前数据库最新版本已更新至2022年2月。
物种信息 | 蛋白 | 蛋白复合物 | 生化反应数 | 信号通路 |
智人 | 10763 | 11674 | 11896 | 2222 |
小鼠 | 12769 | 9560 | 8331 | 1620 |
大鼠 | 11754 | 8682 | 7498 | 1606 |
斑马鱼 | 14261 | 7362 | 6286 | 1561 |
黑腹果蝇 | 9959 | 4806 | 4023 | 1391 |
拟南芥 | 6522 | 1901 | 1729 | 790 |
秀丽隐杆线虫 | 5088 | 3360 | 2829 | 1137 |
盘基网柄菌 | 2174 | 1932 | 1766 | 848 |
疟原虫 | 772 | 731 | 613 | 470 |
裂变酵母菌 | 1465 | 1473 | 1230 | 673 |
酿酒酵母菌 | 1652 | 2160 | 1878 | 834 |
家猪 | 18418 | 8405 | 7335 | 1602 |
牛 | 9905 | 8492 | 7363 | 1606 |
狗 | 11153 | 8225 | 7093 | 1599 |
鸡 | 12305 | 7462 | 6420 | 1631 |
非洲爪蟾 | 9363 | 7434 | 6390 | 1562 |
水稻 | 13433 | 1835 | 1677 | 786 |
结核杆菌 | 13 | 47 | 39 | 12 |
以上为Reactome数据中已更新的物种对应的注释信息,包括蛋白、通路和反应数等。
线下注释版本即将加入联川生物转录组标准分析流程中。这边我们先来介绍下Reactome在线版本一些简单的功能。
首先我们点击首页的Analysis Tools功能后,即可对自己手上的数据进行在线分析。
然后在分析一栏可填入基因ID或表达谱信息,前期我们先使用示例文件中的基因表达谱信息的信息。
我们点击Analyse!尽量把2个选项都勾上,代表物种为人以及包含这种互作关系等。
这个时候,我们从左侧的panel面板中可以看到FDR值非常小的通路大类进入了我们眼帘。右下角就是对应的通路的富集分析,还可以下载csv等表格格式进行离线查询。
我们选择其中一个和发育生物学相关的通路点进去会发现,这个通路图的美观程度远远大于KEGG,可谓颜值满满。点击任意基因后随之在下方的基因在各个样本的表达量信息也会显示出来。
此外,还有诸多常规的信号通路展示,颜值也是远超KEGG。
由于Reactome的功能过于强大,还有诸多好货并未做展示,有待小伙伴自己去慢慢挖掘。
那么接下来联川在Reactome本地化这块做了哪些工作呢?
首先这些数据库很多信息是需要手动整理的,目前联川的生信工程师正在加班加班,争取把所有物种信息全部整理好后整合到我们的转录组标准分析流程中。据说人、小鼠、大鼠等已经整理完毕,斑马鱼、水稻、拟南芥等物种正在路上。
可能小伙伴会问了,为何还要手动整理呢?事实上这些数据库中的ID信息并未做完全的匹配,数据库的基因ID来源数据库非常繁杂,包括NCBI、Ensembl、JGI、COSMIC等具有涉及,需要对这些多种数据库信息进行整合清洗。
我们先来简单看下部分结果展示吧。
首先这是大鼠转录组数据中的基因对应注释信息,我们可以看到KEGG部分所在的F列并未有注释信息,而K列所在的Reactome却全部有对应注释。
在与GSEA分析进行整合后,我们对富集程度最高的TOP30的注释进行排序,根据NES值来锁定这些关键注释,更加有助于我们后期研究的开展。
此外联川转录组分析中还在本地集成了PPI和Cytoscape插件,自动整合蛋白互作分析网络图绘制。
更多的功能敬请期待,如果感兴趣的话,欢迎大家前来联川生物体验最新的转录组分析服务。目前只对已搜集的19种模式生物开放,后续会根据数据库注释情况进行持续更新添加。
当你还苦于不好绘制通路图时候,事实上Reactome还有一个隐藏技能,那就是生物通路的卡通绘制模型图无损版本下载。各种细胞器、蛋白、代谢物等一应俱全。
前往Community的Icon Library一栏,点击前往。你会发现各种各样的元素一应俱全!
我们点击进去细胞一栏,选择DC树突状细胞。
除了可下载SVG等无损格式外,还对DC细胞所对应在Pathway浏览器中的位置,以及参考文献等都进行了详细的罗列。当下载SVG格式后,可采用Adobe Illustrator等软件进行编辑,即可加入自己论文的通路中,为你的论文加分!
看完是不是还不过瘾?
这篇推送的内容已经被收录到转录调控工具书中啦
新书将会在五一后和大家见面~
敬请关注哦!
相关阅读
基础篇:5000字带你了解lncRNA测序 | 转录调控专题
点击下方图片进入云平台资料汇总:
所见即所得,绘图高规格
联川云平台,让科研更自由