扩增子图表解读4曼哈顿图:差异OTU或Taxonomy
作者: 刘永鑫
日期:2017-6-30
阅读时长:10min
背景介绍(Introduction)
宏基因组学
宏基因组学目前的主要研究方法包括:16S/ITS/18S扩增子、宏基因组、宏转录组和代谢组,其中以扩增子研究最为广泛。
目的意义
本系列文章将带领大家结合较新的16S扩增子相关文献,来理解宏基因组16S扩增子文章中常用图表种类、图中包括的基本信息,以及作者想表达的结果。
主要内容
本系列文章内容包括:箱线图、散点图、热图、曼哈顿图、维恩图、三元图和网络图等。
学习思路
罗列知识点,熟悉专业名词,弄个脸熟,即使理解不深刻起码在阅读中不会有抵触情绪;
结合具体文章读图,实战两三次,基本就是专业人士了。
将来在大家可以很好理解相关文章图表的基础上,希望对分析、统计和绘图相关技术有进一步学习的小伙伴请积极回复并留言吧。如果本系统文章阅读过万,想学分析的留言过百。我还将详细讲解扩增子分析、统计和绘图各步骤的分析实例和源代码,希望大家多多鼓励和支持。
声明:文章的解读仅代表个人理解和观点,有不足处,请读者积极留言批评指正,互相学习,共同进步。
知识点(Method)
曼哈顿图 Manhattan Plot
曼哈顿图本质上是一个散点图,用于显示大量非零大范围波动数值,最早应用于全基因组关联分析(GWAS)研究展示高度相关位点。它得名源于样式与曼哈顿天际线相似(如下图)。
Manhattan plot is a type of scatter plot, usually used to display data with a large number of data-points - many of non-zero amplitude, and with a distribution of higher-magnitude values, for instance in genome-wide association studies (GWAS). It gains its name from the similarity of such a plot to the Manhattan skyline: a profile of skyscrapers towering above the lower level “buildings” which vary around a lower height.
近几年,在宏基因组领域,尤其是差异OTU结合分类学结果,采用Manhattan plot展示有非常好的效果,倍受推崇。
曼哈顿图优点
大数据中,即展示数据全貌,又能快速找到目标基因或OTU,同时可知目标的具体位置和分类、显著程度等信息。绝对高端大气,而且还有内涵。
数据坐标轴介绍
以上图GWAS研究结果为例:
X轴为染色体编号,且每个基因组SNP位点沿染色体序列排列;在16S扩增子或宏基因组中则为OTU按Taxonomy某一级别排序。
Y轴为该位点相关的统计显著性Pvalue值,由于pvalue值范围是从0-1,且越小越好,直接展示非常密集于0附近,很难区分。如何使越近0的显著数值变大,且而容易区分开,log10变换是非常好的方法,直接把关注的高显著性(Pvalue趋近零)值高位显示,远离整体,目标一目了然。
图中水平线一般为设定的不同显著性水平阈值,方便读出每个点的显著性水平;或只添加一条显示性阈值,高于则显著。
曼哈顿图绘制工具
散点图,自然还是R语言,ggplot2可以画的非常漂亮。
看图实战(Result)
示例1. 双曼哈顿图展示WT和mutant间差异富含OTU分布在那些菌目
Zgadzaj, R., et.al., 2016 .PNAS
这篇文章分析了百脉根根瘤的微生物组成,同时在根瘤缺失突变体条件下发现根和根际微生物组均有较大差异的变化。
图5.A/B 曼哈顿图展示野生型,突变体根相对于根际土显著差异的OTU类型
图中元素解释
X轴标签“OTU… respect to rhizosphere”表示:根际土壤作为背景对照,计算富集的OTU;
X轴OTU按分类学目水平(order)字母顺序排列显示,由于数量太多,不显示OTU编号标签反而更美观;
Y轴为-log10(Pvalue);将pvalue转换为越显著越大,便于观察;
主图区的每个圆点或圈代表1个OTU,大小代表其相对丰度;其中存在显著富集OTU的目中所有OTU用彩色实心圆点显示,并添加灰度背景,且该目的名称标注于图顶部;目中内无显著富集OTU的目为空心灰点,且背景为白色。
图表结果:两个曼哈顿图展示WT和mutant间差异富含OTU分布在那些菌目;而且与野生型相比,在突变体中许多显著富集的菌目消失;
经验和技巧:单曼哈顿图显示显著富集的OTU已经信息非常丰度;采用曼哈顿图展示两中组差异的OTU,让读者自己去比较差异,反而更突出结果的显著差别。分类学注释级别选择目,找到了一些差别的类,要保证这些类即不能太多,也不能太少,才便于传递给读者工作即全面、又细致的印像。
附图注原文:
Fig. 5. Manhattan plots showing root-enriched OTUs in WT (A) or in the mutants (B) with respect to rhizosphere and rhizosphere-enriched OTUs in WT (C) or in the mutants (D) with respect to root. OTUs that are significantly enriched (also with respect to soil) are depicted as full circles. The dashed line corresponds to the false discovery rate-corrected P value threshold of significance (α = 0.05). The color of each dot represents the different taxonomic affiliation of the OTUs (order level), and the size corresponds to their RAs in the respective samples [WT root samples (A), mutant root samples (B), WT rhizosphere samples (C), and mutant rhizosphere samples (D)]. Gray boxes are used to denote the different taxonomic groups (order level).
示例2
这是我自己画的一个样式,对上图的样式做了一些改进,展示一个基因敲除突变体(KO/mutant)与野生型(WT)细菌组的比较;
图中元素解释
X轴为OTU,按分类学门水平字母排序;
Y轴两组比较的Pvalue值,取loge(P),即自然对数转换;
图中点的大小代表该OTU的相对丰度,取log2(CPM)对数,即2的对数;CPM为count per million的缩写,和RPM类似,都是百万分数;
图中点颜色代表分类学门类型,便于从门水平找规律;
图中点的形状标注了其变化的类型,是上调enriched(正实心三角),还是下调depleted(倒空心三角),还是没有显著差异变化nosig(实心圆点);
图表结果:展示了KO突变体基因型相较WT有较明显的细菌组变化,尤其是放线菌门上调较多,变型菌门上调和下调都很多,但上调的更显著;
图表经验:从门水平先看整体规律,再一步步往纲、目、科、属去找规律的具体细节;用形状区分上调或下调,让结果更清楚。
Reference
https://en.wikipedia.org/wiki/Manhattan_plot
Zgadzaj, R., Garrido-Oter, R., Jensen, D.B., Koprivova, A., Schulze-Lefert, P. and Radutoiu, S., 2016. Root nodule symbiosis in Lotus japonicus drives the establishment of distinctive rhizosphere, root, and nodule bacterial communities. Proceedings of the National Academy of Sciences, 113(49), pp.E7996-E8005.
本系列其它文章
扩增子图表解读1箱线图:Alpha多样性,老板再也不操心的我文献阅读了
扩增子图表解读2散点图:组间整体差异分析(Beta多样性)
扩增子图表解读3热图:差异菌、OTU及功能
想了解更多宏基因组、16S分析相关文章,
快关注“宏基因组”公众号,干货第一时间推送。
系统学习生物信息,快关注“生信宝典”,
那里有几千志同道合的小伙伴一起学习。