零基础测序分析图表解读大全:老板再也不愁我的文献阅读了! 宏基因组扩增子(箱线,散点,热,曼哈顿,火山,韦恩,三元,网络)
点击上方蓝色「宏基因组」关注我们!专业干货每日推送!
写在前面 (Introduction)
很多刚接触高通量测序数据分析文章的学生,感觉图表丰富多样高大上,但根本看不懂,更谈何对文章的全面理解。
本系列文章以数据分析中常用的8种图为例,包括:箱线图、散点图、热图、曼哈顿图、火山图、维恩图、三元图和网络图等。通过结合具体实例来详细讲解,定能让你对此类文章理解更顺畅,读起来顺风顺水。
宏基因组学目前的主要研究方法包括:微生物培养组学、16S/ITS/18S扩增子、宏基因组、宏转录组、宏蛋白组和宏代谢组,其中以扩增子研究最为广泛。本系列文章将结合较新的16S扩增子相关文献,来理解宏基因组16S扩增子文章中常用图表种类、图中包括的基本信息,以及作者想表达的结果。由于方法原理相同,对其它类型测序数据结果的理解同样有帮助。
学习思路
罗列知识点,熟悉专业名词,弄个脸熟,即使理解不深刻起码在阅读中不会有抵触情绪;
结合具体文章读图,实战两三次,基本就是专业人士了。
这是本系列的第一季,接下来还会发布第二季,包括柱状图、拆线图、饼形图、树形图、圈图、气泡图、Mapping密度分布图等。
声明:文章的解读仅代表个人理解和观点,有不足处,请读者积极留言批评指正,互相学习,共同进步。
注:文为蓝色字均为文章链接,可点击直达
1箱线图:Alpha多样性
箱线图主要用于展示组间的数据分布比较,如基因、OTU、多样性等。本节主要学习箱线图绘制方法,箱体中所有点线的含义,同时以微生物Alpha多样性指数为例进行讲解。
2散点图:Beta多样性,PCoA, CCA
利用平面展示所有基因或样品,将复杂的关系具体化为坐标点,发现事物的主要矛盾。学习降维的思想,将大数据表转换样品低维的坐标,用距离来表示样品或组间差异。包括限制性CCA/CPCoA和非限制性主坐标轴分析PCA/PCoA的结果解读。
非限制性PCoA,展示样品间最大差异
限制性PCoA,也叫CCA,展示组间间最大差异
3热图:差异菌、OTU及功能
热图用于大数据表数据和关系的可视化展示,方便人快速阅读和发现规律。主要学习热图的基本知识、数据转换、常用工具、绘图教程,以及应用。包手基于表达或丰度数据计算样品间的相关系数,并采用热图展示及聚类;组间差异比较的基因或OTU用热图呈现。
热图展示所有样品相对丰度Pearson相关系数
展示差异基因/OTU的方法,Z-score水平标准化
4曼哈顿图:差异OTU或Taxonomy
曼哈顿图在GWAS研究中比较常用。主要介绍曼哈顿图的由来、优缺点、应用范围等。举实例讲解展示差异OTU所在的门、丰度、上下调关系;是我最推荐的展示差异OTU的方法。
5火山图:差异OTU数量及变化规律
介绍火山图的概念、主要展示类型、基本元素、绘制方法。看图实战展示差异基因/OTU变化数量和规律。
火山图展示差异OTU数量及变化规律
6韦恩图:比较组间共有和特有OTU或分类单元
介绍韦恩图的概念、绘制方法。看图实战展示组间共有和特有基因/OTU。
Venn图展示多组间共有和特有OTU/基因/分类单元
7三元图:三组比较特有或共有OTU
三元图的基本概念、传统应用、快速读法、基本规律、图中细节、优缺点、绘制工具等。
展示组特异或共有富集的OTU、丰度、数量等;美观大方,再怎么多用也不过分
8网络图:节点OTU或类Venn比较
网络图的制作工具、应用、实战,包括展示共丰度网络、多组间共有、特点的类韦恩图结果(但更高大上)。
微生物相关网络,主要用于查结点OTU,定义相关性较高的子网络模块。
更多网络图绘制,详见
微生物网络构建:MENA, LSA, SparCC和CoNet
相关Cytoscape可视化网络
新出炉的Cytoscape视频教程
Cytoscape之操作界面介绍
酷炫的网略图怎么绘制 - Cytoscape教程(一)
写在后面
优秀的作品都有三部分曲,如骇客帝国、教父、指环王等。
扩增子系列课程也分为三部曲:
第一部《扩增子图表解读》:就是本文中的内容,加速大家对同行文章的解读能力。
第二部《扩增子分析解读》:学习数据分析的基本思路和流程。
第三部《扩增子统计绘图》:即是对结果进行可视和统计检验,达到出版级的图表结果。
更多相关文章,请点击“宏基因组”文章目录阅读;
想了解更多16S扩增子、宏基因组文献和分析相关文章,快关注“宏基因组”公众号,干货每日推送