查看原文
其他

扩增子统计绘图1箱线图:Alpha多样性

2017-08-21 刘永鑫 宏基因组

点击上方蓝色「宏基因组」关注我们!专业干货每日推送!

写在前面

优秀的作品都有三部分曲,如骇客帝国、教父、指环王等。

扩增子系列课程也分为三部曲:

第一部《扩增子图表解读》:加速大家对同行文章的解读能力。

第二部《扩增子分析解读》:学习数据分析的基本思路和流程。

第三部《扩增子统计绘图》:对结果进行可视和统计检验,达到出版级的图表结果。

《扩增子统计绘图》系列文章介绍

《扩增子统计绘图》是之前发布的《扩增子图表解读》和《扩增子分析解读》的进阶篇,是在大家可以看懂文献图表,并能开展标准扩增子分析的基础上,进行结果的统计与可视化。其章节设计与《扩增子图表解读》对应,为八节课八种常用图形(箱线图、散点图、热图、曼哈顿图、火山图、维恩图、三元图和网络图),基本满足文章常用的图片种类需求。

也适合对公司标准化分析返回结果的进一步统计、可视化及美化,达到出版级别,冲击高分文章。

本部分练习所需文件位于百度网盘,链接:http://pan.baidu.com/s/1hs1PXcw 密码:y33d。

绘制Alpha多样性线箱图

绘图和统计全部为R语言,建议复制代码,在Rstuido中运行,并设置工作目录为存储之前分析结果文件的result目录。

# 运行前,请在Rstudio中菜单栏选择“Session - Set work directory -- Choose directory”,弹窗选择之前分析目录中的result文件夹 # 安装相关软件包,如果末安装改为TRUE运行即可安装 if (FALSE){    source("https://bioconductor.org/biocLite.R")    biocLite(c("ggplot2")) } # 加载相关软件包 library("ggplot2") # load related packages # 读入实验设计和Alpha多样性值 design = read.table("design.txt", header=T, row.names= 1, sep="\t") alpha = read.table("alpha.txt", header=T, row.names= 1, sep="\t") # 以Observed OTU为例进行可视化和统计分析,其它指数将observed_otus替换为shannon, chao1, PD_whole_tree即可计算 # 合并Alpha指数与实验设计 index = cbind(alpha, design[match(rownames(alpha), rownames(design)), ]) # 绘图代码、预览、保存PDF p = ggplot(index, aes(x=genotype, y=observed_otus, color=genotype))+  geom_boxplot(alpha=1, outlier.size=0, size=0.7, width=0.5, fill="transparent") +    geom_jitter( position=position_jitter(0.17), size=1, alpha=0.7)+  labs(x="Groups", y="observed_otus index") p ggsave(paste("alpha_observed_otus.pdf", sep=""), p, width = 5, height = 3) # 统计组间是否显著差异 # anova对指数与分组统计 observed_otus_stats <- aov(observed_otus ~ genotype, data = index) # 使用TukeyHSD对组间进行检验,效正pvalue Tukey_HSD_observed_otus <- TukeyHSD(observed_otus_stats, ordered = FALSE, conf.level = 0.95) # 结果中提取需要的结果 Tukey_HSD_observed_otus_table <- as.data.frame(Tukey_HSD_observed_otus$genotype) # 预览结果 Tukey_HSD_observed_otus_table # 保存结果到文件,按Pvaule值由小到大排序 write.table(Tukey_HSD_observed_otus_table[order(Tukey_HSD_observed_otus_table$p, decreasing=FALSE), ], file="alpha_observed_otus_stats.txt",append = FALSE, quote = FALSE, sep="\t",eol = "\n", na = "NA", dec = ".", row.names = TRUE,col.names = TRUE)

Observed OTU多样性箱线图

详细的图片讲解,可参考1箱线图:Alpha多样性,老板再也不操心我的文献阅读  

各组间的统计结果如下:主要看最后一列p adj(Adjust P-value)是否显著,本文数据不显著

diff    lwr     upr     p adj OE-KO   -7.52380952380952       -24.480725165752        9.43310611813294        0.515429907536906 WT-KO   -6.11111111111111       -21.9728532782553       9.75063105603303        0.604309699204896 WT-OE   1.4126984126984 -15.5442172292441       18.3696140546409        0.976169656924344

其它箱线图绘制教程

推荐阅读并实际操作陈同博士写的文章:
R语言学习 - 箱线图(小提琴图、抖动图、区域散点图)
R语言学习 - 箱线图一步法

Reference

  1. http://mp.weixin.qq.com/s/5PkLAQ0yOxyGfl9MAH7veQ

  2. http://mp.weixin.qq.com/s/Zvmht0kOyOf02P8jQNjaOw

  3. http://mp.weixin.qq.com/s/8w6jV9MtJZ4h3ATaPP_Rsw

  4. http://mp.weixin.qq.com/s/MJWyUzeBZ7WJQhpAGX6Fgg

想了解更多宏基因组、16S分析相关文章,

快关注“宏基因组”公众号,干货第一时间推送。

系统学习生物信息,快关注“生信宝典”,

那里有几千志同道合的小伙伴一起学习。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存