查看原文
其他

R优雅的进行统计分析(2)自定义添加统计信息

ANERYAN R语言数据分析指南 2023-06-15


欢迎关注R语言数据分析指南

本节来介绍如何使用R语言来做统计分析,通过「rstatix」包进行统计检验,完全使用tidyverse体系进行数据清洗及可视化,使用add_pvalue,stat_pvalue_manual两个函数来自定义添加p值

近期系统整理了一下公众号所写过的一下经典文档,如果需要获取之前绘图文档数据的朋友欢迎加入小编的VIP交流群,「99元即可获取上百篇文档」的代码,公众号右下角添加微信咨询即可

加载R包

library(tidyverse)
library(rstatix)
library(ggprism)
library(ggpubr)
library(ggsci)

数据清洗

df <- ToothGrowth %>%
  mutate(dose=as.factor(dose)) %>% 
  group_by(dose) %>%
  summarise(value_mean=mean(len),sd=sd(len),se=sd(len)/sqrt(n()))

统计分析

此处通过联接原数据来定义位置信息

stat.test <- ToothGrowth %>% t_test(data =., len ~ dose, ref.group  =  "0.5") %>% 
  mutate(p.adj.signif = replace_na(p.adj.signif,""),across("p.adj.signif",str_replace,"ns","")) %>% 
  select(group1,group2,p.adj,p.adj.signif) %>% 
  left_join(.,df,by=c("group2"="dose")) %>% 
  mutate(y.position=value_mean+sd+0.3)

定义主题

theme_niwot <- function(){
  theme_minimal() +
    theme(axis.title.x = element_blank(),
          axis.line = element_line(color = "#3D4852"),
          axis.ticks = element_line(color = "#3D4852"),
          panel.grid.major.y = element_line(color = "#DAE1E7"),
          panel.grid.major.x = element_blank(),
          plot.margin = unit(rep(0.2,4),"cm"),
          axis.text = element_text(size = 12, color = "#22292F"),
          axis.title = element_text(size = 12, hjust = 1),
          axis.title.y = element_text(margin = margin(r = 12)),
          axis.text.y = element_text(margin = margin(r = 5)),
          axis.text.x = element_text(margin = margin(t = 5)),
          legend.position = "non")
}

数据可视化(1)

此次抛弃了上文通过geom_text()添加显著性标记的方法,改用add_pvalue进行

df %>% ggplot(.,aes(dose,value_mean))+
  geom_errorbar(aes(ymax = value_mean + sd, ymin = value_mean - sd),width = 0.1,color = "grey30")+
  geom_col(width=0.4,aes(fill=dose))+
  add_pvalue(stat.test,label = "p.adj.signif",label.size=6,
             coord.flip = TRUE, remove.bracket = TRUE)+
  scale_y_continuous(expand=c(0,0),limits = c(0,33)) +
  theme_niwot()+
  scale_fill_brewer(palette="Blues")

数据可视化(2)

  • 分开添加线条,使用tip.length并分别自定义线条长度
df %>% ggplot(.,aes(dose,value_mean))+
  geom_errorbar(aes(ymax = value_mean + sd, ymin = value_mean - sd),width = 0.1,color = "grey30")+
  geom_col(width=0.4,aes(fill=dose))+
  stat_pvalue_manual(stat.test %>% slice(1),label = "p.adj.signif",
                     label.size=6,tip.length = c(0.35,0.003),linetype=2)+
  add_pvalue(stat.test %>% slice(2),label = "p.adj.signif",label.size=6,tip.length = c(0.1,0.003))+
  scale_y_continuous(expand=c(0,0),limits = c(0,33)) +
  theme_niwot()+
  scale_fill_brewer(palette="Blues")

统计分析2

stat.test2 <- ToothGrowth %>% mutate(dose=as.factor(dose)) %>% group_by(dose) %>% 
  t_test(len ~ supp) %>%
  adjust_pvalue() %>% add_significance("p.adj") %>% add_xy_position(x="dose"

stat.test3 <- ToothGrowth %>% 
  t_test(len ~ dose,p.adjust.method = "bonferroni") %>%
  adjust_pvalue() %>% add_significance("p.adj") %>% add_xy_position() 

方差分析

res.aov <- ToothGrowth %>% mutate(dose=as.factor(dose)) %>% anova_test(len ~ dose)

方差分析事后检验

stat.test4 <- ToothGrowth %>% mutate(dose=as.factor(dose)) %>% tukey_hsd(len ~ dose) %>% 
  add_xy_position("dose"
ToothGrowth %>% mutate(dose=as.factor(dose)) %>% 
  ggplot(aes(dose,len))+
  stat_boxplot(geom = "errorbar",width=0.2,aes(fill = supp),position = position_dodge(1)) +
  geom_boxplot(aes(fill= supp),position = position_dodge(1))+
  stat_pvalue_manual(stat.test4,label = "p.adj.signif",label.size=6,hide.ns = T)+
  labs(subtitle = get_test_label(res.aov, detailed = TRUE))+
  scale_y_continuous(expand=c(0,0),limits = c(0,42))+
  theme_niwot()+
  scale_fill_jco()

数据可视化(3)

按不同分子分别对组内组间进行统计分析,并对整体进行方差分析;想对于add_pvalue而言stat_pvalue_manual的功能更加丰富,hide.ns = T移除不显著的信息

ToothGrowth %>% mutate(dose=as.factor(dose)) %>% 
  ggplot(aes(dose,len))+
  stat_boxplot(geom = "errorbar",width=0.2,aes(fill = supp),position = position_dodge(1)) +
  geom_boxplot(aes(fill= supp),position = position_dodge(1))+
  stat_pvalue_manual(stat.test2,label = "p.adj.signif",label.size=6,hide.ns = T)+
  stat_pvalue_manual(stat.test3,label = "p.adj.signif",label.size=6,hide.ns = T)+
  labs(subtitle = get_test_label(res.aov, detailed = TRUE))+
  scale_y_continuous(expand=c(0,0),limits = c(0,42))+
  theme_niwot()+
  scale_fill_jco()

本节介绍到此结束,喜欢的观众老爷们欢迎点赞转发,如果需要获取之前绘图文档数据及代码的欢迎加入小编的2022年VIP交流群,付费99元,群内会同步上传公众号文档代码;目前已上传2021-2022约150篇文档代码;添加小编微信时,请备注单位-方向-姓名以及来意以便高效处理

参考资料

https://rpkgs.datanovia.com/rstatix/index.html
https://www.datanovia.com/en/lessons/anova-in-r/

免费交流群

欢迎大家扫描下方二维码加入「QQ交流群」,与全国各地上千位小伙伴交流

关注下方公众号下回更新不迷路

往期推荐

ggraph优雅的绘制环状网络图
ggplot2绘制经典散点图
ggplot2绘制经典地图
ggplot2绘制云雨图
ggplot2可视化诺贝尔奖信息图
ggplot2绘制经典哑铃图
ggplot2绘制经典饼图
ggplot2绘制流图
ggplot2组合地图与网络图
ggplot2可视化全球C02排放量
circlize优雅的绘制基因组图
ggplot2优雅的绘制高端地图
ggplot2优雅的在地图上添加采样点信息
ggHoriPlot优雅的在ggplot2中构建地平线图
circlize优雅的绘制高端基因组图
ggplot2绘制CNS级气泡图
ggplot2绘制基因元件图
ggbump绘制精美地图
ggplot2优雅的绘制小清新版箱线图
ggplot2优雅的绘制哑铃图-增强版
ggplot2优雅的绘制配对箱线图
ggplot2优雅的绘制系统进化树
ggplot2绘制美美的花瓣图
ggplot2优雅的绘制网络图


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存