R语言和医学统计学系列(9):多重检验
前言
这是R语言和医学统计学的第9篇内容。
第1篇请见:R语言和医学统计学系列(1):t检验
第2篇请见:R语言和医学统计学系列(2):方差分析
第3篇请见:R语言和医学统计学系列(3):卡方检验
第4篇请见:R语言和医学统计学系列(4):秩和检验
第5篇请见:R语言和医学统计学系列(5):多因素方差分析
第6篇请见:R语言和医学统计学系列(6):重复测量方差分析
第7篇请见:R语言和医学统计学系列(7):多元线性回归
第8篇请见:R语言和医学统计学系列(8):logistic回归
主要是用R语言复现课本中的例子。我使用的课本是孙振球主编的《医学统计学》第4版,封面如下:
多个样本均数间的多重比较
使用课本例4-2的数据。
首先是构造数据,本次数据自己从书上摘录。。
trt<-c(rep("group1",30),rep("group2",30),rep("group3",30),rep("group4",30))
weight<-c(3.53,4.59,4.34,2.66,3.59,3.13,3.30,4.04,3.53,3.56,3.85,4.07,1.37,
3.93,2.33,2.98,4.00,3.55,2.64,2.56,3.50,3.25,2.96,4.30,3.52,3.93,
4.19,2.96,4.16,2.59,2.42,3.36,4.32,2.34,2.68,2.95,2.36,2.56,2.52,
2.27,2.98,3.72,2.65,2.22,2.90,1.98,2.63,2.86,2.93,2.17,2.72,1.56,
3.11,1.81,1.77,2.80,3.57,2.97,4.02,2.31,2.86,2.28,2.39,2.28,2.48,
2.28,3.48,2.42,2.41,2.66,3.29,2.70,2.66,3.68,2.65,2.66,2.32,2.61,
3.64,2.58,3.65,3.21,2.23,2.32,2.68,3.04,2.81,3.02,1.97,1.68,0.89,
1.06,1.08,1.27,1.63,1.89,1.31,2.51,1.88,1.41,3.19,1.92,0.94,2.11,
2.81,1.98,1.74,2.16,3.37,2.97,1.69,1.19,2.17,2.28,1.72,2.47,1.02,
2.52,2.10,3.71)
data1<-data.frame(trt,weight)
data1$trt <- factor(data1$trt)
str(data1)
## 'data.frame': 120 obs. of 2 variables:
## $ trt : Factor w/ 4 levels "group1","group2",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ weight: num 3.53 4.59 4.34 2.66 3.59 3.13 3.3 4.04 3.53 3.56 ...
数据一共两列,第一列是分组(一共四组),第二列是低密度脂蛋白测量值
进行完全随机设计资料的方差分析:
fit <- aov(weight ~ trt, data = data1)
summary(fit)
## Df Sum Sq Mean Sq F value Pr(>F)
## trt 3 32.16 10.719 24.88 1.67e-12 ***
## Residuals 116 49.97 0.431
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
LSD-t检验
library(agricolae)
res <- LSD.test(fit, "trt", p.adj = "none") # LSD-t检验
res
## $statistics
## MSerror Df Mean CV t.value LSD
## 0.4307502 116 2.7025 24.2855 1.980626 0.3356368
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none trt 4 0.05
##
## $means
## weight std r LCL UCL Min Max Q25 Q50 Q75
## group1 3.430333 0.7151247 30 3.193002 3.667664 1.37 4.59 2.9650 3.530 3.9825
## group2 2.715333 0.6381586 30 2.478002 2.952664 1.56 4.32 2.3175 2.665 2.9650
## group3 2.698000 0.4971671 30 2.460669 2.935331 1.68 3.68 2.3375 2.655 2.9800
## group4 1.966333 0.7464421 30 1.729002 2.203664 0.89 3.71 1.3350 1.905 2.4225
##
## $comparison
## NULL
##
## $groups
## weight groups
## group1 3.430333 a
## group2 2.715333 b
## group3 2.698000 b
## group4 1.966333 c
##
## attr(,"class")
## [1] "group"
只看$groups
下面的输出,这个结果解读和SPSS差不多,后面标相同字母的是没有差异的。
所有group2
和group3
是没差别的,和另外两组有差别。
还可以可视化结果:
plot(res)
TukeyHSD
这里介绍一种TukeyHSD
方法:
TukeyHSD(fit) ### 每个组之间进行比较,多重比较
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = weight ~ trt, data = data1)
##
## $trt
## diff lwr upr p adj
## group2-group1 -0.71500000 -1.1567253 -0.2732747 0.0002825
## group3-group1 -0.73233333 -1.1740587 -0.2906080 0.0001909
## group4-group1 -1.46400000 -1.9057253 -1.0222747 0.0000000
## group3-group2 -0.01733333 -0.4590587 0.4243920 0.9996147
## group4-group2 -0.74900000 -1.1907253 -0.3072747 0.0001302
## group4-group3 -0.73166667 -1.1733920 -0.2899413 0.0001938
这个结果更直观,可以直接看到每个组之间的比较,后面给出了P值。
可视化结果:
plot(TukeyHSD(fit))
Dunnett-t检验
使用Dunnett-t
检验进行多重比较:
library(multcomp)
## 载入需要的程辑包:mvtnorm
## 载入需要的程辑包:survival
## 载入需要的程辑包:TH.data
## 载入需要的程辑包:MASS
##
## 载入程辑包:'TH.data'
## The following object is masked from 'package:MASS':
##
## geyser
res <- glht(fit, linfct = mcp(trt = "Dunnett"))
summary(res)
##
## Simultaneous Tests for General Linear Hypotheses
##
## Multiple Comparisons of Means: Dunnett Contrasts
##
##
## Fit: aov(formula = weight ~ trt, data = data1)
##
## Linear Hypotheses:
## Estimate Std. Error t value Pr(>|t|)
## group2 - group1 == 0 -0.7150 0.1695 -4.219 0.000148 ***
## group3 - group1 == 0 -0.7323 0.1695 -4.322 0.000115 ***
## group4 - group1 == 0 -1.4640 0.1695 -8.639 < 1e-04 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## (Adjusted p values reported -- single-step method)
结果也是非常明显,所有组和安慰剂组相比都有意义。
可视化结果:
plot(res)
SNK-q检验
还是使用agricolae
包。
library(agricolae)
res <- SNK.test(fit, "trt")
res
## $statistics
## MSerror Df Mean CV
## 0.4307502 116 2.7025 24.2855
##
## $parameters
## test name.t ntr alpha
## SNK trt 4 0.05
##
## $snk
## Table CriticalRange
## 2 2.801028 0.3356368
## 3 3.357590 0.4023275
## 4 3.686381 0.4417253
##
## $means
## weight std r Min Max Q25 Q50 Q75
## group1 3.430333 0.7151247 30 1.37 4.59 2.9650 3.530 3.9825
## group2 2.715333 0.6381586 30 1.56 4.32 2.3175 2.665 2.9650
## group3 2.698000 0.4971671 30 1.68 3.68 2.3375 2.655 2.9800
## group4 1.966333 0.7464421 30 0.89 3.71 1.3350 1.905 2.4225
##
## $comparison
## NULL
##
## $groups
## weight groups
## group1 3.430333 a
## group2 2.715333 b
## group3 2.698000 b
## group4 1.966333 c
##
## attr(,"class")
## [1] "group"
这个结果和LSD检验的结果解读一样,就不再赘述了!
可视化结果:
plot(res)
也是和LSD检验一样的!
以上就是今天的内容,希望对你有帮助哦!欢迎点赞、在看、关注、转发!
欢迎在评论区留言或直接添加我的微信!
往期精彩内容:
R语言缺失值插补之simputation包
R语言缺失值探索的强大R包:naniar
在VScode中使用R语言
R语言生信图表学习之网络图