其他
R语言和医学统计学系列(12):双变量回归与相关
这是R语言和医学统计学的第12篇内容。
第1篇请见:R语言和医学统计学系列(1):t检验
第2篇请见:R语言和医学统计学系列(2):方差分析
第3篇请见:R语言和医学统计学系列(3):卡方检验
第4篇请见:R语言和医学统计学系列(4):秩和检验
第5篇请见:R语言和医学统计学系列(5):多因素方差分析
第6篇请见:R语言和医学统计学系列(6):重复测量方差分析
第7篇请见:R语言和医学统计学系列(7):多元线性回归
第8篇请见:R语言和医学统计学系列(8):logistic回归
第9篇请见:R语言和医学统计学系列(9):多重检验
第10篇请见:R语言和医学统计学系列(10):正态性和方差齐性检验
第11篇请见:R语言和医学统计学系列(11):球形检验
主要是用R语言复现课本中的例子。我使用的课本是孙振球主编的《医学统计学》第4版,封面如下:
今天主要是演示两变量相关的内容。
两样本相关
使用课本例9-5的数据。
df <- data.frame(
weight = c(43,74,51,58,50,65,54,57,67,69,80,48,38,85,54),
kv = c(217.22,316.18,231.11,220.96,254.70,293.84,263.28,271.73,263.46,276.53,341.15,261.00,213.20,315.12,252.08)
)
str(df)
## 'data.frame': 15 obs. of 2 variables:
## $ weight: num 43 74 51 58 50 65 54 57 67 69 ...
## $ kv : num 217 316 231 221 255 ...
两变量是否有关联?其方向和密切程度如何?
cor.test(~ weight + kv, data = df)
##
## Pearson's product-moment correlation
##
## data: weight and kv
## t = 6.5304, df = 13, p-value = 1.911e-05
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.6584522 0.9580540
## sample estimates:
## cor
## 0.8754315
从结果可以看出,两者是正相关,相关系数r = 0.8754,且p痔小于0.05,具有统计学意义!
可视化结果:
library(ggplot2)
ggplot(df, aes(weight, kv)) +
geom_point(size = 2) +
geom_smooth(method = "lm") +
theme_minimal()
## `geom_smooth()` using formula 'y ~ x'
相关性分析的过程比较简单,在选择方法时要注意是使用pearson相关还是秩相关。
以上就是今天的内容,希望对你有帮助哦!欢迎点赞、在看、关注、转发!
欢迎在评论区留言或直接添加我的微信!
往期精彩内容:
超详细的R语言热图之complexheatmap系列1
超详细的R语言热图之complexheatmap系列2
超详细的R语言热图之complexheatmap系列3
R语言生信图表学习之网络图