其他
autoReg包,自动输出整洁的回归模型结果
回归建模是论文中常见的统计方法,今天来学习一个R包——autoReg,使用这个R包可以快速输出回归模型的统计结果。
1. 安装和加载R包
可以从CRAN上安装R包。
install.packages("autoReg")
library(autoReg)
2.加载数据
使用survival包的colon数据集进行演示。
data(colon, package="survival")
colon
这个数据集收集了B/C 期结肠癌患者辅助化疗后的生存时间数据。
数据集中的变量解释:
id # 患者编号
study # 所有患者都是1
rx # 表示治疗方式,有三种:观察、Levamisole、Levamisole + 5-FU
sex # 性别,男性为1,女性为0
age # 年龄
obstruct # 肿瘤是否阻塞结肠,1 为有,0 为无
perfor # 结肠是否穿孔,1 为有,0 为无
adhere # 肿瘤是否粘附邻近器官,1 为有,0 为无
nodes # 检出淋巴结的数目
status # 生存状态,1 为发生感兴趣终点事件,0 为删失
differ # 肿瘤的分化程度(1=well, 2=moderate, 3=poor)
extent # 局部转移程度(1=submucosa, 2=muscle, 3=serosa, 4=contiguous structures)
surg # 从手术到登记注册的时间(0=short, 1=long)
node4 # 超过4 个阳性淋巴结
time # 直至发生感兴趣终点事件或删失的时间
etype # 事件类型: 1= 复发,2= 死亡
查看数据类型。
str(colon)
有些数字型变量其实是分类变量,需要先转换数据类型。
转换后构建新的数据集。
mycolon <- colon %>% # 创建新数据集新变量
transmute(time,
status,
Age = age,
Sex = factor(sex, levels = c(0, 1),
labels = c("Female", "Male")),
Obstruct = factor(colon$obstruct),
Differ = factor(colon$differ),
Extent = factor(colon$extent))
str(mycolon) # 查看数据集结构
3.构建逻辑回归模型
使用glm()函数构建逻辑回归模型,可以使用summary()函数输出模型的摘要信息。
fit <- glm(status ~ Age + Sex + Obstruct + Differ + Extent,
data=mycolon,
family="binomial")
summary(fit)
4. 自动输出整洁的回归模型结果
可以使用autoReg()函数自动将模型结果转化为表格。
autoReg(fit)
如上所示,自动输出了模型的描述统计结果、多因素建模以及P值结果,很方便。
也可以添加参数输出更多更详细的信息。
uni为TRUE指输出单因素模型结果;
multi为TRUE指输出多因素模型结果;
final为TRUE指输出逐步回归模型结果。
autoReg(fit, uni=TRUE, multi = TRUE, final=TRUE)
结果如上所示。
我们可以将上面的模型结果输出到本地文件里面,比如Excel。
result <- autoReg(fit,uni=TRUE, multi = TRUE, final=TRUE)
write.csv(result, "result.csv")
构建COX回归模型结果
可以使用coxph()函数构建模型。
fit <- coxph(Surv(time,status) ~ Age + Sex + Obstruct + Differ + Extent,
data=mycolon)
autoReg(fit)
同样也可以添加参数输出更多更详细的信息。
autoReg(fit,uni=TRUE, multi = TRUE, final=TRUE)
结果输出方法可以参考前面的。
点个在看,SCI马上发表。