查看原文
其他

想要建立预测模型,统计方法怎么选?

李侗桐 医咖会 2021-01-15

作者:李侗桐;审稿:张耀文

是否要建立预测模型

预测模型是基于变量之间的相关关系,通过一个或几个变量预测另一个变量的分析方法。我们可以根据自变量(预测变量或解释变量)预测因变量(应答变量或结局变量)。比如,通过久坐时长预测受试者的血液胆固醇浓度,或者根据受试者的年龄、性别、BMI等变量信息预测高血压病发病情况。此外,预测模型还可以帮助我们判断各自变量的重要性,即自变量对因变量的解释能力。举例来说,预测模型可以用来分析学历对收入的解释程度。示例如下:


根据因变量类型选择检验方法

 1 连续变量


确定因变量是连续变量后,我们需要判断自变量的数量,示例如下:



1.1 只有一个自变量


简单线性回归该检验可以基于一个连续型自变量对相应的连续型因变量进行预测,也可以评价自变量对因变量的解释力度。


1.2 包含多个自变量


多重线性回归该检验可以通过多个自变量对相应的连续型因变量进行预测,也可以评价自变量对因变量的解释力度。


2 计数变量


泊松回归该检验适用于分析因变量是计数变量的多因素预测模型。

 

注:计数变量是一个非负整数。比如,0、5、16、27是计数变量,但是2.7、5.8、18.2不是,因为它们不是整数;-2、-7、-15也不是,因为它们小于0。


计数变量不属于我们常用的变量分类,常被视为连续变量纳入分析。当计数变量比较大,多数数值超过40时,我们可以将其作为连续变量。但是当计数变量比较小,如多数数值小于10时,我们建议保留其计数变量属性,避免统计偏倚。计数变量示例如下:


  • 菌群数量,培养基暴露24小时后可观察到的菌群数量

  • 死亡人数,队列中每年因吸烟死于肺癌的人数

  • 癫痫发作次数,受试者在一周内的癫痫发作次数

  • 就诊人数,某私人诊所每天上午9:00-9:30的就诊人数

 

3 有序分类变量


有序多分类logistic回归该检验适用于分析因变量是有序分类变量的多因素预测模型。比如,通过年龄和收入两个变量对生活满意度(非常不满意、不满意、一般、满意、非常满意)进行预测分析。


4 二分类变量


二分类logistic回归该检验适用于分析因变量是二分类变量的多因素预测模型。


5 无序分类变量


无序多分类logistic回归该检验适用于分析因变量是无序分类变量的多因素预测模型。


更多阅读

1.【合集】75篇SPSS统计操作教程,全在这里!

2. 超详细SPSS操作:多重线性回归(完整版)

3. SPSS操作:简单线性回归(史上最详尽的手把手教程)


由医咖会与心联乔治心脏健康研究中心(HHRC)联合建立的心血管研究协作网络及数据共享平台(CDS)已经上线!


目前开放共享的数据为“中国房颤注册研究”,共有2.5万多房颤数据,欢迎来申请使用数据,发表SCI论文!


平台网址:

https://cds.mediecogroup.com/


点击左下角“阅读原文”,看看医咖会既往推送了哪些统计教程。或者使用电脑打开网址:http://www.mediecogroup.com/,查看全部统计教程

快加小咖个人微信(xys2019ykh),拉你进统计讨论群和众多热爱研究的小伙伴们一起交流学习。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存