SPSS有话说:二元logistic回归
导 语
线性回归的因变量Y必须为连续变量,但当我们研究的因变量为分类变量时,因为不再是随机变量,不符合正态分布,因此不能采用线性回归,此时应该使用Logistic回归。
SPSS有话说
概述
Logistic回归分析也用于研究变量之间的影响关系,即X对Y的影响情况,此处涉及的Y是分类数据。结合Y的具体情况,Logistic回归分析可以分为三种,分别是二元Logistic回归、多元无序Logistic回归和多元有序Logistic回归。Logistic回归分析的分类情况如下图:
如果因变量Y仅有两个类别,分别是有无之类的分类数据,则属于二元Logistic回归分析。如果因变量Y有两个以上的类别,并且类别之间没有高低、顺序关系,比如血型“A型、B型、AB型和O型”,则可以使用多元无序Logistic回归分析。如果因变量Y的类别有两个以上的类别,并且类别之间有高低、顺序关系,如伤痛级别“轻度、中度、重度”,则可以使用多元有序Logistic回归分析
问卷研究中,二元Logistic回归使用频率最高,该方法简单易懂,多元无序Logistic回归和多元有序Logistic回归则相对复杂。本次仅对二元Logistic回归进行说明。
特别提示
在进行二元Logistic回归(包括其他Logistic回归)分析前,建议先通过单因素分析(t检验、卡方检验等)考察所有自变量与因变量之间的关系,筛掉一些可能无意义的变量,再进行多因素分析,这样可以保证结果更加可靠。同时为了防止一些有意义的自变量被单因素分析剔除,单因素分析时将检验水准设为P<0.1,只要小于0.1,就认为有意义,然后进行多因素分析。
操作步骤
问题:性别、学历、独生子女对去新疆就业意愿的影响?
性别:1=男,2=女;
学历:1=研究生,2=本科生;
独生子女:1=是,2=否;
就业意愿:1=愿意,0=不愿意。
(一)单击“分析” “回归” “二元logistic”
(二)选入相应的因变量和自变量,如图所示。
(三)单击“分类”,将各分类变量选入“分类协变量”框中,将参考类别选中“第一个”,单击“更改”。
注:在参考类别的右侧选择First(表示选择变量COPD中,赋值最小的,即“0”作为参照。如果选择Last则表示以赋值最大的作为参照)。
(四)单击“选项”,勾选“Hosmer-Lemeshow拟合度”和“exp”(OR值),继续。
结果解释
①该结果显示各变量的编码情况。
②模型系数的Omnibus检验表明该模型总体有意义,R平方值越接近1,回归模型拟合越好。
③“Hosmer-Lemeshow”检验,sig=0.443>0.05,即模型拟合优度较高。
④该结果显示,学历(P<0.01,OR=1.684)、独生子女(P=<0.01,OR=0.599)纳入模型中有统计学意义,性别(P>0.05)无统计学意义;常量,即截距,在模型中无实际意义。根据上述的结果,研究生的就业意愿是本科生的1.684倍,非独生子女的就业意愿是独生子女的1.669倍(1/0.599)。
特别提示
OR值的含义为:相对于赋值较低的研究对象,赋值较高的研究对象发生某种情况风险的多少倍。例如,男生吸烟发生的可能性是女生的1.292倍。对于连续型变量,如:年龄,即年龄每增加1岁,患鼻咽癌的风险增加OR倍。
所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。
往期回顾
SPSS有话说:李克特量表的变量属于顺序变量,为什么可以当作连续变量使用?
SPSS有话说:问卷或量表调查研究需要多少份或要求多大的样本量?
SPSS有话说:重要的事情说三遍!了解数据类型是进行统计分析的前提。
SPSS有话说:(分析方法选择)图(常用统计概念)词在手,统计你有
SPSS有话说:如何得出问卷或量表的结构或维度——探索性因素分析
SPSS有话说:探索性因素分析(EFA)与验证性因素分析(CFA)的区别
SPSS有话说:统计答疑解惑(4)SPSS有话说:统计答疑解惑(5)SPSS有话说:虚拟(哑)变量授人以鱼,不如授人以渔
给我一份数据,还你一个世界
明诚数据工作室
数据分析 | 远程教学 | 论文指导
统计咨询 | 课程开发 | 技术指导
温馨提示
数据分析服务:如有数据分析或一对一远程教学的需要,请添加微信2433657970(小明同学)进行咨询。
SPSS教学视频:请点击《常用统计分析方法与操作》视频课程 正式上线啦!
SPSS有话说QQ群:706175650,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。
加入我们:请点击 明诚数据工作室招贤纳士。
数据分析咨询:请点击首页下方“服务咨询”板块,获取咨询流程!