其他
不要再稀里糊涂的做回归了:如何设置哑变量
虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。
小编觉得是软件“太笨了”,无法识别无序分类变量的原因呢。
例如一个分组1,2,3,4,5如果不做哑变量,直接进入模型,例如值由1变为2,解释为变化一个单位所导致的因变量的改变,然而并不是这样,这本就是无序分类的,不存在等级的关系。
在SPSS的二元逻辑回归中,哑变量的设置,想必大家已经都知道了。如下图:
但是对于多元线性回归,并没有这个选项怎么办?
例如我们有这么一组数据,舒张压分为5组,分别1,2,3,4,5,如何进行哑变量
第一步:
第二步
第三步
依次类推,最后就形成下图这样的了,就设置好了哑变量。
顺便提一句,R语言可以一键搞定哦!
> y<-data.frame(id=c(1:10),group=c(1,1,1,2,3,3,3,4,4,5)) > y id group 1 1 1 2 2 1 3 3 1 4 4 2 5 5 3 6 6 3 7 7 3 8 8 4 9 9 4 10 10 5 但是需要“nnet”包中的class.ind函数> library(nnet)> class.ind(y$group)> class.ind(y$group) 1 2 3 4 5 [1,] 1 0 0 0 0 [2,] 1 0 0 0 0 [3,] 1 0 0 0 0 [4,] 0 1 0 0 0 [5,] 0 0 1 0 0 [6,] 0 0 1 0 0 [7,] 0 0 1 0 0 [8,] 0 0 0 1 0 [9,] 0 0 0 1 0 [10,] 0 0 0 0 1 ##就设置好了图文阅读是不是很乏味,赶快参加我们的初级临床科研培训班,绝对让你不枉此行。
详情点击下文链接
就是我,快点击:初级临床科研设计与方法培训班第二轮通知