查看原文
其他

不要再稀里糊涂的做回归了:如何设置哑变量

2017-09-12 江利冰 临床科研与meta分析

虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。

小编觉得是软件“太笨了”,无法识别无序分类变量的原因呢。

例如一个分组1,2,3,4,5如果不做哑变量,直接进入模型,例如值由1变为2,解释为变化一个单位所导致的因变量的改变,然而并不是这样,这本就是无序分类的,不存在等级的关系。

在SPSS的二元逻辑回归中,哑变量的设置,想必大家已经都知道了。如下图:




但是对于多元线性回归,并没有这个选项怎么办?


例如我们有这么一组数据,舒张压分为5组,分别1,2,3,4,5,如何进行哑变量



第一步:


第二步


第三步


依次类推,最后就形成下图这样的了,就设置好了哑变量。




顺便提一句,R语言可以一键搞定哦!

> y<-data.frame(id=c(1:10),group=c(1,1,1,2,3,3,3,4,4,5)) > y id group 1 1 1 2 2 1 3 3 1 4 4 2 5 5 3 6 6 3 7 7 3 8 8 4 9 9 4 10 10 5 但是需要“nnet”包中的class.ind函数> library(nnet)> class.ind(y$group)> class.ind(y$group) 1 2 3 4 5 [1,] 1 0 0 0 0 [2,] 1 0 0 0 0 [3,] 1 0 0 0 0 [4,] 0 1 0 0 0 [5,] 0 0 1 0 0 [6,] 0 0 1 0 0 [7,] 0 0 1 0 0 [8,] 0 0 0 1 0 [9,] 0 0 0 1 0 [10,] 0 0 0 0 1 ##就设置好了


图文阅读是不是很乏味,赶快参加我们的初级临床科研培训班,绝对让你不枉此行。

详情点击下文链接

就是我,快点击:初级临床科研设计与方法培训班第二轮通知


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存