其他
【1031】异常值的处理只有删除?
精鼎45/46期SPSS统计软件实战训练营(详情点击)
最好的投资是学习
其基本思想是对不同数据点给予不同的权重,残差小的点给予较大权重,残差大的点给予较小的权重,也就是异常点的权重较小,以此来减少异常点对模型的影响。关于稳健回归的估计方法有M估计、LTS(least trimmed squares)估计、S估计和MM估计。1、M估计是Huber于1973年提出,是目前处理异常点问题最常用的估计方法,但是该法在存在高杠杆点时估计效果不佳。2、LTS估计是有Rousseeuw于1984年提出,可用于处理高杠杆值问题。3、S估计由Rousseeuw和Yashi于1984年提出,该法具有比LTS估计更高的统计效率。4、MM估计由Yashi于1987年提出,是对S估计的进一步发展,它将M估计与LTS估计/S估计结合起来,综合上述方法的优点。
Proc robustreg <选项>;
Model 因变量=自变量</选项>;
RUN;
1本篇作者,精鼎秦老师
松哥:异常点的处理经常困扰大家。本期浅浅而谈,给大家介绍了一种更加科学、保留更多数据信息的稳健回归方法,让大家对其有个印象。若今后再遇到异常值处理的情况,至少能够想到有该种方法,而不仅仅是删除异常点。统计思路很重要哦。
精鼎原创,欢迎转发,未经允许,谢绝转载!
统计思维与统计理论系列[1]
【1030】没有比较就没有伤害,让咱们互相伤害吧,教你4大类统计伤害方法
【1019】方差分析P>0.05,两两比较LSD法P<0.05,这可咋整?
【1018】倾向性评分后数据,应该采用配对设计还是成组设计?
【1003】连续变量变成等级变量后,原来有意义的变量变得没意义了?
【1001】SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢
-------------------------------------------