查看原文
其他

多重共线性产生的4个原因+7个诊断方法+7个修正方法

2016-06-22 计量经济学服务中心

  计量经济学服务中心,科研好助手,关注知识,发现价值!见证学术力量,专注于软件操作、论文指导、数据分析及服务等,因为专注,所以专业!打造最大最好的经管社科类学术交流平台!


                                                                                                                                           


多重共线性产生的原因

产生多重相关性的原因主要包括四方面:

①趋同性:经济变量随时间的变化过程存在共同变化趋势;

②用截面数据建模;

③模型中大量地采用滞后变量;

④建模时由于认识的局限性导致变量选择不当。

 

经验式的诊断方法

通过观察,得到一些多重相关性严重存在的迹象。

①在自变量的简单相关系数矩阵中,有某些自变量的相关系数值较大

②回归系数的代数符号与专业知识或一般经验相反;或者该自变量与因变量的简单相关系数符号相反

③对重要自变量的回归系数进行t检验,其结果不显著。特别是当F检验能在高精度下通过,测定系数R2的值也很大,但自变量的t检验却全都不显著,这时多重相关性的可能将会很大。

④如果增加或删除一个变量,或者增加或删除一个观测值,回归系数发生了明显的变化。

⑤重要自变量的回归系数置信区别明显过大。

⑥在自变量中,某一个自变量是另一部分自变量的完全或近似完全的线性组合。

⑦对于一般的观测数据,如果样本点的个数过少,比如接近于变量的个数或者少于变量的个数,样本数据中的多重相关性就会经常存在。

 

统计检验方法

方差膨胀因子VIF是指回归系数的估计量由于自变量的共线性使其方差增加的一个相对度量。

 

消除多重共线性的方法

(1)真实的要素不可替代还是虚假的要素不可替代

在实际的经济计量过程中,多重共线性和要素之间的替代关系的经济学命题之间并不是严格对称的。我们可以说,只要要素之间同比例变动,经济计量模型中,就会出现多重共线性,但是反论则不一定成立。因为实际经济计量中影响多重共线性的原因很多。以生产函数为例,L和K高度线性相关可能存在于时间序列的模型中,因为L、K的变动均表现在时间上的连续性。因此尽管实际生活中二者有显著的替代关系,但在统计数据上因二者均随时间变化,故显示出很高的线性关系。多重共线性也可能存在于截面数据模型之中,因在现实中,企业资本量和劳动者数量与企业规模之间存在着确定关系,使得截面模型中的劳动和资本的统计数据也可能高度相关,甚至接近完全相关。在上述两种情况下,虽均存在着高度的多重共线性,但实际中要素之间却是可以相互替代的。从经济学意义上讲,’要素之间不可替代或是成固定比例替代都不是常态。因此,在经济定量分析中,对于第二种多重共线性情况,应首先寻找统计数据生成的因素并予以消除。

 

(2)增加经济变量的样本容量

当增加样本容量时,有可能改变某些经济变量的变化趋势,从而消除经济变量间的多重共线性。

 

(3)合并截面和时间序列数据

合并的方法是:由截面数据求出模型中一个或更多的系数估计值,’再从被解释变量中减去含有这些估计值的参数项,然后用它们的差作被解释变量,以时间序列的样本估计保留系

数的估计值。

 

(4)去掉某些对被解释变量影响不大的解释变量用逐步回归法

逐步回归法的基本思路是:首先将Y对其中一个解释变量回归,然后逐个加入其它解释变量,并将对被解释变量影响不大的解释变量筛选掉。或首先将Y对所有解释变量回归,然后筛选掉对被解释变量影响不大的解释变量。

 

逐步回归分析方法是综合了逐步剔除法和逐步引入法的特点产生的方法。其基本原理为:从一个自变量出发, 视自变量对因变量的影响显著性大小, 从大到小引入回归方程, 同时, 在逐个自变量选人回归方程中, 如果发现先前被引入的自变量在其后由于某些自变量的引入而失去其重要性,可以从回归方程中随时予以剔除。引入一个变量或剔除一个变量,为逐步回归的一步, 每步都要进行显著性检验, 以便保证每次引入变量前回归方程中只包括显著性变量, 这个过程反复进行, 直到既无不显著变量从方程中剔除, 又无显著变量需要引入回归方程为止。


剔除一些不重要的变量。当面临严重的共线性时, 一种最简单的方法就是去掉不太重要的自变量。但决定保留或剔除哪些自变量并不是一件容易的事。因此,如何判断某个变量是否重要, 是此方法的关键。从模型中删除一个变量, 还可能导致设定偏误。

 

(5)余差估计法`

《数量经济技术经济研究》杂志1990年第4期发表的陕西财经学院郭其阳同志的文章中,用余差估计法消除多重共线性,我们认为是可行的。

 

(6)主成分估计

这是一种处理严重共线性的有偏估计方法。它利用主成分分析对自变量系统进行变量综合,然后将综合后的新变量作为解释变量, 再进行 OLS 

回归, 得到主成分估计。然而, 主成分估计的结果必然受到重叠信息的影响。另外主成分估计提取的主成分与因变量关系也不密切,使模型的拟合效果降低; 主成分的实际含义也不明确。

 

(7)岭回归

岭回归也是有偏估计方法。当出现严重共线性时,岭估计往往比 OLS

估计量更稳定, 以及更小的协方差矩阵。岭估计的最大困难是最优k值的选择。尽管人们提出了许多确定k值的原则和方法, 但理论上还未得到满意答案。实际应用中必须通过样本来确定, 存在明显的主观性。另外K 的真实含义也不清楚。

 

以上介绍了几种简单的消除多重共线性的方法。还有其它一些方法,例如参数约束修正法,主要分量法,岭回归估计方法等等,在此不再一一叙述。


使用逐步回归分析方法的图文,推荐阅读:大神叫你来读书+中国物价影响因素分析【主讲多重共线性+异方差+自相关+ADF单位根+协整分析】以及更多学习学习记相关图文。有问题直接留言咨询!



热门图文TOP5

1、【原创·大秦学术·第二期】学术论文写作方法——基于实证研究的视角

2、Stata : 论文中数据分析的一把利剑

3、本科硕博科研论文常去的网站

4盘点史上最牛的博士论文

5、中心已经正确的打开,等你来阅读

·END·

计量经济学服务中心

计量经济学服务中心

学术问题,一对一专家解决

打造中国最大的人文社科+经管类学术交流学习平台

论文指导、软件操作、学术技能、数据分析等,一起见证学术力量


学术小组QQ群:219246913(500人大群)

打造中国最好的Eviews/SPSS/STATA/SAS/R咨询群,做最好的学术交流群!


点击图片进一步了解中心

点击左下角阅读原文可以了解更多中心专题

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存