查看原文
其他

固定效应还是随机效应?Hausman检验?

秋枫澜 不止点滴 2022-12-31

之前说过,对于面板数据模型,我们一般或者用固定效应估计,或者用随机效应估计。那么在实际运用的时候,到底应该选择哪一种估计方法呢?不少人习惯先做Hausman检验,然后根据检验结果进行选择。这自然是没问题的。不过,今天在这里武断又果断地跟大家讲:管它的Hausman检验,管它的随机效应,直接用固定效应估计吧!


这不是任性,而是有充足理由的。对于静态模型:

复合扰动项由不可观测的不随时间变化的个体效应、不随个体变化的时间效应、以及满足球形扰动方差等经典假设的扰动项构成。回忆一下之前讲的,固定效应和随机效应的差别就在于个体效应或者时间效应与解释变量的关系,前者假设个体效应或者时间效应与某个解释变量相关,而后者则假设个体效应或者时间效应与所有的解释变量都不相关。


现在,假设模型(1)确实应该用随机效应估计。在这种情况下,复合扰动项与所有解释变量无关,通过OLS我们可以得到一致估计。那如果一不小心“错误”地使用了固定效应呢?由于固定效应的估计方法有三种:组内去均值估计、一阶差分估计、以及最小二乘虚拟变量法,这里以组内去均值估计为例(为说明的简便起见,假设只存在个体固定效应;其他两种方法的思想与组内去均值估计一致),去均值后有:

由于不随时间变化,从而其均值就等于本身,也就说这一项为0。此时,由于与解释变量相关的个体效应被消除掉了,新的扰动项

与解释变量无关,从而通过OLS我们可以得到一致估计。也就是说,即便模型本身是应该使用随机效应估计的,用固定效应估计照样能得到一致估计。但是反过来就不一样了,如果在应该使用固定效应的情况下却使用了随机效应,一定会得不到一致估计。


上面只是从技术上说明了使用固定效应可以免受的不必要风险,其实还有一个更重要的原因。我们都知道,遗漏变量偏误是内生性的一大来源,在建立计量模型时,我们都倾向于加入更多重要的控制变量来缓解这个问题。但是,由于经济主体和经济关系的复杂性,影响被解释变量的因素可以说成千上万,我们加入模型予以控制的那些因素只是我们能够考虑到的、能够观测到的因素,还有大量的未考虑到、未被观测到的因素进入了扰动项。在这种情况下,很难假设说扰动项中完全没有一丁点不随个体变化或时间变化、且与解释变量相关的因素。从这个角度出发,相对于随机效应,固定效应的假设更加符合现实,更能较好的处理遗漏变量问题。


总结一下,基于以下两点原因,我们可以直接使用固定效应对一般面板数据模型进行估计:

(1)从技术上来讲,不管模型本应该使用固定效应还是随机效应,使用固定效应估计始终能得到一致估计,但随机效应则不然;

(2)从理论上来讲,固定效应的假设更加符合经济现实,有利于缓解因遗漏变量偏误导致的内生性问题。


既然如此,为什么不少人还是要看Hausman检验的脸色呢?部分原因可能是为了凑字数,部分原因可能是为了心安吧。其实,基于以上两点理由,可以武断又果断地讲:不用看Hausman检验的结果也知道它肯定是支持使用固定效应的(也不能说的这么绝对,但至少有相当把握)。


不过,虽然话是这么说,但不代表大家可以不理会Hausman检验了。Hausman检验的思想还是很值得学习和了解的,其应用也远非判断下固定随机效应这么局限。所以,下面以固定效应和随机效应的选择为,简单介绍一下Hausman检验。

既然是统计检验,自然是需要有原假设的。对于原假设与所有解释变量都不相关。原假设意味着随机效应模型是正确的模型。在原假设成立的情况下,固定效应估计与随机效应估计均能得到一致估计,也就是说FE与RE估计量将依概率共同收敛于真实的参数值,从而。在原假设不成立的情况下,FE估计量将依概率收敛于真实的参数值,但是RE估计量则不会,这意味着将不再收敛于0。因此,只要的差距过大,就倾向于拒绝原假设。基于这种思想,原假设可以转化为

,并由此构建出Hausman检验统计量,如果该统计量大于临界值,则拒绝原假设,使用固定效应。(Hausman检验还可由于检验是否存在内生性:不论模型是否存在内生性,工具变量估计始终能得到一致估计,但在有内生性的情况下OLS估计则不一致。)









您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存