互助问答第8期:微观企业非平衡面板数据问题等
互助问答第8期:微观企业非平衡面板数据问题等
本期解答人:左翔老师
问:我的计量实证问题如下,希望您能帮助解答,谢谢!
数据情况:数据为微观企业非平衡面板,“正在试点省(市)”为解释变量,“报纸版面与试点时间交互”为工具变量,为截面数据。如下截图为我执行命令时候遇到的情况:显示too few variables specified
答:面板数据中,如果存在不随时间变化的遗漏变量ui和解释变量xit相关,则可以通过解释变量和被解释变量同时去均值后回归来解决,因为有:yit −y̅ = (xit − x̅)β + (ui − u̅) + (εit− ε̅)=(xit − x̅)β + (εit− ε̅),此时ui没有了,而(εit −ε̅)和(xit − x̅)线性无关,则能实现β的一致估计。这也被称为固定效应模型。
固定效应一个潜在的不方便之处是,无法估计那些同一个体在时间上没有变异变量的系数,因为去均值时,所有个体这一变量会都变成0(xi−x̅=0),从而无法估计。
在本题的两阶段OLS中,如果第一阶段也采用了固定效应模型,由于工具变量是横截面数据,不随时间变化,所以无法估计系数。
如果不同省份的试点时间有差异,建议采用报纸版面与该省是否试点虚拟变量(试点=1否则=0)交乘项作为工具变量,或许可行。
事实上,面板数据找到既随时间变化又随个体变化的工具变量十分不容易,Duflo andPande(2007)采用预测的内生变量拟合值来作工具变量是一个值得学习的办法,具体实证策略请读原文。
问:假如自变量是0,1变量,那么该如何进行工具变量检验呢?这时候工具变量第一阶段,即对自变量进行predict,按道理应该需要用logit回归,在这种情况下,传统的ivreg2是不是都采用的ols,应该不能用了吧?此外,如果第一阶段采用logit回归进行predict,得到fitted value代入第二阶段进行ols回归,怎么查看第一阶段工具变量的显著性呢?我看了一下,第一阶段没有输出F值。
答:1.在两阶段最小二乘估计中,无论解释变量是否是0-1变量,两个阶段都可以采用OLS估计,可以证明,只要是好的工具变量,则系数是一致估计。其实任何教科书在解释两阶段最小二乘法时,并没有限制内生变量是否是0-1变量。当然,如果Treatment 有异质性,则此时的工具变量估计是LATE(local average treatment effects)。
2.当被解释变量是0-1变量时,如果x外生,线性概率模型仍然是一致估计,之所以对其不够满意,原因在于:(1)估计的y的拟合值可能不在[0,1]区间里面。(2)此时y或误差项ui存在异方差:
采用非线性模型(如logit或probit模型)在一定假设下能解决上述问题,但同时也出现系数解释的难度增加等问题。因此,如果x异常值不是很多,许多文献也采用线性概率模型来估计,或者两个方法都使用来检查稳健性。考虑到两阶段最小二乘在第一阶段使用非线性概率模型会大大提高第二阶段解释的难度,实践中大量文献第一阶段都采用OLS.
3.如果作者希望使用非线性模型,Wooldrige(2002)在18章第4节建议的方法是,先用logit或probit模型估计得到拟合值p̂,然后再以p̂作为工具变量使用两阶段最小二乘法估计。(这和上一题中Duflo and Pande(2007)的方法异曲同工)。此时直接ivreg2等相关命令应该没问题。
参考文献:
Duflo and Pande,2007, Dams, The Quarterly Journal of Economics, Vol.122, No. 2 , pp. 601-646.
Wooldridge.J,2002:Econometric Analysis of Cross Section and Panel Data, [M].MIT Press.
上述问答部分重要细节请教了慧航老师,在此表示感谢。
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有20名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题。
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
如果您觉得有帮助,欢迎打赏。