查看原文
其他

统计计量丨陈强:应用计量经济学的常见问题

陈强 数据Seminar 2021-06-04


作者 / 陈强

来源 / 经管之家(ID:jgjgedu)

转载 / 计量经济学



应用计量经济学的常见问题



不知从何时起,解答计量问题成了我日常生活的一部分。天南海北的读者与同道提出了各种各样的计量问题。这里摘取少量的典型问题,希望对从事实证研究的朋友有帮助。


Q:在什么情况下,应将变量取对数再进行回归?

陈强老师:


输入标题


输入标题


可以考虑以下几种情形。

第一,如果理论模型中的变量为对数形式,则应取对数。比如,在劳动经济学中研究教育投资回报率的决定因素,通常以工资对数为被解释变量,因为这是从Mincer模型推导出来的。第二,如果变量有指数增长趋势(exponential growth),比如 GDP,则一般取对数,使得 lnGDP 变为线性增长趋势(linear growth)。第三,如果取对数可改进回归模型的拟合优度(比如 R2 或显著性),可考虑取对数第四,如果希望将回归系数解释为弹性或半弹性(即百分比变化),可将变量取对数第五,如果无法确定是否该取对数,可对两种情形都进行估计,作为稳健性检验(robustnesscheck)。若二者的回归结果类似,则说明结果是稳健的。




Q:如何理解线性回归模型中,交互项(interactive term)系数的经济意义?

陈强老师:


在线性回归模型中,如果不存在交互项或平方项等非线性项,则某变量的回归系数就表示该变量的边际效应(marginal effect)。比如,考虑回归方程

y = 1 + 2x + u其中, u为随机扰动项。显然,变量x对 y 的边际效应为 2,即 x 增加一单位,平均而言会使 y增加两单位。考虑在模型中加入交互项,比如y = α + βx + γz + δxz+ u其中, x 与 z为解释变量,而 xz为其交互项(交叉项)。由于交互项的存在,故x对 y 的边际效应(求偏导数)为β + δz,这说明 x对 y的边际效应并非常数,而依赖于另一变量z 的取值。如果交互项系数 δ为正数,则 x对 y的边际效应随着 z 的增加而增加(比如,劳动力的边际产出正向地依赖于资本);反之,如果δ为负数,则 x对 y的边际效应随着z的增加而减少。

输入标题


输入标题





Q:在一些期刊上看到回归模型中引入控制变量。控制变量究竟起什么作用,应该如何确定控制变量呢? 

陈强老师:


输入标题


输入标题


在研究中,通常有主要关心的变量,其系数称为 “parameterof interest” 。但如果只对主要关心的变量进行回归(极端情形为一元回归),则容易存在遗漏变量偏差(omittedvariable bias),即遗漏变量与解释变量相关。加入控制变量的主要目的,就是为了尽量避免遗漏变量偏差,故应包括影响被解释变量 y 的主要因素(但允许遗漏与解释变量不相关的变量)。




Q:很多文献中有 “稳健性检验” 小节,请问是否每篇实证都要做这个呢?具体怎么操作?

陈强老师:


如果你的论文只汇报一个回归结果,别人是很难相信你的。所以,才需要多做几个回归,即稳健性检验(robustness checks)。没有稳健性检验的论文很难发表到好期刊,因为不令人信服。稳健性检验方法包括变换函数形式、划分子样本、使用不同的计量方法等,可以参见我的教材。更重要的是,向同领域的经典文献学习,并模仿其稳健性检验的做法。

输入标题


输入标题





Q:对于面板数据,一定要进行固定效应、时间效应之类的推敲么?还是可以直接回归?我看到很多文献,有的说明了使用固定效应模型的原因,有的则直接回归出结果,请问正确的方法是什么?

陈强老师:


输入标题


输入标题


规范的做法需要进行豪斯曼检验(Hausman test),在固定效应与随机效应之间进行选择。但由于固定效应比较常见,而且固定效应模型总是一致的(随机效应模型则可能不一致),故有些研究者就直接做固定效应的估计。

对于时间效应也最好同时考虑,比如,加入时间虚拟变量或时间趋势项;除非经过检验,发现不存在时间效应。如果不考虑时间效应,则你的结果可能不可信(或许x与 y的相关性只是因为二者都随时间而增长)。




Q:如何决定应使用二阶段最小二乘法(2SLS)还是广义矩估计(GMM)? 

陈强老师:


如果模型为恰好识别(即工具变量个数等于内生变量个数),则GMM完全等价于2SLS,故使用2SLS就够了。在过度识别(工具变量多于内生变量)的情况下,GMM的优势在于,它在异方差的情况下比2SLS更有效率。由于数据或多或少存在一点异方差,故在过度识别情况下,一般使用GMM。

输入标题


输入标题





Q:在面板数据中,感兴趣的变量x 不随时间变化,是否只能进行随机效应的估计(若使用固定效应,则不随时间变化的关键变量 x  会被去掉)?

陈强老师:


输入标题


输入标题


通常还是使用固定效应模型为好(当然,可进行正式的豪斯曼检验,以确定使用固定效应或随机效应模型)。如果使用固定效应,有两种可能的解决方法:

(1)如果使用系统GMM估计动态面板模型,则可以估计不随时间而变的变量x 的系数。(2)在使用静态的面板固定效应模型时,可引入不随时间而变的变量 x与某个随时间而变的变量 z 之交互项,并以交互项 xz (随时间而变)作为关键解释变量。




Q:对于非平稳序列,能否进行格兰杰因果检验?

陈强老师:


如果非平稳序列之间存在协整关系,则可进行格兰杰因果检验(Grangercausality test)。这是因为,根据“格兰杰表示法定理”(Granger Representation Theorem),任何协整系统都可写为向量自回归(VAR)模型,即格兰杰因果检验的形式。

反之,如果非平稳序列之间不存在协整关系,则须先将原序列变为平稳过程(比如一阶差分),然后再进行格兰杰因果检验;否则会出现“伪回归”(spuriousregression)问题。

输入标题


输入标题





Q:对于面板数据,如何进行格兰杰因果检验?

陈强老师:


输入标题


输入标题


在对面板数据进行格兰杰因果检验时,由于被解释变量(dependentvariable)的滞后项作为解释变量(explanatory variable)出现在方程右边,故为动态面板模型(dynamic panel),应使用差分GMM或系统GMM进行估计,详见陈强(2015,p.381)。





Q:从哪里可以下载《计量经济学及Stata应用》与《高级计量经济学及Stata应用》这两本教材的数据集?

陈强老师:


关于我的本科教材《计量经济学及Stata应用》与研究生教材《高级计量经济学及Stata应用》,其数据集与课件均可从我的个人网站下载:

www.econometrics-stata.com 

输入标题


输入标题






/ END /




搜索你感兴趣的内容吧

软件应用丨吐血推荐,B站最强学习资源汇总(数据科学,机器学习,python)


软件应用丨Markdown(四):让你的文章“有声有色”


软件应用丨Markdown(三):流程图详解






数据Seminar




这里是大数据、分析技术与学术研究的三叉路口



作者:陈强
来源:经管之家(ID:jgjgedu)
转载:计量经济学

推荐:青酱

排版编辑:青酱




    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存