统计计量 | 《计量经济学》中的前沿方法——随机干预试验方法简介
来源:当代教育实践与教学研究
作者:杨云帆,北方民族大学经济学院
本文转载自公众号计量经济学
内容提要:计量经济学是经济学专业的一门重要专业基础课, 对培养学生批判思维能力, 定量分析能力起到重要作用。计量经济学中的随机干预试验方法可以有效帮助学生建立因果关系框架, 在实践中辨明变量的影响。同时, 随机干预试验方法的应用前景也在不断扩展。
关键词:计量经济学;随机干预试验方法;分析能力
Part1引言
计量经济学是利用经济理论和统计学技术分析经济数据的一门科学。该学科强调对经济数据所反映的变量间因果关系的建模。例如, 在教育经济学中, 研究提供奖学金能否提高学生的学习成绩;在健康经济学中, 研究烟草税可以在多大程度上减少吸烟。这些问题的回答都基于变量因果关系的定量分析。
计量经济学专家发现心理学和医学等众多领域经常应用的随机干预试验方法是理解因果关系的一项有效途径。例如, 某种新药被批准上市销售之前通常需要做临床试验, 即随机选择一些患者服用该药物, 而另一些患者服用无害的替代药品。只有当这种随机干预试验能提供有力的证据表明药物是安全有效的, 才能最终批准该药物上市。
著名计量经济学家Stock和Waston认为, 有三个理由支持应该在计量经济学课程中学习随机干预试验方法。第一, 理想化随机干预试验的概念提供了在实际中判断因果效应估计的标准。第二, 随机干预试验的结果通常很有影响力, 因此了解实际试验的局限和优点十分必要。第三, 试验经济学中得到的教训也适用于一些准试验。
基于以上背景, 本文着重介绍随机干预试验方法在计量经济学中的应用, 包括随机干预试验的基本方法和操作步骤和随机干预试验的结果分析, 最后对随机干预试验的优缺点进行讨论。
Part2随机干预试验方法概述
随机干预试验的核心问题是找到因果关系, 即找到与未接受政策 (或干预) 时在结果上的差别。影响程度的大小也随时间而改变如下图所示:
随机干预试验是在控制其他因素不变的情况下分解出哪些影响和变化是由于某项特定因素干预所引起的, 因此要借助于反事实分析。依据在于从统计学意义来讲, 因果关系是可观察到的“事实”与其“反事实”之间的差异。从反事实的框架出发, 因果关系可以表示为:
在这里Τ是指因果关系;π指所有调查对象在干预组中的比例; (1-π) 表示所有调查对象在对照组的比例;w是一个虚拟变量, 其中1代表个体在干预组,而0代表对照组;Y1和Y0分别指代干预组和对照组的成员在因变量上的取值;E则是取期望值的意思。上述公式中, E (Y1|w=1) 或E (Y0|w=0) 是可观测到的事实, 而E (Y1|w=0) 和E (Y0|w=1) 则是反事实。因果关系T就表示为干预组中的个体其“事实”与“反事实”之间的差异即E (Y1|w=1) -E (Y0|w=1) 与对照组中的个体其“事实”与“反事实”之间的差异。随机干预试验中一直存在一个问题是我们永远也不可能观测反事实是什么。因为在某项特定的研究中, 某一群人只可能在干预组或对照组, 而不能同时在两组中出现。这被称为“因果推论的基本问题” (Holland) 。为了做出因果推论, 我们希望能够满足以下条件, 这在统计学上称为“非混淆假设” (unconfoundedness assumption) :
如果满足非混淆假设, 因果推论公式就简化为:
如果公式右边的两项均能观测到, 我们就能做出因果性结论。能否做出因果推论主要取决于非混淆假设是否满足。随机化是统计学中常用的办法,由于干预个体是通过随机方式分配到干预组和对照组中的, w本身就和最后的干预结果Y1或Y0没有关系了。换句话说, 无论w=0还是w=1, E (Y1) 或E (Y0) 的值都是固定的, E (Y1|w=0) =E (Y1|w=1) 且E (Y0|w=0) =E (Y0|w=1)。但是我们通常做不到完美的随机化, 能做的是尽可能控制混淆变量, 保证这些变量一旦被控制起来, w就能够近似地和Y1或Y0保持独立。换句话说, 我们希望做到:
实践中, 为了得到上述介绍的干预组人群和对照组人群在干预后的区别,研究人员需要通过随机干预试验“三步曲”完成数据收集, 展开干预, 进行影响评估。“三步曲”的基本步骤包括:基线调查、干预试验和评估调查(张林秀, 2013) 。
基线调查:在项目干预之前将项目参与者的基本状况了解清楚, 核心信息是收集主要结果变量以及可能影响结果变量的控制变量的信息。
干预试验:将研究人群按照随机分配原则分成干预组和对照组, 并要在干预的过程中进行监控以保证项目能够正确实施。比如在项目执行中, 有些参与者中途会退出, 但是要保证最后退出的参与者和剩余的参与者在基本状况上没有差异。
评估调查:等到干预完成预期已经出现影响后, 评估调查就可以开始了, 评估调查只要重复基线调查时所调查的所有内容就可以了。评估调查最经常遇到的情况是参与者退出, 这时候就需要严格比对参与基线调查的人群, 完整地识别出共同参与基线和评估调查的人员。
Part3随机干预试验的结果分析
在调查工作完成之后, 根据收集得到的数据, 便可以对随机干预试验结果进行分析。利用基线和评估两期数据、干预和对照组分类, 比较两期数据的差即可。利用试验设计的干预组和对照组基线和评估两期面板数据,初步模型设计如下:
上式中:Δyi为评估期的结果变量与基期结果变量的差;结果变量y是我们所要考察的变量;ΔTreati代表是否提供干预的虚拟变量, 缺省的是对照组;εi是随机干扰项;β1的估计量代表相比于对照组群体, 干预的影响效应。(7)式中可进一步加入其他控制变量, 此时的回归模型是:
(8) 式中Y为ΔXi的系数变量, 对于那些基期和评估期不发生改变的控制变量, 两期之间的差值为0, 因此不包含在式 (8) 中的ΔXi中。如果干预是严格的和有效的按照规定来实施, 同时没有被其他因素影响, 那么计量模型估算的影响大小β1就是我们希望得到的干预的效果。
Part4讨论
虽然随机干预试验理论上的优越性被称为影响评估的“黄金准则”, 但是仍然面临诸多挑战。例如, 参与试验的人群会影响他们的行为 (霍桑效应) ;中间退出的参与者的退出原因可能与干预本身相关, 这就会造成OLS估计有偏。
另外, 以人为主体的试验成本非常昂贵, 因此这类项目通常样本不大。而样本较小就可能带来样本代表性的问题。做试验目的就是想推广干预的效果, 但是若在一个国家发现一项政策有效并不一定能在另一个国家有同样的效果时, 试验带来的优势将不复存在。试验研究还经常被批评存在有伦理问题。比如发现当地小孩存在贫血, 而干预是补充铁元素的改善贫血计划, 对照组小孩因为在试验中不能得到铁元素补充, 因而要实施随机干预试验需经过伦理委员会的严格审查。
虽然仍存在不少问题, 但随机干预试验的研究近年来越来越多地被经济学家采用。原因是即使是像American Economic Review这样的顶级经济学期刊, 很多文章的计量经济结论还是有错误的 (Mc Closkey and Ziliak, 1996) 。但随机干预试验的引入有效回应了部分质疑。例如, 哈佛大学著名经济学家Zvi Griliches曾说, 他不曾看到超过4个变量的分析。随机干预试验的研究能够很好地减少控制变量的数目。正因如此, 在经济领域引入随机干预试验的先锋如MIT的Duflo教授, 因其突出的贡献获得了2010年度的克拉克奖。
随着随机干预试验的应用越来越多, 一些计量经济学教科书也引入这部分内容以介绍给读者 (Stock and Waston, 2007) 。在这学期的计量经济学教学中, 我也特意安排一节课阐述了随机干预试验的基本思想, 提醒学生在应用计量经济学时, 能够不断反思自己所建模型的可信性, 以提高学生对计量经济学的掌握程度。
参考文献
[1]Stock, James H., and Mark W.Watson.Introduction to Econometrics, 2nd ed[M].Boston:Addison Wesley, 2007
[2]Holland, Paul W.Statistics and Causal Inference[J].Journal of the American Statistical Association, 1986
[3]张林秀.随机干预试验——影响评估的前沿方法[J].地理科学进展, 2013
[4]Mccloskey, Deirdre N., and Stephen T.Ziliak.The standard error of regressions[J].Journal of economic literature, 1996
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
推荐 | 青酱
欢迎扫描👇二维码添加关注