查看原文
其他

统计计量 | 今天,你PSM了吗?

数据Seminar 2022-12-31

The following article is from 不止点滴 Author 秋枫澜

本文转载自公众号不止点滴

如今,倾向得分匹配法(PSM,Propensity Score Matching)越来越受到大家的青睐,其身影频频出现在各种研究场合:
  • DID的共同趋势假设不满足?PSM一下

  • 样本可能存在选择偏差?PSM一下

  • 模型中有内生性问题?PSM一下

……

从既有文献的使用来看,PSM似乎无所不能,不论是DID最核心的共同趋势前提还是令人头疼的内生性障碍,它都能够大展拳脚,简直是经济学界的“遇事不决,量子力学”。PSM的这种“流行”直接影响了不少人,之前我便遇到有学生做论文,没有条件也想要创造条件用上PSM:PSM听上去就比OLS之流高级嘛。

在讨论PSM是不是真的比OLS更高级之前,先来简单回顾一下PSM的基本逻辑。
用政府补贴对企业行为如出口的影响来举例。一般而言,直接比较接受补贴企业与未接受补贴企业之间的出口差异并不是很合适,因为补贴往往并不是随机分配给企业,从而受补贴企业有更多的出口这一现象不一定是补贴导致的。最理想的情况是,我们首先观察到企业A在接受补贴时的出口密集度,然后时光回溯,再观察企业A在未接受补贴时的出口密集度(即反事实情形),两种情况下的出口密集度差异便是补贴的作用。可惜的是,超现实力量目前并不存在,同一时间点我们只能观察到企业的其中一种状态。为此,PSM采取了退而求其次的处理方式:找一个主要特征尽可能和企业A都相似且没有接受补贴的企业B,将其与企业A匹配起来,使得两者只在接受补贴方面不同而其他各方面非常相近。也就是说,此时企业B最大限度地近似替代或模拟了企业A的反事实情形。
PSM具体的操作过程分为三步走。第一步是倾向值预测,即以是否接受补贴作为被解释变量,建立模型计算企业在既定条件下接受补贴的概率,或称为倾向指数。第二步是根据相应的匹配规则为每家企业匹配一个与其倾向指数最为接近的对照组企业(反事实情形),并进行匹配效果的平衡性检验第三步是分析平均处理效应(也有文献采取的是基于匹配后的样本重复线性回归)。
可以发现,除了第一步中需要依赖模型预测倾向指数外,PSM的关键部分——匹配并不涉及模型设定,而是一种类似于非参的方法。因此,如果真要说PSM较之于OLS等方法的优势,一是OLS等多元线性回归容易因函数形式错误设定(FFM)而导致估计偏差,PSM则基于匹配的形式在一定程度上避免了这一问题;二是通过构造反事实情形,一定程度上缓解了可观测变量的系统差异带来的选择偏差。
那么,PSM所拥有的的这些优势给予了它玩转各个舞台的资本了吗,尤其是内生性?“本文进一步采取PSM来缓解模型中可能存在的内生性问题”这句话我已经在不少期刊文章上见到了,它们说的都对吗?
稍微分析一下就一目了然。一般导致模型内生性的有四个方面:遗漏变量、测量误差、逆向因果以及选择偏差。对于前三者,由PSM的逻辑和步骤能直观发现,PSM可以说是不掺和不干预不作为;对于选择偏差,如果这种偏差是由可观测变量导致的,那么通过在第一步倾向值预测时对变量加以控制,PSM确实起到了作用。但是,如果这种偏差是来源于不可观测变量,PSM只能说是“我本将心向明月,奈何明月照沟渠”了。总结一下,PSM极为有限地(几乎没有)处理了选择偏差带来的内生性,但对于更为一般化的内生性,PSM是真的力有不逮,工具变量法才是经得住考验的选择。所以,以后但凡在文献里看到理直气壮用PSM替代Heckman两步法甚至工具变量法来作为主要或唯一克服内生性等的做法,通通以“耍流氓”对待:它不能,你非得强行,不是耍流氓嘛。

最后,值得注意的是,PSM不仅没有“我要打十个”的能力,与之相反,它还存在诸多限制,甚至是操纵黑箱。
PSM的限制与其他所有方法一样,均体现在其使用前提上。运用 PSM需要两个重要的假设条件得到满足:条件独立假定和共同支撑条件。
  • 首先,关于条件独立假定,简单理解,它说的是企业是否接受补贴完全是根据可观测变量来决定的,当控制住这些可观测变量之后,是否接受补贴就成为了一个随机的事件,与出口水平相互独立。很显然,这条假设很严格,一些不可观测的因素同样可能影响企业是否接受补贴。实践当中,一种尝试办法是使用尽可能多的相关可观测变量——“不可观测”因素能有影响,说明可观测因素还不够多嘛。

  • 其次,关于共同支撑条件,它说的是接受补贴企业的分布与未接受补贴企业的分布存在良好的重叠。这个很好理解,如果处理组和对照组的分布不重叠,或者重叠区域很小,结果便是企业A要么找不到与其倾向值最接近的企业B,要么只能找到倾向值接近程度一般的企业B。在操作过程中,PSM会直接将缺乏对照组的样本排除掉,如果共同支撑条件很差,这将导致样本量大的损失,甚至引起样本代表性变差,结论的普遍性受到影响。这也是PSM结果的外推性受限的原因,类似于工具变量法只是局部平均处理效应。因此,一个大的样本量对使用PSM是友好的。

有了上面的认知后,PSM的操纵空间就显而易见了:一是关于可观测变量的选择,选择哪些变量、选择几个变量均可能会对结果产生不同的影响;二是基于计算出来的倾向值进行匹配时,不同匹配规则可能 影响结果,如,是重复放回匹配还是不重复匹配,是最近邻匹配还是核匹配,是1对1匹配还是1对多匹配?因而,如果是以PSM作为论文的主要分析方法,一定要多进行敏感性测试,看看结论在不同的可观测变量选择以及不同的匹配规则下是否依然稳健。黑箱嘛,也是可以打开天窗说亮话的。





星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧


往期推荐


统计计量 | 刘西川: 变量及指标选取应该注意的几个方面

软件应用 | Stata:因果推断方法综述和Stata操作

热点资讯 | 2021年度国家社科基金重大立项名单公示

数据治理 | 遇到海量数据stata卡死怎么办?这一数据处理利器要掌握

统计计量 | 学习SPSS的9本经典教材

数据可视化 | 有统一规范吗?

软件应用 | 数据科学系列:plotly可视化入门介绍






数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


推荐 | 青酱


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存