stata:倾向得分匹配(PSM)
在经济学中,我们常常希望评估项目实施后的效应,一般的做法是加入虚拟变量,但是这种做法并不科学。例如政府推行就业培训计划,该项目的参与者,我们将其称作处理组(treatment group),未参与的培训的样本称作控制组(control group)也叫对照组。
考虑就业培训的处理效应评估。我们一般的做法是比较两组的收入状况。如果这样处理,可能得到的结论是参加培训的收入低于未参加培训者。这是由于一开始选择控制组的样本时,选择范围比较广阔,存在选择偏差。所以在此介绍倾向得分匹配方法(PSM)。本文在此就不介绍相关理论了,因为小编的理论也不是特别的好,如果想学习的可以参阅连玉君老师的相关视频(重点推介),大概有5个课时;同时也可以参考陈强老师的《高级计量经济学及stata应用》中的第28章处理效应。在此小编仅仅介绍stata的相关操作。
1、安装psmatch2
2、导入数据,方法比较多,可以粘贴复制、也可以使用命令
3、命令语法格式介绍
对以上的标准命令进行解析
D为处理变量,是虚拟变量即是否参加培训
x1 x2 x3是协变量,一般的称呼也叫解释变量
outcome(varname)是输出变量,例如收入
logit 表示计算得分的时候使用logit模型,如果不写Logit,默认为probit模型计算得分,在连玉君的视频中论述了二者并不存在明显的差异。
ties表示包括所有倾向得分相同的并列个体,默认按照数据排序选择其中一位个体。
ATE表示同是汇报ATE、ATU、ATT,大家看书重点了解
common表示仅对共同取值范围内的个体进行匹配
odds使用几率比(odds ratio)算法为p/(1-p),熟悉logit模型的应该了解
qui屏幕中不显示logit模型估计过程,可以节省运算时间
4 匹配方法
连玉君的视频教程讲了三种:最近0匹配、半径匹配、核匹配;陈强老师讲了6种,如果想详细学习,可以参考他们的相关视频与书籍。
5 检验
匹配倾向得分主要有平行假定和共同假定,主要是通过相关图表进行展示,个人建议重点参考连玉君老师的视频,相对比较完整。这一部分的东西相对比较多,小编在此也不一一进行整理。
来源 |计量经济学(ID:Mr-lufly),转载已获授权