链式因果路径分析:政策评价的下一站
前沿:机制分析与政策优化
目录
前沿:机制分析与政策优化
0. 不明觉厉
释疑 1:你能学到什么?
释疑 2:软件问题
1. 课程概览
2. 嘉宾简介
3. 课程导引:政策评价的新路标
4. 专题介绍
T1:联邦因果和联邦 DID 估计
T2:市场均衡状态下的政策效应估计
T3:政策效应影响机制分析
T4:政策优化
5. 参考文献和预读资料
6. 报名信息
缴费方式
7. 助教招聘
说明和要求
8. 交通和住宿
9. 附:连享会 · 课程总览 2023
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
0. 不明觉厉
几天前,我在 连享会主页( www.lianxh.cn ) 发布了杨海生老师的暑期课程预告,有几位好友发来信息:「不明觉厉,献上膝盖!」
说实话,如果不是半年来海生时不时在我办公室的白板上给我科普,我也不知道这些前沿方法的威力,更不会意识到「政策评价」的重心和趋势已经发生了实质性变化。下面,我用大白话来解释一下。
杨老师这几个专题中涉及的方法,都是由因果推断领域的几个大牛 (斯坦福大学的 Susan Athey 和 Guido Imbens, 哈佛大学的大牌 Raj Chetty, 及学术新星 周翔-Zhou Xiang 等) 在最近三五年内提出来。
这些方法完全改变了以往做因果推断的基本模式。以前大家的主要工作是用各种高深的方法来验证某项政策是否有效,仅此而已。但杨老师这次讲的内容,把这个进程往前推了一大步:我们可以回答「政策产生作用的机制有哪些?每一个机制的相对重要性如何验证和估计?」;同时,还可以分析政策有效性和政策公平性;第三个比较牛的地方是,可以「基于一些短期数据和短期政策效果的估计,来预测长期政策效果」,也就是说,即使没有长期的观测数据,仍然可以去预测长期的政策效果。显然,这些才是政策制定者最为关心的事情,也是政策评价中最有意思的部分。
释疑 1:你能学到什么?
我觉得,这取决于你的背景和目标:
对于致力于通过夏令营进入名校深造的同学,我建议可以深究其中 1-2 个方法,花一个月完成 1-2 篇论文的复现,然后找一个被广泛关注的政策评价问题,用新方法做个对比分析,形成一篇不错的参营论文。毕竟,参营展示时,评委更关注的是你的学术潜力,而上述工作则表明你有能力掌握前沿方法并合理应用之。 对于“遁入博门”——即将或正在读博士的路上痛并快乐着的同学而言,可能需要花 1-2 个月甚至更长的时间系统掌握本次课程的方法,尤其是 T3 和 T4 中介绍的方法,以便实质性地提升自己的自信心。之所以要花几个月的时间反刍,是为了夯实这些方法背后的基础理论和方法,如因果推断的基本概念、反事实框架、Lasso、非参数估计等。接下来,就需要广泛阅读,顺藤摸瓜,找到合适的选题。随后的事情会变得顺理成章,因为你已经站在了前沿上,博士论文中最揪心的「创新性」问题已经不再是问题。 对于正在琢磨来年自科或社科项目选题的青椒或导师们,或许深悟这些方法背后的理念,并进而形成对未来 3-5 年甚至更长时期内的学术研究趋势的判断才是最重要的。比如,我们不再执念于验证某项政策是否有效;而是转而探讨这些政策“奏效”或“失效”的条件和原因,推断其长期政策效应。一旦换了角度,机会便会应势而至。
释疑 2:软件问题
有些同学担心软件问题,因为这次课程的核心代码都是用 R 编写的。我觉得不必太纠结此事。一方面,在大神 Hadley Wickham 的引导下,R 已经变得越来越模块化了,规范、易用;大家只需花十来分钟在课件指引下安装 R + RStudio 套装即可开干;另一方面,不同软件之间的兼容性越来越好,我们完全可以用 Stata 完成 80% 以上的数据处理工作,进而执行十几行 R 代码,得到核心结果,然后返回 Stata 完成结果输出。
此外杨老师在每个专题中都提供了一些基于模拟数据的完整案例代码,以便大家理解、操练。因此,核心问题不是软件问题,而是理解模型的原理及应用场景。
当然,开课前,我们也会提供一些讲义和游万海老师录制的「R 初级教程」 (3 天,共计 24 学时),以便大家提前熟悉 R 的基本操作。
by 连玉君,
2023.6.8
1. 课程概览
时间: 2023 年 8 月 22-24 日 (三天) 地点: 西安 · 西北工业大学 嘉宾: 杨海生 (中山大学) 课件/计量软件: 提供全套 R 程序、数据和核心论文复现资料 (开课前一周发送) 打印版由主办方统一印制 课程主页: https://www.lianxh.cn PDF 课程大纲:https://file.lianxh.cn/KC/lianxh_PL.pdf 参考和预读文献:-点击下载- 报名链接: http://junquan18903405450.mikecrm.com/H6LBLNW 主题: 联邦因果推断 + 联邦 DID (1 天) 机制分析: 链式因果中介效应、路径分析、长期效应 (1 天) 政策优化: 政策学习、政策公平性评价 (1 天)
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。
2. 嘉宾简介
杨海生,中山大学岭南学院经济学系副教授,主要研究领域为复杂网络、机器学习及因果推断。在 ACM Computing Surveys, Emerging Markets Review, Ecological Economics, Journal of Asian Economics, 经济研究, 管理世界, 经济学 (季刊), 管理科学学报, 金融研究, 会计研究, 世界经济等学术刊物上发表论文 40 余篇,主持了多项国家自然科学基金、广东省自然科学基金项目。
3. 课程导引:政策评价的新路标
近十年来,政策评价似乎遇到了一个共同的「瓶颈」 —— 即使用最前沿的方法,似乎也仅限于回答「政策是否有效」。换言之,目前多数研究似乎都只扮演了评论家的角色:挑剔、刻薄,却从来都无法给出切实的政策建议,致使研究结论似乎多少带有「事后诸葛亮」的味道。
相比之下,政策制定者更关心的或许是:如何更全面深入地进行政策评估和优化?如何提供更能体现社会进步和公平性的建议?对应的学术问题如下:
能否优化现有政策,或在实施下一期政策时做得更好? 在 A 地实施的某项政策能否迁移或推广到 B 地?什么条件下可以?如果不可以,需要如何调整? 现有政策可能达到了经济或效率目标,但能否进一步兼顾公平性? 一项政策可以通过哪些路径或机制产生效果?能否依据短期数据预测政策的长期效应?
显然,一些主流期刊广泛关注的主题 (如扶贫、限购、税收优惠、政策试点等),都可以从上述视角入手做更深入地挖掘。这为我们选择新的研究切入点提供了广泛的空间: 我们不用再疲于奔命寻找新的「政策冲击」,而是可以专注于「政策作用机制」、「长期影响评价」等更有意思的话题。
本期课程旨在介绍一组能实现上述研究目标的工具,主要包括:
其一,基于联邦因果推断的「联邦 DID」方法的产生背景、估计方法和应用领域。 其二,在市场均衡设定下,采用机器学习方法 (ML) 更为准确地估计政策效果。 其三,提供一套用于实现「影响机制分析」的工具,包括:双重纠偏 LASSO (DDL) 和 链式因果中介 以及「替代指数」(Surrogate Index)。 其四,掌握基于政策学习 (Policy learning) 和公平性政策 (Fair policy) 视角的机器学习方法,以探讨如何进行政策优化,如何使得政策同时兼顾效率与公平。
我们将利用经典文献中的数据分析不同的政策情景,通过 R+Stata 程序的讲解,帮助大家将这些方法迁移到大家的研究中。此外,还会介绍这些模型的各类拓展及其在制度经济学、环境经济学、财政以及区域经济学等领域中的应用,并在异质性分析、政策含义讨论和可视化方面提出一些具有实操性的建议,以扩展大家的研究思路、激发大家的想象力。
4. 专题介绍
T1:联邦因果和联邦 DID 估计
联邦学习在因果推断中的应用 联邦 DID 与多期 DID 的对比和联系 对比对象:Callaway & Sant (2021), Goodman-Bacon (2019), Athey & Imbens (2018) and Sun & Abraham (2020) 联邦 DID 的估计原理和步骤 福利:联邦 DID 的 R 应用 参考文献: Xiong, R., A. Koenecke, M. Powell, Z. Shen, J. T. Vogelstein,S. Athey, 2021, Federated causal inference in heterogeneous observational data, arXiv preprint arXiv:2107.11732. PDF
在现实应用中,同一种处理政策常常被同时应用于多个场景中,例如,各类医院都使用同一种药物来治疗某类疾病;同一个政策会在多个地区实施等。然而,受限于隐私、专利、竞争壁垒等因素,研究人员通常难以获得各个试验点的微观一手资料,而只能得到汇总数据,致使以此为基础的统计推断缺乏准确性和可信度。Xiong et al. (2023) 引入“联邦学习”的思想,可以仅依赖汇总数据进行联合因果推断,得到政策效果的一致估计。基于此,我们进一步提出了「联邦 DID」,能够实现更有效的政策效应估计和推断。本讲从「联邦学习」的基本思路和概念入手,进而引入「联邦 DID 方法」,并以“环保约谈”政策为例,通过模拟数据来演示该方法在 R 中的实现方法。
T2:市场均衡状态下的政策效应估计
“市场均衡状态”的界定和含义 市场均衡状态政策效应的估计原理 市场均衡状态政策效应的估计方法 实例 参考文献: Munro E, Wager S , Xu K, 2023, Treatment Effects in Market Equilibrium. Working Paper. -PDF-, -PDF2-, Vedio
多数因果推断模型都依赖于 SUTVA 假设:实验组个体和处理组个体之间不存在干扰或溢出效应。显然,这大大简化了分析和估计的难度。然而,在研究某些行为时 (如个人购房、企业创新、地方政府投资等),SUTVA 假设可能不再满足,因为个体之间的行为会相互影响,也会存在溢出效应。此时,传统估计方法由于存在偏误而不再适用。
为此,Munro et al. (2023) 建立了一个基于市场均衡的处理效应模型,以便于估计「直接处理效应 (ADE)」和「间接处理效应 (AIE)」。ADE 是在给定协变量的情况下,政策冲击对实验组个体自身的预期影响;而 AIE 则是个体受冲击后对其他个体的预期影响。这在以往的政策评价中鲜有提及。
此外,他们还研究了不同个体间处理效应的异质性,并提出了满足均衡稳定性条件的「最优政策目标规则」(optimal targeting rule)。这构成了政策优化的理论基础。
本专题首先介绍“市场均衡”的含义及其对处理效应估计结果的影响,进而探讨在一般均衡情况下如何估计政策的处理效应,最后通过实例讲解该方法在 R 中的实现过程。
T3:政策效应影响机制分析
DDL:Doubly Debiased LASSO (双重纠偏拉索估计) 因果推断框架下的 中介效应模型 基于 DDL 的 因果路径模型 案例:分析师行为对企业投资效率的影响机制检验 基于 SIndex 的长期和短期政策效应估计 替代指数 (Surrogate Index, SIndex):算法及实操 案例:文明城市评比与城市垃圾处理:一项事件研究 参考文献: Guo, Z., D. Cevid, P. Buhlmann, 2022, Doubly debiased lasso: High-dimensional inference under hidden confounding, Ann Stat, 50 (3): 1320-1347. -Link-, -PDF-, PDF2, Replication Zhou, X., 2022, Semiparametric estimation for causal mediation analysis with multiple causally ordered mediators, Journal of the Royal Statistical Society Series B: Statistical Methodology, 84 (3): 794-821. -Link-, -PDF-, -PDF2- Zhou, X., T. Yamamoto, 2023, Tracing causal paths from experimental and observational data, The Journal of Politics, 85 (1): 250-265. -Link-, -PDF-, PDF2, -PDF2-
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。
在政策评价中,影响机制分析至关重要。若无法清晰确认某项政策的影响路径和机制,并提供各个路径影响力度的估计,就无法提出实质性政策建议。这是目前多数研究者共同面临的难题。本专题将介绍一些前沿方法,以应对机制检验中最棘手的两类问题:
其一,多机制 + 嵌套路径。很多情况下,一项政策可以通过多个路径对结果变量产生影响,我们重点关注的问题包括:
(1) 多个路径 之间是「非此即彼」还是「相伴而生」? (2) 哪个路径的影响更大? (3) 在某条特定的路径上是否存在 子路径? (4) 对 的 直接效应 和 间接效应 分别是多少?
下图便呈现了一种最基本的情形 (Source: Zhou, 2022, Fig 1):
其二,短期效应与长期效应。在分析了政策的影响机制之后,可以进一步研究政策效果短期和长期差异。这里介绍由多位顶级大牛 Athey, Chetty, Imbens, Kang (2023) 新近提出的「替代指数」(Surrogate Index,Sindex) 方法来估算长期政策效果。Sindex 的核心思想简单明了。在多数政策评价中,长期结果 (如终身收入) 都无法及时观测,难以支持政策决策。然而,我们可以借助机器学习方法,基于多个短期/中间政策效果 (易于观测) 预测长期效果。这些中间结果被称为统计「替代指标」,而多个短期替代指标的加权值则称为「替代指数」。Athey (2023) 给出了严格的论证,发现即使单个替代指标不满足条件,使用多个代理也有助于进行长期因果推断或提高预测精度。下图呈现了具有单一/多个短期路径情形下的 SIndex 构造思路 (Source: Athey, 2023, Fig 1)。
释疑:中介效应模型还能用吗?
有个问题需要特别说明。自从江艇 (2022) 发表以来,国内学界对中介效应进行热烈的讨论,诸多不明就里的吃瓜群众对「中介效应」谈虎色变。殊不知,江艇老师的文章旨在强调传统中介效应分析所依赖的条件,以及应用中需要避开的各种坑。其文中提出的诸多棘手问题都可以利用本讲中涉及的方法进行有效应对。
其一,多个影响机制之间彼此关联问题。我们将使用因果路径模型 (Zhou, 2022;Zhou and Yamamoto, 2023) 来解决「多路径」和「嵌套路径」分析中的路径关联问题。 其二,遗漏变量问题。它会导致有偏估计,但可以用 Guo et al. (2022) 新近提出的 DDL (Doubly Debiased LASSO) 方法加以克服。
简言之,新近发展的链式中介效应分析克服了传统模型的诸多限制,将大有可为。
T4:政策优化
政策学习 (Policy Learning) 模型 政策公平性 (Fair Policy) 模型 GRF 和混合整数线性规划算法:理论及实现 案例:“名刊工程”的政策优化 参考文献: Athey, S., R. Chetty, G. W. Imbens, H. Kang, 2023, The surrogate index: Combining short-term proxies to estimate long-term treatment effects more rapidly and precisely, Review of Economic Studies, forthcoming. -PDF-, -PDF2-, -cited- Viviano, D., J. Bradic, 2023, Fair policy targeting, Journal of the American Statistical Association: 1-14. -Link-, -PDF-, Replication
本讲介绍的方法可以解决大家普遍面临的一个棘手问题:如何让政策建议不那么空泛?
本讲内容以 T1-T3 为基础,主要包括 Athey and Wager (2021) 提出的基于「政策学习」(Policy Learning, PL) 的处理效应的核心思想和估计方法,以及 Viviano and Bradic (2023) 的提出的「公平目标政策」(Fair-Targeting-Policy) 模型,旨在分析如何在政策优化过程中兼顾效率和公平。
技术层面,将以两种常用的政策学习方法 (GRF 和混合整数线性规划) 为例,讲解如何利用 “Neyman 正交” 和 “K 折交叉验证法” 来修正偏误。
最后,以「名刊工程」的政策效果估计为例,介绍上述政策优化方法在 R 中的实现和解读。
5. 参考文献和预读资料
-点击下载-
Athey, S., R. Chetty, G. W. Imbens, H. Kang, 2023, The surrogate index: Combining short-term proxies to estimate long-term treatment effects more rapidly and precisely, Review of Economic Studies, forthcoming. -PDF-, -PDF2-, -cited- Athey, S., S. Wager, 2021, Policy learning with observational data, Econometrica, 89 (1): 133-161. -Link-, -PDF-, -Appendix-, -cited- Guo, Z., D. Cevid, P. Buhlmann, 2022, Doubly debiased lasso: High-dimensional inference under hidden confounding, Ann Stat, 50 (3): 1320-1347. -Link-, -PDF-, PDF2, Replication Munro E, Wager S , Xu K, 2023, Treatment Effects in Market Equilibrium. Working Paper. -PDF-, -PDF2-, Vedio Viviano, D., J. Bradic, 2023, Fair policy targeting, Journal of the American Statistical Association: 1-14. -Link-, -PDF-, Replication Xiong, R., A. Koenecke, M. Powell, Z. Shen, J. T. Vogelstein,S. Athey, 2021, Federated causal inference in heterogeneous observational data, arXiv preprint arXiv:2107.11732. PDF Zhou, X., 2022, Semiparametric estimation for causal mediation analysis with multiple causally ordered mediators, Journal of the Royal Statistical Society Series B: Statistical Methodology, 84 (3): 794-821. -Link-, -PDF-, -PDF2- Zhou, X., T. Yamamoto, 2023, Tracing causal paths from experimental and observational data, The Journal of Politics, 85 (1): 250-265. -Link-, -PDF-, -PDF2-
6. 报名信息
主办方: 太原君泉教育咨询有限公司
标准费用 (含报名费、材料费),差旅及食宿费自理:
全价:3800 元/班/人 优惠方案:
专题课/现场班老学员:9 折,3420 元/人 学生 (需提供学生证/卡照片):9 折,3420 元/人 连享会会员: 8.5 折,3230 元/人 温馨提示: 以上各项优惠不能叠加使用,现场座位根据报名缴费顺序确定。
联系方式:
邮箱:wjx004@sina.com 王老师:18903405450 (微信同号) 李老师:18636102467 (微信同号)
报名链接: http://junquan18903405450.mikecrm.com/H6LBLNW
⏩ 长按/扫描二维码报名:
缴费方式
方式 1:对公转账
户名:太原君泉教育咨询有限公司 账号:35117530000023891 (晋商银行股份有限公司太原南中环支行) 温馨提示: 对公转账时,请务必提供「汇款人姓名-单位」信息,以便确认。
方式 2:扫码支付
温馨提示:
扫码支付后,请将「付款记录」截屏发给王老师-18903405450(微信同号)
7. 助教招聘
说明和要求
名额: 10 名 任务: A. 课前准备:完成 2 篇推文,风格参见连享会主页 www.lianxh.cn; B. 开课前答疑:协助学员安装软件和使用课件,在微信群中回答一些常见问题; C. 上课期间答疑:针对前一天学习的内容,在微信群中答疑 (8:00-9:00,19:00-22:00); Note: 下午 5:30-6:00 的课后答疑由主讲教师负责。 要求: 热心、尽职,熟悉 Stata / R 的基本语法和常用命令,能对常见问题进行解答和记录 特别说明: 往期按期完成任务的助教可以直接联系连老师直录。 截止时间: 2023 年 8 月 10 日 (将于 8 月 12 日公布遴选结果于 课程主页,及连享会主页 lianxh.cn)
申请链接: https://www.wjx.top/vm/PwFt47r.aspx#
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。
8. 交通和住宿
地址:西安市莲湖区友谊西路127号西北工业大学 校内宾馆:西北工业大学正禾宾馆 正禾宾馆预订电话:029-88491957 ,13891950069 ,预定时请以「连享会会议参会人员」身份报名,以便享受协议价。 小知士:正禾宾馆位于西北工业大学校内,上课、用餐以及午休方便快捷,住宿环境可以参考以下图片:
9. 附:连享会 · 课程总览 2023
最新信息:www.lianxh.cn
专题课:Stata 暑期班 (初级、高级、进阶)
嘉宾:连玉君 (中山大学);王群勇 (南开大学) 时间:2023 年 7 月 15-25 日 (网络直播) PDF 大纲:https://file.lianxh.cn/KC/lianxh_PX.pdf 专题课:江艇专题——深度·因果推断
嘉宾:江艇 (中国人民大学) 主题:敏感性分析、DID前沿、IV前沿 时间:8.2-8.5 日 地点:西安 · 西北工业大学 PDF 大纲:https://file.lianxh.cn/KC/lianxh_JT.pdf 专题课:政策机制分析与政策优化
嘉宾:杨海生 (中山大学) 主题:联邦 DID、政策学习、政策优化和公平性 时间:8.22-24 日 地点:西安 · 西北工业大学 PDF 大纲:https://file.lianxh.cn/KC/lianxh_PL.pdf 公开课:计量基础及 Stata 实操 (侯丹丹)
嘉宾:侯丹丹博士 (山西财经大学) 时间:6.3, 6.10, 6.17, 6.24, 7.1 公开课:文本分析在经济金融领域的应用
嘉宾:王菲菲 (中国人民大学) 时间:2023 年 6 月 15 日 19:00-21:00 公开课:连享会 2023 系列公开课 (共 7 次)
嘉宾:王昆仑、秦利宾、宋森安、初虹、王胜文、唐雪梅、陈波 主题:交错 DID、聚类标准误、异质性分析、LaTeX 排版、数据清洗、CiteSpace 软件应用等。 时间:6.6 - 8.8 (详见 www.lianxh.cn )
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。