五一开讲 —— 连享会论文精讲班
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
连享会 · 2023 · 五一论文班
最新版课纲 PDF 👇
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描上方二维码,直达课纲。
目录
1. 课程概览
1.1 授课嘉宾
1.2 课程导引
2. 专题介绍
Day1:研究设计专题
Day2:从专题数据库中挖掘选题
Day3:基于机器学习的因果推断 + 迁移学习算法
3. 报名和缴费信息
3.1 报名链接
3.2 缴费方式
4. 听课指南
4.1 软件和课件
4.2 实名制报名
5. 诚聘助教
说明和要求
1. 课程概览
时间: 2023 年 5 月 1-3 日 (9:00-12:00; 14:30-17:30, 半小时答疑) 方式: 网络直播+回放 嘉宾: 连玉君 (中山大学);沙文彪(中山大学);杨海生(中山大学) 课件/计量软件: Stata,提供全套 Stata 实操程序、数据和 dofiles (开课前一周发送)。建议使用 Stata 16.0 或更高版本。(Note: 部分文章中会涉及少量 R 代码) 课程主页: https://www.lianxh.cn PDF 课程大纲 ;参考文献 👇
报名链接: http://junquan18903405450.mikecrm.com/6sFqyrI
1.1 授课嘉宾
连玉君 ,中山大学岭南学院副教授,博士生导师。毕业于西安交通大学金禾经济研究,获经济学博士学位。研究方向为公司金融和金融计量,研究兴趣包括公司治理、现金持有、股权质押、投融资行为,成果见诸 Stata Journal、China Economic Review、《经济研究》《管理世界》《经济学(季刊)》《金融研究》《统计研究》《世界经济》等期刊,主持国家自然科学基金 2 项。
沙文彪,经济学博士,中山大学岭南学院“百人计划”助理教授、硕士生导师。博士毕业于香港科技大学社会科学部 (导师:Prof. Albert Park),曾在美国加州大学伯克利分校经济学系访问求学 (合作导师:Prof. Edward Miguel)。目前有一篇论文发表于 Journal of Development Economics。
杨海生,中山大学岭南学院经济学系副教授,主要研究领域为复杂网络、机器学习及因果推断。在 ACM COMPUTING SURVEYS、Emerging Markets Review、 Economic Geography、Ecological Economics、《经济研究》《管理世界》《经济学 (季刊) 》《管理科学学报》《金融研究》《会计研究》《世界经济》等学术刊物上发表多篇论文,主持和参与多项国家自然科学基金、广东省自然科学基金等课题研究。
1.2 课程导引
论文的价值在很大程度上取决于你解决了什么问题,与之相伴的是一系列逻辑严密分析和论证,或曰「研究设计」。研读已经发表的论文通常只能看到作者研究工作的最终成果,而具体的思考、分析和打磨过程,则不得而知,而这恰恰是多数人渴望学习的。
为此,本次专题课程中,三位嘉宾不仅仅是分享论文写作过程中「风光」的一面,也会倾诉「心酸」的体验。这次讲解的论文有近半数为嘉宾自己的论文,便源于这个考虑。
我们将通过精讲和重现 9 篇发表于 Top 期刊上的论文 (AER、QJE、AEJ、JF、JFE,JDE 等),与大家分享提升研究设计和论文写作能力的经验。课程中涉及的多数论文都会详细讲解实证研究的各个环节,包括:选题、研究设计、数据处理、内生性问题、稳健性检验、结果的解读和可视化呈现,以及研究贡献的梳理等。在此基础上,进一步结合前期和后续文献,讨论其局限和可能的选题方向,以启发学员思考新的选题方向。
课程中涉及多种计量方法的综合应用,包括:
固定效应模型、高维固定效应模型、长差分、IV 估计 多期倍分法 (DID)、双重稳健 DID 估计量 基于 Lasso 和随机森林的因果推断方法 迁移学习算法 分布滞后模型、事件研究法、多元 Logit 稳健性检验、安慰剂检验 ……
涵盖的话题包括:
税收与创新行为 社会关系与政府官员选任 土地政策和经济增长 名刊工程的政策评价 环境污染和治理
研究设计方面的主题包括:
如何设计研究框架? 如何优化文档结构和代码 (提高效率-保证可复现)? 如何实现「实证结果可视化」? 如何论证「研究贡献」? 如何进行短期效应和长期效应的估算? 如何综合使用多种方法应对「内生性」,确保「稳健性」?
这些主题与大家正在研究或关注的话题存在密切的关联,有助于结合或迁移。
2. 专题介绍
三天的课程共讲解 5-6 篇论文,每篇论文均提供完整的重现数据和代码。
授课顺序
连玉君 5 月 1 日 沙文彪 5 月 2 日 杨海生 5 月 3 日 浏览-下载-所有论文
Day1:研究设计专题
T1:社会关系与官员选任 (3 小时)
Fisman, R., J. Shi, Y. Wang, W. Wu, 2020, Social ties and the selection of China’s political elite, American Economic Review, 110 (6): 1752-1781. -Link-, -PDF1-, -cited-, -Replication-
简介: 直觉而言,与现任成员具有「同乡」或「大学校友」关系的候选人更容易入选。然而,这篇针对中央政治局成员选任的论文却发现了截然相反的结果:同乡或校友背景会导致候选人入选的概率下降 5-9 个百分点,并称之为「人脉惩罚」。文章在多种设定下证实了上述结果的稳健性,进而对三种「排他性解释」进行了检验,为上述结果提供了合理的经济解释。
该文一方面与前期的政治关联、社会网络、社会关系等主题的文献一脉相承,另一方面也为研究政府治理、官员选任以及地方政府业绩等话题提供了很好的视角,具有不少扩展方向。学习要点: 如何论述和检验「排他性」解释? 高维固定效应的作用和解释 线性概率模型 v.s. Logit/Probit 如何采用异质性分析强化你的观点 顺藤摸瓜:结合该文的 引文,讨论可能的扩展方向
T2:税收与创新:短期效应与长期效应 (3 小时)
Akcigit, U., J. Grigsby, T. Nicholas, S. Stantcheva, 2022, Taxation and innovation in the twentieth century, The Quarterly Journal of Economics, 137 (1): 329-385. -Link-, -PDF-, -Appendix-, -cited-, -Replication-
简介: 文章研究了美国公司税和个人税对创新的影响。作者将发明人数据库、公司税率数据库,以及州级个人所得税和其他经济数据关联起来,从宏观和微观两个层面估计了税收对创新 (数量、质量、发生地等) 的影响。文中采用了多种识别策略,得到了非常一致的结论:(1) 高税率对创新的数量和发生地具有负面影响,但不会影响平均创新质量;(2) 州级层面的「税收-创新产出」弹性很大;(3) 公司税主要影响受雇发明者 (相对于自由职业者) 的创新产出和跨州流动性;而个人所得税则会对整体创新数量和发明人的流动性产生影响。
学习要点:
研究设计和写作。 该文涉及宏观和微观两个视角、各类创新行为的衡量方法、不同的税率指标、短期效应和长期效应估计等多个方面,但全文始终以产出弹性为主线,采用多种识别策略,从不同角度来论证结果的合理性及经济含义,严格遵守了「一个问题一次性说清楚」的原则。 研究贡献和结果解读。 这是论文中至关重要但却不容易写好的部分。作者的策略是「对标」——通过与前期 Top 期刊文献的细致对比来论述其贡献,通过与同类或相近文献对比来说明其估计结果的合理性。 实证研究方法的组合。 全文使用了近 10 种不同的计量方法,比如「高维固定效应模型」、「交互固定效应」、「长差分」、「事件研究法」、「合成控制+DID」、「分布滞后模型」、「固定效应多元 Logit」等。你能够感觉到作者是信手拈来,因为,每一种方法的应用都恰到好处,虽然难度不大,但能够很好地回答「产出弹性的时变性和异质性」、「政策的短期和长期效应」等比较棘手的问题。 文章的附录如何做? 作者提供了一份 70 多页的「Appendix」文档,基本上涵盖了我们所能想象到的各种 稳健性 检验方法,可以作为我们在投稿时制作附录文档的范本。 如何扩展? 该文的四位作者,尤其是第一作者做了一系列主题相近的论文,都有很高的引用率,这篇文章本身也被后续学者广泛引用,这为我们在此文基础上选择自己的切入视角提供了很多启发。
Day2:从专题数据库中挖掘选题
本专题的目标是通过 1 篇 Top 期刊论文的精讲和复现,辅以 2-3 篇文献的扩展讲解,帮助大家全面认识中国家庭追踪调查 (China Family Panel Studies, CFPS),发掘新的选题。主要包括两部分内容:
T3:CFPS - 认识、清理与论文精讲 (3 小时)
从深入了解 CFPS 数据库入手,包括:CFPS 数据库的结构;涵盖主要问卷和变量;如何清理 CFPS 数据库、转换为面板数据、构造核心变量。用具体的 CFPS 数据与 Stata 代码进行操作讲解。接下来,精讲 Sha (2023) —— 主讲人基于 CFPS 完成并发表在 Journal of Development Economics 上的论文。我会对文章的 idea 的产生、数据分析、论文撰写、投稿以及审稿意见的处理等完整过程进行详细介绍,帮助学员们深入了解如何撰写自己的第一篇应用微观实证文章。实操层面,将介绍如何利用 Stata 和 R 实现文中的模型估计、因果推断和结果可视化展示。
认识 CFPS:数据库结构、主要问卷、核心变量 清理 CFPS:离群值、变量定义、面板构造 讲解 Sha (2023, JDE):估计、检验、内生性和稳健性检验
T4:CFPS - 如何发掘和拓展新的研究主题 (3 小时)
以 T3 为基础,进一步介绍在 Sha (2023) 基础上拓展开的两篇工作论文:Sha (2021) 和 Sha & Zou (2022),以便帮助大家学习如何从 CFPS 中发掘互相关联的研究主题,有序地开展系列研究。为进一步扩展大家的思路,我会介绍 CFPS 数据在不同领域的应用,包括发展经济 (Han et al., 2022)、健康经济 (Zhang et al., 2017, 2018) 和劳动经济 (Fan et al., 2021) 等应用微观领域。
Sha (2023, JDE)的拓展:Sha (2021) + Sha and Zou (2023) 发展经济学领域:Han et al. (2022) 健康经济学领域:Zhang et al. (2017) + Zhang et al. (2018) 劳动经济学领域:Fan et al. (2021)
参考文献:
Fan, Y., J. Yi, J. Zhang, 2021, Rising intergenerational income persistence in china, American Economic Journal: Economic Policy, 13 (1): 202-230. -Link-, -PDF-, Appendix, Replication, -cited- Han, L., X. Li, G. Xu, 2022, Anti-corruption and poverty alleviation: Evidence from china, Journal of Economic Behavior & Organization, 203: 150-172. -Link-, -PDF-, PDF2 Sha, W., X. Zou, 2022, The political economy of eminent domain: The economic and political effects of housing demolition in china, SSRN 4237524. PDF2 Sha, W., 2023, The political impacts of land expropriation in china, Journal of Development Economics, 160: 102985. -Link-, -PDF- Sha, W., & Zou, X. (2023). The Political Economy of Eminent Domain: The Economic and Political Effects of HousingDemolition in China. Available at SSRN 4237524. Zhang, X., X. Zhang, X. Chen, 2017, Happiness in the air: How does a dirty sky affect mental health and subjective well-being?, Journal of Environmental Economics and Management, 85: 81-94. -Link-, -PDF-, PDF2, Appendix Zhang, X., X. Chen, X. Zhang, 2018, The impact of exposure to air pollution on cognitive performance, Proceedings of the National Academy of Sciences, 115 (37): 9193-9197. -Link-, -PDF-, PDF2, Appendix, -cited-
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。
Day3:基于机器学习的因果推断 + 迁移学习算法
目前多数文献在进行政策评价时主要集中于回答「政策是否有效?」这一问题。然而,更为有趣,也更具挑战性的是「迁移学习问题」。从横截面角度来看,我们需要回答的是“一个在 A 地区成功的政策能否复制到其他地区?”;从时间序列角度来看,我们需要进一步分析“如果某项政策被证实有效,那么在下一轮政策实施过程中,是否可以对现有政策优化?如何优化?”
若从反事实架构角度看待这个问题,其主要技术障碍依然是如何合理估计「反事实」。如果我们能估算出样本中每个个体的反事实,就可以在新一轮政策制定中将有限的资源分配给累积效用最大的那些个体,这是迁移学习和政策优化的决策基础和依据。毫不夸张地说,现有多数文献中所讨论的政策效应都有必要进一步研究其「可迁移性」,应用面非常广泛。
本专题介绍两类前沿的政策方法:「双重稳健 DID 估计 (DRDID)」和「迁移学习算法」。主要涵盖如下主题:(1) 现行 DID 方法的缺陷以及双重稳健 DID 估计的应用场景、估计方法和结果解读;(2) 如何使用机器学习方法 (ML) 估计 Double-Robust Scores (即处理效应) ,重点集中于 Partial-linear 和 Interaction 两种设定的优势和实操;(3) 迁移学习算法——成功经验的可复制性及其如何在其他地区进行复制。
专题中将精讲 3-5 篇近三年的 Top 期刊论文 (附 R+Stata 代码和复现数据),以便大家了解模型在不同政策情景下的设定和解读方法。作为拓展,我们还将介绍基本模型及其变种在制度经济学、环境经济学、财政以及区域经济学等领域中的应用,以便大家将这些方法「迁移」到自己的研究中去。
各个专题的具体介绍如下:
T5: 双重稳健 DID:DRDID 和 CSDID (2 小时)
概要: 专题 1 讲解首先比较 DID 估计方法中的双重固定效应(TWFE)、结果回归法 (Outcome Regression,OR)和逆倾向得分概率加权法 (Inverse Propesnity Weight Regression,IPW),进而讲解建立在 OR 和 IPW 基础上的双重稳健-双重差分估计 (DRDID, Sant & Zhao (2020)),以及有 Callaway & Sant (2021) 提出的 DRDID 的扩展模型:CSDID。其次,本课程不仅会介绍基于「非平衡面板」和「混合截面数据」的 ATE 估计方法,而且将讨论如何灵活地划分处理组,获得子组事后 n 期等情形的处理效应。如此帮助学员们丰富回归结果。最后,课程将以最低工资政策对青少年就业的数据为例,引导学员们如何利用 Stata 和 R 计算 CSDID 估计量。
回顾 1:TWFE、OR 以及 IPW 的区别和联系 回顾 2:多期 DID - Callaway & Sant (2021), Goodman-Bacon (2019), Athey & Imbens (2018), Sun & Abraham (2020) 估计量的对比和应用场景 双重稳健 DID 模型 (DRDID): Sant & Zhao (2020) 双重稳健 DID 扩展模型 (CSDID):Callaway & Sant (2021) 基于「非平衡面板」和「混合截面数据」的 ATE 和异质性效应 案例:Semenova et.al (2020) , Sant & Zhao (2020) ,Callaway & Sant (2021) 福利:CSDID 的扩展
T6: 机器学习在双重稳健估计中的应用 (2 小时)
在 T5 的基础上,详细介绍 ChernoZhukov et al. (2018) 在 partial linear model/interaction model 设定下的双重稳健估计方法,分别简称为 PL-DRE 和 Int-DRE,并以两种常用的机器学习方法:Lasso 和随机森林 (RF) 为例,讲解如何利用 Neyman 正交和 K 折检验进行误差修正。最后以名刊工程的政策效果估计为例,通过 R 讲解 Lasso 的具体使用方法。
partial-linear model 和 interaction model 中的双重稳健估计 误差修正:Neyman 正交和 K 折检验 机器学习:Lasso 和随机森林 (RF) 福利:“名刊工程”的政策效应 (工作论文)
T7: 迁移学习算法及实现 (2 小时)
针对学员们普遍面对的“政策建议过于空泛”这一问题,介绍 Tian & Feng (2022) 提出的基于广义线性模型的「迁移学习算法」。具体而言,为了更好地判断某地区是否应该实施 A 政策,我们可以充分利用“源数据” (实施过政策 A 的地区数据) ,在此基础上识别政策 A 的对于该地区的可移植性。本讲从广义线性模型入手,讲解如何使用 R 对目标模型由帮助的数据集进行筛选,及如何进行迁移估计。此外,还将帮助学员们可视化地获得各个政策或政策组合的适用范围,提出因地制宜的政策建议和组合方案。最后,将给出迁移学习在雾霾治理中的应用实例。此外,本课程将结合三个专题的前沿研究分享一系列的福利,主要是关于双重稳健估计及迁移学习算法的应用场景及结果多元化、可视化。
迁移学习算法的由来 广义线性模型(GLM)的介绍 Two-Step Transfer Learning 算法理论及实现 Transferable Source Detection 算法理论及实现 目标系数渐进置信区间 (CI) 的构造 案例:雾霾治理的政策组合效果及路径优化
参考文献:
Athey, S., G. W. Imbens, 2022, Design-based analysis in difference-in-differences settings with staggered adoption, Journal of Econometrics, 226 (1): 62-79. -Link-, -PDF-, PDF2 Callaway, B., P. H. C. Sant'Anna, 2021, Difference-in-differences with multiple time periods, Journal of Econometrics, 225 (2): 200-230. -Link-, -PDF-, PDF2 Chernozhukov, V., D. Chetverikov, M. Demirer, E. Duflo, C. Hansen, W. Newey, J. Robins, 2018, Double/debiased machine learning for treatment and structural parameters, The Econometrics Journal, 21 (1): C1-C68. -Link-, -PDF-, Replication LaLonde, R. J., 1986, Evaluating the econometric evaluations of training programs with experimental data, The American Economic Review, 76 (4): 604-620. -Link-, [-PDF-], PDF2, -cited- Sant’Anna, P. H. C., J. Zhao, 2020, Doubly robust difference-in-differences estimators, Journal of Econometrics, 219 (1): 101-122. -Link-, -PDF-, PDF2, Sun, L., S. Abraham, 2021, Estimating dynamic treatment effects in event studies with heterogeneous treatment effects, Journal of Econometrics, 225 (2): 175-199. -Link-, -PDF-, PDF2 Tian, Y., Y. Feng, 2022, Transfer learning under high-dimensional generalized linear models, Journal of the American Statistical Association: 1-14. -Link-, -PDF-, PDF2, Appendix, -cited-
浏览所有论文 👇
3. 报名和缴费信息
主办方: 太原君泉教育咨询有限公司 标准费用 (含报名费、材料费):2800 元/人 (全价) 优惠方案: 三人及以上团购/专题课老学员:9 折,2520 元/人 学生(需提供学生证/卡照片):9 折,2520 元/人 充值 连享会会员:85 折 2380 元/人 温馨提示: 以上各项优惠不能叠加使用。 联系方式: 邮箱:wjx004@sina.com 电话 (微信同号):王老师 18903405450 ; 李老师 18636102467
3.1 报名链接
报名链接:
http://junquan18903405450.mikecrm.com/6sFqyrI
或 长按/扫描二维码报名:
3.2 缴费方式
方式 1:对公转账
户名:太原君泉教育咨询有限公司 账号:35117530000023891 (晋商银行股份有限公司太原南中环支行) 温馨提示: 对公转账时,请务必提供「汇款人姓名-单位」信息,以便确认。
方式 2:微信扫码支付
温馨提示: 微信转账时,请务必在「添加备注」栏填写「汇款人姓名-单位」信息。
4. 听课指南
4.1 软件和课件
听课软件:本次课程可以在手机,ipad ,平板以及 windows/Mac 系统的电脑上听课 (台式机除外)。
特别提示:
为保护讲师的知识产权和您的账户安全,系统会自动在您观看的视频中嵌入您的「用户名」信息。 一个账号绑定一个设备,且听课电脑不能外接显示屏,请大家提前准备好自己的听课设备。 本课程为虚拟产品,一经报名,不得退换。 为保护知识产权,课程不允许以任何形式录屏及传播。
4.2 实名制报名
本次课程实行实名参与,具体要求如下:
高校老师/同学报名时需要向连享会课程负责人 提供真实姓名,并附教师证/学生证图片; 研究所及其他单位报名需提供 能够证明姓名以及工作单位的证明; 报名即默认同意「连享会版权保护协议条款」。
5. 诚聘助教
说明和要求
名额: 9 名 任务: A. 课前准备:协助完成 2 篇推文,风格类似于 lianxh.cn ; B. 开课前答疑:协助学员安装课件和软件,在微信群中回答一些常见问题; C. 上课期间答疑:针对前一天学习的内容,在微信群中答疑 (8:00-9:00,19:00-22:00);参见 Note: 下午 5:30-6:00 的课后答疑由主讲教师负责。 要求: 热心、尽职,熟悉 Stata 的基本语法和常用命令,能对常见问题进行解答和记录。 特别说明: 往期按期完成任务的助教自动获得本期助教资格,不必填写申请资料,直接联系连老师即可。 截止时间: 2023 年 4 月 15 日 (将于 4 月 17 日公布遴选结果于连享会主页 lianxh.cn)。
申请链接: https://www.wjx.top/vj/OtcwrLF.aspx
或扫码填写助教申请资料:
课程主页: https://www.lianxh.cn/
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。