查看原文
其他

城市*年份联合的FE与他们分开的FE有什么区别? FE如何从一维进化到二维, 三维的?

计量经济圈 计量经济圈 2023-10-21
凡是搞计量经济的,都关注这个号了
邮箱:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
关于固定效应,参看:1.交互项! 交互项! 固定效应回归模型中的交互项!2.在Stata中如何做2SLS, DID, DEA, SFA, 面板PSM, 二值选择, 固定效应和时间序列?3.一定要控制时间固定效应吗?4.公司和个体固定效应总是更好吗? 关于固定效应使用和解释的最全指南!5.使用固定效应FE时良好做法对应的检查清单,6.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,7.快速估计带有高维固定效应的泊松模型, 这计算速度真快, 真实用!8.不能直接控制某个固定效应时, 我们能尽量做些什么呢?9.时间固定效应和时间趋势项的区别, 可以同时加?10.省份/行业固定效应与年份固定效应的交乘项固定效应,11.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,12.广义合成控制法gsynth, 基于交互固定效应的因果推断,13.固定效应模型+测量误差=有问题, 如何解决这问题呢?14.到底控制什么层面的固定效应? 最低, 最高, or随意?15.固定效应: 目前看到解释的最清楚的帖子, 救命!16.固定效应模型+测量误差=有问题, 如何解决这问题呢?17.TOP5被质疑用log(1+x)数据转换, 固定效应, 双重差分事件图, 结论不可靠!18.审稿人: 如何在双向固定效应下还能估计出不随个体变化的宏观变量呢?
关于控制交互固定效应,之前介绍过“①省份/行业固定效应与年份固定效应的交乘项固定效应”、“②关于控制交互固定效应的总结: 代码及示例托盘而出”和“③固定效应: 目前看到解释的最清楚的帖子, 救命”,今天再分享一下社群里关于交互固定效应使用的相关讨论以及关于不同维度固定效应意义的总结。
社群群友询问:“控制年份*城市的联合固定效应与分开控制年份和城市的固定效应有什么区别?”

下方是社群讨论的一个小截图。

关于不同维度固定效应意义的总结:

A.针对面板数据,我们通常采用固定效应来减轻不可观测因素对结果的影响。其中一维固定效应是常见的方法,包括但不限于:
  1. 个体固定效应:通过排除个体层面不受时间变化影响的不可观测因素(例如,个人性别、公司CEO特征),以减少其可能对结果造成的影响。

  2. 日期固定效应:用以缓解那些不随个体变化但会随着时间变化而发生变化的不可观测因素对估计结果的影响,比如节假日因素等。

B.随后,我们逐步将固定效应的维度提升至二维。例如:
  1. 个体-日期固定效应:用以控制个体层面随时间变化的不可观测因素对结果的影响,也就是这些不可观测因素同时随着个体和日期而变化。

  2. 行业-日期固定效应:用以控制行业层面随时间变化的不可观测因素对结果变量的影响,比如行业层面逐年变化的行业竞争程度。

  3. 省份-日期固定效应:用以控制省份层面随时间变化的不可观测因素对结果的影响,比如省份层面逐年变化的经济波动(不同省份不同年份肯定不同)。

    例如,以省份-日期固定效应为例,通过控制这组固定效应,我们能够从同一年同一个省内不同地级市之间获取关键解释变量系数δ的变异。这样识别出来的δ相比不控制这一组固定效应时更为准确,可以参考Wang(2013)在研究我国开发区经济效果的文章。
*当然,省份-年份固定效应就是用省份和年份一起来分组的,无论企业变动与否,都能完全分组,那么省份-年份可以以表出省份,也可以表出年份,所以控制了省份-年份就不用再控制省份和年份。
这意味着,一旦控制了省份-年份固定效应,就不再需要额外控制省份固定效应、年份固定效应。如果将省份-年份虚拟变量纳入模型后,再加入年份虚拟变量,会导致冗余,从而被自动剔除。同样,如果将省份虚拟变量加入模型,也会面临相同的情况。
下面三维固定效应也是同样的道理。
C.当前,我们正逐渐升级固定效应的维度,从二维逐步拓展至三维甚至更多维度。在模型中引入了高维度的固定效应:
  1. 城市-年份-周固定效应:用以控制城市层面随时间变化的不可观测因素,从而减轻那些随城市变化同时也会随时间变化(包括年、月和周)的不可观测因素对结果的影响。值得特别注意的是,相较于城市-年份-月份固定效应,城市-年份-周固定效应控制了更高阶的城市时变不可观测因素,因此通常是我们首选的固定效应。

  2. 城市-行业-年份固定效应:用以控制那些随着城市和行业变动,同时也会随着时间进行变化的不可观测因素对结果的影响。

这些高维度固定效应的引入使得我们能够更全面地理解并控制潜在的影响因素,从而提高模型的准确性和可靠性。
D.最后,目前许多研究不仅将标准误差聚类到城市层面,还采用了在城市和日期两个层面进行双重聚类(two clusters)的方法。这一做法将所有回归的标准误差同时聚类到城市和日期层面,旨在解决因序列相关而导致的原假设被过度拒绝的风险。参考:双重聚类cluster咋做? 线性, logit, tobit可以双聚类吗?

关于控制交互固定效应的总结: 代码及示例总结:


一些社群学术讨论:1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”,2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”,3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”,4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?,5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?7.回归中常数项显著说明模型中有遗漏变量问题?8.审稿人有义务告诉你回归中可能的遗漏变量么?9.针对很多实证问题的讨论, 随手保存的部分内容以飨学者,10.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,11.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,12.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,13.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,14.针对经济学领域中介效应模型问题的回应和理性讨论,15.讨论a(b)对b(a)的新方向论文, 经济学期刊分区问题, 3个机制存在时计量模型设计问题,16.如果解决了内生性, 那么是否意味着证实了变量之间的因果关系呢?17.解释变量提升一个标准差,被解释变量提升几个百分比呢?18.关于DID中对照组与处理组的比例问题?19.双重差分法和事件研究法的区别主要在哪里?20.双重差分法和事件研究法的区别主要在哪里?21.统计上不显著的变量表明该变量对结果变量没有影响吗?22.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?23.Heckman模型和工具变量IV之间的差异?24.被质疑: X与Y相关系数与回归系数截然相反, 你咋想的?25.审稿人质问: 通篇都基于OLS估计, 却把它放到稳健性检验或进一步讨论中!26.异质性和机制检验都用交互项做会被审稿人质疑么? 27.所有控制变量都不显著行不行呢?审稿人啥看法,28.审稿人: 实证论文必须先提出假说, 再依次进行实证检验么?

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

5年,计量经济圈近1500篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存