查看原文
其他

主回归不显著, 分组回归却异常显著的研究来了!

计量圈社群 计量经济圈 2023-10-21

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

之前,我们分享过“主回归不显著, 分组回归却异常显著, 还有必要进行下去么?

在里面,计量社群群友提出一个非常常见的实证问题:主回归(全样本)不显著,但分组回归系数显著,他这里还是一正一负,问还有必要进行下去吗?

看到这样的情况,很多青年学者可能会感到一脸困惑,觉得既然基准回归(全样本回归)都不显著,那就没有开展进一步分析的必要,进而否定了该研究的可行性。
不过,在看到此种情况后,也有许多学者在其内在好奇心驱动下会做进一步的探索,从而破解这一让人困惑的回归结果。
一些群友认为,模型的设定和应用具有灵活性,回归结果不可怕,关键在于如何解释回归的结果及其合理性。有可能是两个分组数据的属性恰好相反,将它们合并后可能相互抵消,从而使得主回归不再显著。

这不,在最近,社群群友分享了一篇经济学季刊上的文章,里面基准回归和样本选择偏差及其他稳健性检验都一致显示:全部样本中核心变量系数不显著,而在分样本中回归系数显著且一正一负。

表4报告了模型(1) 的检验结果。第(1)—(2) 列为全样本回归结果,无论是否加入控制变量,Integrate 的系数均为正,但统计上不显著。这说明,产融结合总体上对企业创新的作用效果并不明确。第(3)—(4) 列为国有子样本的回归结果。第(3) 列未加入控制变量时,Integrate 的系数为-0.215,且在5%的水平上显著。第(4) 列加入控制变量后,Integrate 系数为-0.242,且依然在5%的水平上显著。这说明国有企业通过产融结合并未提高创新水平,反而带来创新水平的下降。在国有企业中,产融结合更多的是一种“资源诅咒”,而非“资源协同”。就国有企业创新而言, 资源“多”未必比“少”好。第(5)—(6)列为非国有子样本的回归结果。第(5)列未加入控制变量时,Integrate 的系数为0.231,且在1%的水平上显著。第(6)列加入控制变量后,Integrate 系数为0.175,且依然在5%的水平上显著。就非国有企业而言,产融结合更多地发挥“资源协同效应”,促进了非国有企业的技术创新。

本文的样本选择可能存在偏差,是否参股非上市银行与公司特征也可能存在内生性关系,故而我们采用处理效应模型进行稳健性检验。此外,我们还用创新的替代标量、产融结合的替代变量及其他估计策略进行了稳健性检验。

我们使用处理效应模型解决上文可能存在的样本自选择问题(Maddala,1983)。第一阶段为公司是否参股非上市银行的选择方程,选取与上市公司处于同一行业的其他上市公司上一年度是否参股银行的平均值作为工具变量,使用Probit模型估算出公司进行产融结合的概率,并根据结果计算出产融结合公司与非产融结合公司的逆米尔斯值,并代入第二阶段的检验方程中。

田利辉,王可第,马静等.产融结合对企业创新的影响:资源协同还是资源诅咒?[J].经济学(季刊),2022,22(06):1891-1912.

下方是社群群友的一些讨论的截图,可以参看一下:
有意思的实证计量讨论帖, 熬夜肝完了一直的计量困惑!QA: 平方项的IV, 加时间固定符号相反, 滚动窗口回归, 面板分位数输出图, 机制分析中IV, pre5显著咋办

一些社群学术讨论:1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”,2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”,3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”,4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?,5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?7.回归中常数项显著说明模型中有遗漏变量问题?8.审稿人有义务告诉你回归中可能的遗漏变量么?9.针对很多实证问题的讨论, 随手保存的部分内容以飨学者,10.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,11.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,12.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,13.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,14.针对经济学领域中介效应模型问题的回应和理性讨论,15.讨论a(b)对b(a)的新方向论文, 经济学期刊分区问题, 3个机制存在时计量模型设计问题,16.如果解决了内生性, 那么是否意味着证实了变量之间的因果关系呢?17.解释变量提升一个标准差,被解释变量提升几个百分比呢?18.关于DID中对照组与处理组的比例问题?19.双重差分法和事件研究法的区别主要在哪里?20.双重差分法和事件研究法的区别主要在哪里?21.统计上不显著的变量表明该变量对结果变量没有影响吗?22.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?23.Heckman模型和工具变量IV之间的差异?24.被质疑: X与Y相关系数与回归系数截然相反, 你咋想的?25.审稿人质问: 通篇都基于OLS估计, 却把它放到稳健性检验或进一步讨论中!26.异质性和机制检验都用交互项做会被审稿人质疑么? 27.所有控制变量都不显著行不行呢?审稿人啥看法,28.审稿人: 实证论文必须先提出假说, 再依次进行实证检验么?29.审稿人: 如何在双向固定效应下还能估计出不随个体变化的宏观变量呢?30.为啥我看到面板数据中可以估计出性别, 民族虚拟变量? 还是国内权威期刊


一些免费的计量课程:1.免费4门课程, 因果推断1和2, IV, 份额移动IV和高级DID, 附数据,代码,讲义和阅读清单,2疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,3.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!4.真实!MIT提供免费的机器学习课程, 13周的高质量内容,5.哈佛“数据科学导论”课程对所有人免费开放!包括机器学习和回归分析等各种方法!6.耶鲁开设“应用实证方法”P.hd课程, 强逻辑, 好文献, 重实操, 真前沿, 送slides和笔记!7.免费!精选中国高校开设的Python和计量经济学课程!8.全面且前沿的因果推断课程, 提供视频, 课件, 书籍和经典文献,9.DID, IV, SCM, RDD, Matching因果推断免费课程和最全功夫集锦, 再附上数据和代码!10.MIT斯隆商学院研究生课程对国内免费开放, 在家就能学习世界一流商学院的课程!11.MIT经济系50门开放课程对中国学者开放, 包括计量经济学等各类经济学课程!12.从入门到进阶的Python数据分析手册, 课程内容完全免费!13.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!14.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收,15.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!


下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

5年,计量经济圈近1500篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据

计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID

数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |

干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验

计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存