查看原文
其他

X与Y负相关但回归系数却为正? OLS不显著但2SLS却显著?

计量经济圈社群 计量经济圈 2022-10-02

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

前不久,社群讨论了1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”,2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”,3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”,4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?,5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?7.回归中常数项显著说明模型中有遗漏变量问题?8.审稿人有义务告诉你回归中可能的遗漏变量么?9.针对很多实证问题的讨论, 随手保存的部分内容以飨学者,10.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,11.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,12.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,13.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,14.针对经济学领域中介效应模型问题的回应和理性讨论,15.讨论a(b)对b(a)的新方向论文, 经济学期刊分区问题, 3个机制存在时计量模型设计问题,16.如果解决了内生性, 那么是否意味着证实了变量之间的因果关系呢?17.解释变量提升一个标准差,被解释变量提升几个百分比呢?18.关于DID中对照组与处理组的比例问题?19.双重差分法和事件研究法的区别主要在哪里?20.双重差分法和事件研究法的区别主要在哪里?21.统计上不显著的变量表明该变量对结果变量没有影响吗?22.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?23.Heckman模型和工具变量IV之间的差异?等等。这些讨论中有很多非常高质量的内容值得被记录起来,因此后面会形成一个计量圈社群讨论专栏

感谢社群群友的讨论,此处没有列出讨论群友。

今天,分享一下计量社群里关于几个问题的讨论。未必都有正确的答案,但其中的讨论能带给我们很多思考。

正文

Q1:X与Y不相关但在多元回归中系数却显著?

因果理论为两个变量如何无条件独立但有条件地依赖提供了另一种解释。下面看三个例子,看看在第三个变量加入进来后两个变量的关系如何发生改变了的。

A. 混杂因素:

X 和 Y 在双变量回归中相互依赖,但在控制了混杂因素 Z 的多元回归中保持独立。参看:1.因果推断专题:6.再谈混淆变量,2.审稿人, 中介变量能放到回归中去吗?那混淆变量, 不相关变量和对撞变量呢?3.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系,4.因果推断专题:1.混淆变量,5.confounder与collider啥区别? 混淆 vs 对撞
B. 对撞因素:

X 和 Y 在双变量回归中相互独立,但在控制了对撞因素 Z 的多变量回归中相互依赖。参看:1.confounder与collider啥区别? 混淆 vs 对撞,2.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系
C. 偶然取消Incidental cancellation:

X 和 Y 在双变量回归中相互独立,但在控制了混杂因素 Z 的多变量回归中相互依赖。

Q2:X与Y负相关但在多元回归中系数却正?


Q3:OLS不显著,2SLS显著,正常吗?
对于这个问题,大家都有类似的经历,在遇到不一致的情况,我们确实想知道发生了什么,以及如何解决这一问题。
首先,应该先讨论下核心解释变量是否真的存在内生性,例如,遗漏变量、测量误差、双向因果或同一性,
其次,讨论下2SLS中的工具变量是否真的合理,例如,满足相关性和外生性。
如果讨论都给出肯定答案了,那么,还是建议采用2SLS的结果。

关于显著或不显著结果,参看:1.常用的12种调变量显著性或调星星的方法,2.不显著能任性发顶刊!还津津有味地讨论不显著的实证结果!3.前沿, 终于有人解释为什么顶刊上很少有不显著的结果发表! 背后机理?4.回归中常数项显著说明模型中有遗漏变量问题?5.为什么回归系数不显著? 6.关于模型中变量选择的五个误区, 譬如不显著的变量需要剔除还是保留?7.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?8.添加一个新变量能使以前不显著的变量变得显著了?9.核心解释变量A不显著, 但加入变量B后, 为什么A和B都显著了?10.若系数回归结果不显著, 我们能够采取的方法和思路有哪些?11.结果不显著但成功发在Top期刊上的论文有哪些?你心虚过没?12.交互效应显著的几种情况, 列出了6种类型,13.交互项中主效应不显著, 交互项显著可怕吗? 14.统计显著与经济显著, 发AER和经济研究的标配,15.显著不显著的后背是什么, 非(半)参估计里解决内生性,16.试了几百次, 回归结果依然不显著, 到底咋办,17.科学家倡议P值需要0.005,显著性判断才成立,18.SSCI期刊竟公开征集“不显著的实证结果”的专刊文章!19.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?20.实证研究中的P值: 误解, 操纵及改进, 探析P值操纵表现及原因,提出相应的改进策略,21.AER强调计量方法的重要性, 经济学因果分析中的p值操纵和发表偏倚!


关于工具变量,参看1.内生性问题操作指南, 广为流传的22篇文章,2.看完顶级期刊文章后, 整理了内生性处理小册子,3.如何寻找工具变量?得工具者得实证计量,4.内生性处理的秘密武器-工具变量估,5.工具变量在社会科学因果推断中的应用,6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例,7.没有工具变量、断点和随机冲击,也可以推断归因,8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析,9.工具变量IV与内生性处理的精细解读,10.我的"工具变量"走丢了,寻找工具变量思路手册,11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性,12.豪斯曼, 拉姆齐检验,过度拟合,弱工具和过度识别,模型选择和重抽样问题,13.工具变量先锋 Sargan,供参考,14.AEA期刊的IV靠不靠谱?15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom,16.GMM是IV、2SLS、GLS、ML的统领,待我慢慢道来,17.IV和GMM相关估计步骤,内生性、异方差性等检验方法,18.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?19.内生变量的交互项如何寻工具变量, 交互项共线咋办,20.面板数据、工具变量选择和HAUSMAN检验的若干问题,21.IV和Matching老矣, “弹性联合似然法”成新趋势,22.IV回归系数比OLS大很多咋回事, 怎么办呢? ,23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献,24.找不到IV, RD和DID该怎么办? 这有一种备选方法,25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,26.内生性, 工具变量与 GMM估计, 程序code附,27.GMM和工具变量在面板数据中的运用,28.关于工具变量的材料包, 标题,模型,内生变量,工具变量,29.必须使用所有外生变量作为工具变量吗?30.工具变量精辟解释, 保证你一辈子都忘不了,31.毛咕噜论文中一些有趣的工具变量!33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!35.关于顶级外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计!36.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!38.最清晰的内生性问题详解及软件操作方案!实证研究必备工具!39.中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差41.内生性处理的秘密武器-工具变量估计42.工具变量IV必读文章20篇, 因果识别就靠他了43.看完顶级期刊文章后, 整理了内生性处理小册子44.“内生性” 到底是什么鬼? New Yorker告诉你,45.Heckman两步法的内生性问题(IV-Heckman),46.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题47.非线性面板模型中内生性解决方案48.内生性处理方法与进展49.内生性问题和倾向得分匹配50.你的内生性解决方式out, ERM独领风骚51.面板数据是怎样处理内生性的52.计量分析中的内生性问题综述53.一份改变实证研究的内生性处理思维导图54.Top期刊里不同来源内生性处理方法55.面板数据中heckman方法和程序(xtheckman),56.控制函数法CF, 处理内生性的广义方法57.二值选择模型内生性检验方法58.2SRI还是2SPS, 内生性问题的二阶段CF法实现59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,61.如何选择合适的工具变量, 基于既有文献的总结和解释!62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!63.弱工具变量的稳健性检验, 附上code和相关说明!64.工具变量对因果效应的识别和外推, 大牛的顶级评述!65.刚2022年, Acemoglu就在QJE上发文了!OLS+IV走遍天下都不怕!66.如何在AER上用OLS发经济史研究, 这篇道出了验证IV合理性的标准范式! 必读,67.怎样找到一个巧妙的工具变量, IV在公共政策评估中的应用,68.Bartik工具变量是什么? 份额移动法IV应用越来越多,69.阿西莫格鲁又一篇使用IV做因果推断的经典文献, 拿起小板凳一睹为快!70.AER教你两种论证IV合理性的实证策略, 以及如何对IV做安慰剂检验,71.我们应该在多大程度上相信工具变量估计, 基于63份顶刊复制结果的操作建议


下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存