被质疑: X与Y相关系数与回归系数截然相反, 你咋想的?
凡是搞计量经济的,都关注这个号了
邮箱:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
对于这种情况,我们应该怎么办呢?
当然,必须承认的是,很多经济学实证研究中并不要求汇报相关系数;但也有一些期刊希望作者汇报在不控制任何变量的情况下X对Y的回归系数(相关系数)。
首先,要明确的是学者通过Tabluation表或Two way图展示X与Y之间存在正向或负向关系,但X对Y的影响是正还是负,我们仍然没有定论,因为虚假回归可能混淆学者的视线和判断。
那么,不免再次发问:对于这种相关系数与回归系数相反的情况,该怎么办呢?
审稿人不要求汇报相关系数还好,若要求汇报X与Y两者间的相关系数,那该如何是好?
针对这一问题,社群群友讨论了很多次(例如,X与Y负相关但回归系数却为正? OLS不显著但2SLS却显著?),有的说调一调数据,例如缩尾以剔除异常值,有的说通过VIF检查共线性问题,有的说看看控制变量有没有bad control问题,有的说直接汇报做出来的结果,以回归而非相关系数为准,不过要解释一下为什么会出现符号相反的情况。
最近,针对这一问题,社群群友分享了一篇发表在管理学TOP刊Strategic Management Journal上的文章(Emerging market firms' internationalization: how do firms' inward activities affect their outward activities?)。
他指出该篇文章就出现了相关系数为正,回归系数为负数的情况,但作者却将此反常现象作为一次秀创造力的机会。
作者认为,从X到Y的影响路径很多,有的可能为正向路径,而有的可能为负向路径,但最终可能是负向路径超过了正向路径,从而造成了X对Y的负向影响(审稿人: 能不能同时搞点X-Y的正向和负向影响机制?)。
下图显示两者回归系数显著为正。
接下来,关于X与Y的回归系数皆显著为负数。
4年,计量经济圈近1500篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle
数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 | 内部数据计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。