查看原文
其他

为何以墨西哥为例比挪威发表要难? R²是有用还是危险?

计量经济圈 计量经济圈 2023-08-07

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

① 为什么以墨西哥为例比挪威要难?

Dina D. Pomeranz(获哈佛经济学博士)被认为是瑞士最有影响力的经济学家之一。近日,她提出的一个与学术研究相关的犀利问题,引起了很多来自经济学者的关注和讨论。

Dina D. Pomeranz,像“在高收入国家X对Y的影响,以比利时为例”这样的论文标题,不觉得听起来奇怪吗?比利时只有1100万人口,为什么以比利时为例就能够得到那些一般兴趣主题的期刊的偏爱呢?
比利时的例子是否能够一般化到其他高收入国家?就算能一般化到其他高收入国家,那问题在于我们全球仅有16%的人口居住在高收入国家,难道就忽视了那84%的其他国家么?
现实中,如果以高收入国家以外的其他地区作为研究对象,我们就被要求将其结论一般化到其他84%的全球范围(即,中低收入国家)才能与一般兴趣主题的期刊scope相关,这不是故意为难中低收入国家学者的研究么?
真正的情况是,高收入国家是例外,而大多数中低收入国家才是一般化群体。遗憾的是,高收入国家却被视为常态,而世界其他地方则被视为具有同质性特征的例外情况。
Rafael R. Guthmann认为,这是因为超过90%在英语期刊上发表论文的经济学家居住在高收入国家。高收入国家构成一个独特的世界,曾被称为“第一世界”,而且出生在这些国家的人不太可能搬到低收入国家。
Eva O. Arceo-Gomez认为,噢!而且说服审稿人论文的相关性真的很难!我的意思是,墨西哥的人口是挪威的数倍,然而发表一篇关于墨西哥儿童处罚的论文要难得多!
Karthik Tadepalli认为,一个很好的标准,是我们的研究应该在一定程度上能够一般化到其他情境,所以,在理论上反而应该淘汰掉许多以富裕世界为背景的研究。

Mauricio Dussauge抱怨道,“为什么墨西哥是一个相关的案例?”,这是在提交给主流期刊后常见的问题。这些期刊在墨西哥相关主题上没有发表过任何文章…撇开公平的研究设计问题不谈,有关富裕民主国家的研究偏好仍然存在且丝毫不减…

② R²是有用还是危险?

R²,又称判决系数,是广泛使用的拟合度量,但对于许多研究者来说,它只是一个数字。

他们认为高R² ➡ 好的预测。
但这并不总是正确的!
R²衡量回归模型与观测数据的拟合程度。
R²,衡量因变量的变异有多少可以由回归模型中的自变量解释。
通常范围从0到1:(在少数情况下可能为负数)
R² = 0,模型不解释因变量的任何变异 ➡ 没有预测能力 ➡ 差模型。
R² = 1,模型完美地解释了因变量的所有变异 ➡ 对数据的拟合完美 ➡ 如果没有过度拟合且具有预测能力,则为好模型。
那么,R²是有用还是危险?
R²有用吗?当然有!R²让我们了解模型在解释数据变异方面的表现。较高的值表明模型能够解释很多变异,但这并不是评判“好”模型的唯一标准。
但高R²并不总是意味着更好!复杂模型可能因为对数据过度拟合而有较高的R²值。
R²危险吗?有潜在风险。盲目依赖R²可能导致误导。如果我们只追求高R²,可能会陷入包含无关变量的陷阱,从而使模型变得复杂化并有可能失效。
请记住:在模型中增加更多变量,就算不考虑它们的实际相关性,R²也会增加。这可能导致产生更好模型的错觉,实际上可能是过度拟合。
另一个陷阱?直接比较不同模型的R²值而不考虑背景。例如,在某些学科或情境中,较低的R²值仍然具有意义。
总之:与任何统计指标一样,R²既有强大之处,也有危险之处。它是一种工具,就像任何工具一样,其价值取决于如何使用它。
主要观点?始终将R²与其他统计数据和诊断结果一起使用,最重要的是要运用领域知识和批判性思维。

一些免费的计量课程:1.免费4门课程, 因果推断1和2, IV, 份额移动IV和高级DID, 附数据,代码,讲义和阅读清单,2疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,3.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!4.真实!MIT提供免费的机器学习课程, 13周的高质量内容,5.哈佛“数据科学导论”课程对所有人免费开放!包括机器学习和回归分析等各种方法!6.耶鲁开设“应用实证方法”P.hd课程, 强逻辑, 好文献, 重实操, 真前沿, 送slides和笔记!7.免费!精选中国高校开设的Python和计量经济学课程!8.全面且前沿的因果推断课程, 提供视频, 课件, 书籍和经典文献,9.DID, IV, SCM, RDD, Matching因果推断免费课程和最全功夫集锦, 再附上数据和代码!10.MIT斯隆商学院研究生课程对国内免费开放, 在家就能学习世界一流商学院的课程!11.MIT经济系50门开放课程对中国学者开放, 包括计量经济学等各类经济学课程!12.从入门到进阶的Python数据分析手册, 课程内容完全免费!13.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!14.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收,15.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

5年,计量经济圈近1500篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据

计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID

数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |

干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验

计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存