查看原文
其他

回归标准误比R2更好,在拟合优度度量方面

计量经济圈社群 计量经济圈 2021-10-23

凡是搞计量经济的,都关注这个号了

投稿:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

前些日,咱们引荐了实证研究中用到的200篇文章, 社科学者常备toolkit”、实证文章写作常用到的50篇名家经验帖, 学者必读系列过去10年AER上关于中国主题的Articles专辑AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向2020年中文Top期刊重点选题方向, 写论文就写这些。后面,咱们又引荐了使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑!这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授Python, Stata, R软件史上最全快捷键合辑!关于(模糊)断点回归设计的100篇精选Articles专辑!关于双重差分法DID的32篇精选Articles专辑!关于合成控制法SCM的33篇精选Articles专辑!最近80篇关于中国国际贸易领域papers合辑!最近70篇关于中国环境生态的经济学papers合辑!使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑!最近50篇使用系统GMM开展实证研究的papers合辑!这些文章受到了各位学者的欢迎和热议,博士生导师纷纷将其推荐给学生参阅。

最近,我们引荐了①如何选择正确的自变量(控制变量),让你的计量模型不再肮脏,②忽略交互效应后果很严重,审稿人很生气!,③过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图,④空间双重差分法(spatial DID)最新实证papers合辑,机器学习方法出现在AER, JPE, QJE等顶刊上了,⑥中介效应检验流程, 示意图公布, 不再畏惧中介分析等,在学者间引起了广泛的讨论。

正文

R平方过高的五个原因

当你的回归模型具有较高的R平方时,你会认为这是一件好事。你想要高R平方,对不对?但是,正如我在这篇文章中将要展示的那样,高R平方有时可能表明你的模型有问题。我将解释为什么R平方过高的五个原因,以及如何确定其中一个因素是否会影响你的回归模型。
R平方并不像看起来那样直观。较小的R平方值并不总是一个问题,而较高的R平方值不一定是好的!“R平方应该有多高”是一个错误的问题。而且,在某些情况下,我认为回归的标准误是一种更好的拟合优度度量。
以下五个原因并不是完整列表,但它们是最常见的解释。

原因1:R平方是有偏估计

这对你来说是一个潜在的惊喜。回归输出中的R平方值倾向于过高。从样本计算时,R2是有偏估计量。在统计中,有偏估计是系统地高于或低于总体值的估计。R平方估计值往往大于正确的总体值。此偏压使得一些研究者避免使用R2而用调整后的R2代替。
统计人员早就知道,线性回归方法会因样本中存在的偶然相关性而跳闸,这会导致R2膨胀。
如果你的浴室秤读数太高,则应将其向下调整,以使其平均显示正确的重量。调整后的R平方恰好与R2值相同。调整后的R平方会减小R平方的值,直到它成为总体值的无偏估计为止。统计学家将此称为R平方收缩。
为了确定正确的收缩量,将样本量与模型中的项数进行比较。
下图显示了根据每个项的样本数量所需的收缩量。

原因2:过拟合模型

过度拟合模型是统计模型开始描述数据中的随机误差,而非变量之间的关系的情形。当模型过于复杂时,会发生此类问题。不幸的是,过拟合模型的症状之一是R平方值过高。
尽管R2看起来不错,但过拟合模型可能会出现严重问题。一方面, 回归系数代表噪声,而不是总体中的真实关系。此外,过度拟合回归模型是为适应一个样本的随机怪癖而量身定制的,不太可能与另一个样本的随机怪癖匹配。因此,过度拟合回归模型会降低其在原始数据集之外的通用性。
调整后的R平方不是为了检测过度拟合而设计的,但预测的R平方可以。

原因3:数据挖掘和机会关联

数据挖掘是拟合许多不同模型,尝试许多不同自变量,并且主要使用统计显著性来构建最终模型的过程,而不受理论指导。这个过程引入了许多问题,包括误导系数和夸大的R平方值。
对于所有假设检验,包括回归系数的检验,总有机会拒绝实际上是真的零假设(I类错误)。错误率等于你的显著性水平,通常为5%。
让我们将其应用于回归分析。当你拟合多个模型时,你将对所有系数执行许多假设检验。实际上,如果你使用[逐步建模或最佳子集回归之类的自动化模型构建程序,则可能会对样本执行数百(如果不是数千)假设检验。通过如此多的测试,你不可避免地会遇到误报。如果主要根据统计显著性来指导,则你会将这些变量保留在模型中。
这个问题有多严重?数据挖掘可以从随机生成的数据中产生具有统计显著性的变量和较高的R2!通常,你无法使用统计过程检测到这些问题,并且最终模型可能不会过拟合。通常没有明显的问题迹象。所以你会怎么做?
答案在于开始学习之前进行主题领域研究。这项研究可帮助你减少适合的模型数量,并使你将结果与理论进行比较。

原因4:面板(时间序列)数据趋势

如果你有面板数据,并且因变量和自变量都具有随时间变化的趋势,则这会产生膨胀的R平方值。尝试进行时间序列分析,或在回归模型中包括与时间相关的自变量。例如,尝试滞后和差分变量。

原因5:变量的形式

如果因变量和自变量都包括同一变量的不同形式,则将获得人为夸大的R平方。
例如,如果因变量是摄氏温度,并且你的模型包含不同比例的温度自变量,则你的R2接近100%。这是一个明显的例子,但是它还有更多的细微形式。例如,如果因变量是贫困率而自变量之一是收入,则可以期望R2值会升高。贫困率由收入定义。
source: https://statisticsbyjim.com

拓展性阅读

2月21日,给各位学者引荐了二个数据库的使用指南疫情期Wind资讯金融终端操作指南CEIC数据库操作指南,参考一下“清华北大经管社科数据库有哪些? 不要羡慕嫉妒恨!。2月22日,引荐了“估计具有两个高维固定效应的泊松回归模型”,里面包括面板泊松回归、面板负二项回归、控制函数法CF、受限三次样条等等。2月27日,引荐了“哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code!”和“最清晰的内生性问题详解及软件操作方案!实证研究必备工具!
之前,咱们圈子引荐过一些数据库(当然,社群里的数据库远不止这些),如下:1.这40个微观数据库够你博士毕业了2.中国工业企业数据库匹配160大步骤的完整程序和相应数据3.中国省/地级市夜间灯光数据4.1997-2014中国市场化指数权威版本5.1998-2016年中国地级市年均PM2.56.计量经济圈经济社会等数据库合集7.中国方言,官员, 行政审批和省长数据库开放8.2005-2015中国分省分行业CO2数据9.国际贸易研究中的数据演进与当代问题10.经济学研究常用中国微观数据手册

之前,咱们小组引荐了1.DID运用经典文献,强制性许可:来自对敌贸易法的证据2.连续DID经典文献, 土豆成就了旧世界的文明3.截面数据DID讲述, 截面做双重差分政策评估的范式4.RDD经典文献, RDD模型有效性稳健性检验5.事件研究法用于DID的经典文献"环境规制"论文数据和程序6.广义DID方法运用得非常经典的JHE文献7.DID的经典文献"强制许可"论文数据和do程序8.传销活动对经济发展影响, AER上截面数据分析经典文9.多期DID的经典文献big bad banks数据和do文件10.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?11.AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章12.第二篇因果推断经典,工作中断对工人随后生产效率的影响?13.密度经济学:来自柏林墙的自然实验, 最佳Econometrica论文14.AER上以DID, DDD为识别策略的劳动和健康经济学15.一个使用截面数据的政策评估方法, 也可以发AER,16.多期DID模型的经典文献,big bad banks讲解",",17.多期DID的经典文献big bad banks数据和do文件18.非线性DID, 双重变换模型CIC, 分位数DID,受到博士生导师普遍欢迎,并分享给其指导的学生学习。

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2年,计量经济圈公众号近1000篇文章,

Econometrics Circle




数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 |

计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 

数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |


干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 |

计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存