基本无害的计量经济学
——实证研究者指南
(重译本)
第三章 使回归有意义
第一节 回归的基本原理
正文共4485个字,预计阅读时间12分钟。感谢阅读!
文中若有长公式,可通过左右上下滑动完整查看!
原文:3.1.3
(图中文字:个体层面数据 根据受教育年限计算的均值)
图3.1.3 学校教育回报的微观数据和分组数据估计值,来自Stata回归输出结果。资料来源:1980年人口普查- IPUMS中5%的样本。该样本包括40-49岁的白人男性。稳健标准误差是异方差一致的。图中A部分使用个体层面的微观数据。B部分使用的是按受教育年限计算的平均收入。
假设向量 在大小为 的样本中独立同分布。一阶总体矩的自然估计量 是 。根据大数定律,随着样本容量的增加,这个样本矩向量无限地接近于相应的总体矩向量。我们同样可以考虑 元素的高阶矩,例如二阶矩矩阵 ,样本模拟值 。根据这一原理, 的矩估计方法用求和算子代替了每个期望算子。这个逻辑引出了普通最小二乘(OLS)估计量:
虽然我们推导的是一种矩估计方法,但它被称为 的OLS估计量,因为它求解了第3.1.2节开始描述的最小二乘问题的样本模拟值。
如前所述,其中残差 定义为因变量与总体回归函数的差值。换句话说, 是 和 的结果,而不是关于潜在经济关系的假设。[5]
的渐近协方差矩阵化简为
除非你另有要求,否则(3.1.8)的对角线元素就是SAS或Stata报告的内容。
因此,即使 是不变的,残差方差随着回归线和CEF之间差值的平方而增加,这是White (1980b)指出的事实。[6]
如果回归元是非随机的(在重复样本中是固定的),则这个期望值就是我们想要的,而且由于 ,我们可以取得无偏性。否则,在具有随机回归元的情况下,我们基于迭代期望法则,当 时,也可以得到无偏性。当CEF是线性的时候是这样,但在我们更一般的“不可知论回归(agnostic regression)”框架中则不是这样。
本节对渐近OLS推论的讨论主要是对Chamberlain(1984)的相关内容的浓缩。最后一章讨论了渐近理论的重要缺陷和问题。
[2]二次型是矩阵加权平方和。假设是一个向量,是一个矩阵。的二次型是。如果是一个对角矩阵,其对角元素为,则。
[3]使用Slutsky和连续映射定理推导delta方法公式,参见Knight2000,第120-121页。我们说“)的渐近分布”,其实我们指的是的渐近分布。
[4]当一个估计量在概率上收敛于目标参数时,我们称它是一致的。
[5]这样定义的残差并不一定与无关;对于均值独立性,我们需要一个线性CEF。
[6]由(3.1.9)中间的平方项展开得到的叉乘项是零,因为是不依赖于的均值。
本专栏主理人简介
企研数据学术顾问 · 李井奎
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
文 | 《基本无害的计量经济学——实证研究者指南(重译本)》
翻译 | 李井奎
校对 | 陈泽 王锐
排版 | 彭绮荣