查看原文
其他

基本无害 | 使回归有意义——基本原理(4)

基本无害的 数据Seminar 2022-12-31

基本无害的计量经济学

——实证研究者指南

(重译本)

李井奎 译


第三章 使回归有意义

第一节 回归的基本原理




正文共2041个字,预计阅读时间6分钟。感谢阅读!

文中若有长公式,可通过左右上下滑动完整查看!

原文:3.1.4




3.1.1 经济关系与条件期望函数

3.1.2 线性回归与条件期望函数

3.1.3  渐近OLS推断

3.1.4  饱和模型、主效应和其他回归讨论

我们经常使用饱和主效应等术语来讨论回归模型。这些术语源自使用回归来模拟离散处理型变量效应的实验主义传统。然而,这种语言现在被更广泛地应用于许多领域,包括应用计量经济学。对于不熟悉这些术语的读者,本节提供了一个简要的回顾。
饱和回归模型是只含有离散解释变量的回归模型,对于解释变量所取的所有可能值,该模型均纳入一个单独的参数。例如,当使用单个解释变量表明一个工人是否大学毕业时,模型由于包含了一个是否大学毕业的虚拟变量和一个常数而饱和。当回归变量具有多个值时,我们也可以达到饱和。例如,假设 的饱和回归模型为:

其中, 为表示受教育程度 的虚拟变量, 为第 级受教育程度的效应。[1] 请注意,

。在实践中,你可以为参考组(reference group)选取 的任何值;在 中,只要对每个可能的 有一个参数,回归模型就是饱和的。饱和回归模型完美地拟合了CEF,因为CEF是用于饱和的虚拟回归变量的线性函数。这是线性CEF定理的一个重要特例。

如果有两个解释变量——比如,一个虚拟变量表示是否大学毕业,一个虚拟变量表示性别——模型通过包含这两个虚拟变量、它们的乘积和一个常数而饱和。这些虚拟变量的系数称为主效应,而乘积称为交互项。这不是唯一的饱和参数化;任何一组可以用来识别所有协变量每个取值的指标(虚拟变量)都会产生一个饱和模型。例如,另一个饱和模型可以是包括男性大学毕业生、男性非大学毕业生、女性大学毕业生和女性非大学毕业生的虚拟变量,但没有截距项。
这里给出一些更具体的符号。 表示大学毕业生, 表示女性。给定 的CEF有四个值:
我们可以使用以下方案来标记它们:
因为有四个希腊字母,而CEF有四个值,这个参数化并不对CEF产生限制。它可以用希腊字母写成:

这是具有两个主效应和一个交互项的参数化。[2] 其饱和回归方程为:

我们可以将多值受教育年限变量与性别虚拟变量相结合,产生一个饱和模型,该模型对受教育年限有 个主效应,对性别有一个主效应,对性别与受教育年限的交互项有 个主效应:

相互作用项的系数 告诉我们,每一受教育年限效应在性别上是如何不同的。在这种情况下,CEF取 个值,而回归也有这么多参数。

请注意,在上层的饱和模型会随着不断增加的限制性模型化策略而产生层级问题。从饱和模型开始是很自然的,因为它拟合了CEF。另一方面,饱和模型产生了大量的交互项,其中许多项可能是无意义的或估计不精确的。因此,你可以明智地选择省略这些项中的一部分或全部。方程(3.1.10)在没有交互项的情况下,用受教育年限和性别的纯相加模型近似CEF。如果男性和女性上大学的回报相似,这会是一个很好的近似值。如第3.3.1节所述,在每一情况下,这种可加性设定中受教育年限的系数都给出了两性的(加权)平均回报。另一方面,估计一个包含交互项但忽略了相应的主效应的模型是很奇怪的。就受教育年限而言,这有点像:

这种模型只允许受教育年限改变女性的工资,而这与事实相去甚远。因此,估计(3.1.11)得到的结果很可能难以解释。

最后,重要的是要认识到,无论 的分布如何,饱和模型都能完美地拟合CEF。例如,对于线性概率模型和其他受限因变量模型(如非负 )来说,这是正确的,这一点我们将在本章的最后重新讨论。

注释

[1]

我们使用符号1来表示指示函数,在本例中,该函数在时创建一个表示该种状态的虚拟变量。

[2]

由于模型中有第三个虚拟变量,例如,所以饱和模型包括三个主要效应、三个二阶交互项和一个三阶项。



本专栏主理人简介

企研数据学术顾问 · 李井奎


李井奎,1978年1月生,浙江工商大学经济学院教授、博士生导师,哈佛大学访问学者,以教书育人和传播学问为己任,曾获浙江省“高校优秀教师”称号。除学术论文写作之外,还著有《大侦探经济学:现代经济学的因果推断革命》等科普著作。





星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧

往期推荐


数据治理 | 地址数据可视化—教你如何绘制地理散点图和热力图

数据治理 | 根据地址获取经纬度及行政区划——API的妙用

数据治理 | 工企地址清洗——Python的妙用

数据治理 | 数据量越来越大,Stata总奔溃?看来……

基本无害 | 使回归有意义——基本原理(3)

基本无害 | 使回归有意义——基本原理(2)

基本无害 | 使回归有意义——基本原理(1)






数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


文 | 《基本无害的计量经济学——实证研究者指南(重译本)》

翻译 | 李井奎

校对 | 陈泽 王锐

排版 | 彭绮荣


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存