基本无害 | 使回归有意义——基本原理(1)
基本无害的计量经济学
——实证研究者指南
(重译本)
第三章 使回归有意义第一节 回归的基本原理
正文共3347个字,预计阅读时间10分钟。感谢阅读!
原文:3.1.1
“思考不可能性,做做不到的事。抓住无法言喻的想法,或许并不会把一切搞砸。”
——道格拉斯·亚当斯,《全能侦探社》
1979年夏天,我在奥柏林学院读大一到大二期间,运行了人生第一次回归。在匹兹堡我家附近的卡内基-梅隆大学,我为艾伦·梅尔泽(Allan Meltzer)和斯科特·理查德(Scott Richard)做研究助理。我最感兴趣的还是从事特殊教育的工作,并计划回到州立精神病院做护理员,这是我上一份暑期工作。但经济学101启发了我的思考,我还发现,在相同的工资水平下,研究助理的工作时间和工作条件都比医院护理员好。我的研究助理职责包括数据收集和回归分析,虽然当时我对回归甚至统计学都不了解。
那年夏天我做助理时的那篇论文(Meltzer和Richard, 1983)试图将民主国家的政府规模(以政府支出占GDP的比例衡量)与收入不平等联系起来。大多数收入分布都有一个很长的右尾,这意味着平均收入往往高于中位数。当不平等加剧时,更多的选民发现自己的收入低于平均水平。因为对此感到恼火,那些收入在中位数和平均值之间的人可能会加入到那些收入低于中位数水平的人的行列,投票支持劫富济贫的财政政策。政府的规模由此而扩大。
我理解梅尔泽和理查德这项研究背后的基本理论,尽管我觉得它不那么可信,因为穷人的投票率很低。我还记得,我和我的两位老板争论的问题是,政府在教育方面的支出是应该被归为公共产品(既能让社会上的每个人受益,也能让那些直接受影响的人受益),还是归为公共供应的私人产品,从而成为一种像福利一样的再分配形式呢?你可能会说,这个项目标志着我开始对教育的社会回报感兴趣,在Acemoglu和Angrist(2000)中,我带着更多的热情和理解回到了这个话题。
今天,我把梅尔泽和理查德的研究理解为使用回归来揭示和量化那有趣因果关系的一种尝试。但在那时,我只是一个纯粹的回归机器。有时候我觉得研究助理的工作令人沮丧。日子一天天过去,除了我的老板和偶尔来的大多数几乎不说英语的卡内基-梅隆大学的博士生,我无人可以说话。这份工作最精彩的部分是和艾伦·梅尔泽共进午餐,他是一位杰出的学者,也是一位耐心、和善的导师。我们一边吃着棕色袋子里的东西,他一边开心地聊天(这没花多长时间,因为艾伦吃得很少,而我吃得很快)。有一次我问艾伦,把他的时间耗费在研究呈现于大量双宽绿条纸上的回归结果,他是否感到满足。梅尔泽笑了,说除了这些他什么也不想做。
3.1 回归的基本原理
3.1.1 经济关系与条件期望函数
如果是离散的,CEF等于 ,其中 是在 条件下的条件概率质量函数。
图3.1.1 受教育年限下周工资对数的原始数据和条件期望函数。该样本包括1980年世界人口微观共享数据库(IPUMS)中5%的40-49岁的白人男性。
其中处在外面的期望使用的是 的分布。这里给出了联合密度为 的连续分布 的期望迭代法则,其中 为 在 条件下的条件分布, 和 为边缘密度函数:
这个推导过程是对 和 (以 和 为标识)的可能值进行积分。我们列出这些步骤是因为CEF及其性质是本章其余部分的中心内容。[2]
其中(1)均值独立于,也即,因此有(2)与的任何函数都不相关。
所以,它是给定时的最佳预测器。
第一项不重要,因为它不包含,第二项可以写成,其中。根据CEF分解性质,其期望为零,因此当是CEF时,最后一项在0处最小。
其中表示方差,是给定时的条件方差。
其中,因为。
注释
使用“总体优先”方法进行计量经济学教科书写作的例子有:Chamberlain(1984),Goldberger(1991)和 Manski(1991)。
[2]一个简单的例子即可说明期望迭代法则是如何工作的:男性和女性人口的平均收入是男性的平均收入乘以男性在人口中的比例,加上女性的平均收入乘以女性在人口中的比例。
本专栏主理人简介
企研数据学术顾问 · 李井奎
李井奎,1978年1月生,浙江工商大学经济学院教授、博士生导师,哈佛大学访问学者,以教书育人和传播学问为己任,曾获浙江省“高校优秀教师”称号。除学术论文写作之外,还著有《大侦探经济学:现代经济学的因果推断革命》等科普著作。
星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
文 | 《基本无害的计量经济学——实证研究者指南(重译本)》
欢迎扫描👇二维码添加关注