查看原文
其他

特别推荐丨老姚专栏:经典变量误差与衰减偏误:一个新的案例

姚耀军 数据Seminar 2021-06-04



在计量经济学实践中,并非所有的变量都是能被直接观测或者测量的。此时,我们可以采用代理变量(Proxy variable)方法,用代理变量代替无法观测的变量,并将之纳入实证模型。代理变量包含了被代理变量的一部分信息,但也含有噪音,而这种噪音就是所谓的测量误差。

实证模型中的因变量与自变量均可能含有测量误差。对于因变量中的测量误差,由于实证模型本身所含有截距项与误差项可以吸纳之,其一般不会对实证分析带来多大的困扰。比较麻烦的是,自变量含有测量误差。在计量经济学中,关于自变量测量误差的重要假定是:测量误差与无法观测的自变量不相关,这就是所谓的经典变量误差假定(Classical errors-in-variables,CEV)。


经典变量误差带来的困扰是,作为代理变量一个组成部分的测量误差将进入模型的误差项,成为所谓合成误差项的一个组成部分,而这个合成误差自然与代理变量相关,进而产生内生性问题,导致模型的OLS估计出现偏误。可以证明,在CEV假定下,代理变量所对应的系数估计偏向零,出现所谓的衰减偏误(Attenuation bias)。

关于衰减偏误的经典例子来自于对凯恩斯消费函数经验证据的解释。关于凯恩斯消费函数,经验研究表明:消费对收入的弹性即边际消费倾向(Marginal propensity to consume,MPC)小于1。但弗里德曼认为,具有前瞻性的消费会对持久收入作出反应。具体来说,消费对持久收入的弹性等于1,这就是著名的持久收入假说(Permanent income hypothesis,PIH)。那么,若PIH是对的,则如何解释关于凯恩斯消费函数的经验研究结果呢?在经典变量误差框架下,答案很简单——凯恩斯消费函数中的收入属于能观测的当前收入,我们可以将其视为无法观测的持久收入的代理变量。由于衰减偏误,凯恩斯消费函数中的MPC的估计值会小于1,向0趋近。


本文在此提供一个新的案例,以帮助大家更好地理解经典变量误差与衰减偏误。

👇

假如我们试图评估一个人的能力对其成绩的影响。由于当前的能力无法被直接观测,我们用过去的成绩作为其代理变量。显然,过去的成绩部分反映了能力因素,但也受到考试发挥情况的影响。考试发挥情况属于运气成分,亦是代理变量中的测量误差。鉴于运气的随机性,我们有理由假定测量误差与无法观测的能力不相关,亦即CEV假定成立。


基于上述分析,我们建立一个关于,成绩的一阶自回归模型(即AR(1)模型)来分析能力与成绩之间的关系,其中成绩的一阶滞后充当能力的代理变量。由于测量误差的存在,即使成绩与能力的真实关系是两者1比1地变动,也可以预期,该一阶自回归模型中的回归系数小于1,其直觉是:若过去的成绩很好,则表明当时的运气很好,而现在很难维持这样的好运,因此现在的成绩一般要比过去的好成绩更差;若过去的成绩很差,则表明当时的运气很差,而糟糕的运气一般也不会一直持续下去,因此现在的成绩一般要比过去的差成绩更好。总之,一阶自回归模型中的回归系数小于1表明成绩存在一个均值回复过程(Mean-reverting process)。

如果成绩的波动主要由运气决定,亦即成绩作为能力的代理变量会产生较大的测量误差,那么一阶自回归模型中的回归系数就更是会比1小。一种极端情况是,当成绩波动完全由运气所决定时,回归系数近似为零,表明现在的成绩与过去的成绩几乎不相关。在统计学中,当成绩的波动主要由运气所决定时,意味着成绩作为能力的衡量指标具有很低的效度(Validity)。


简而言之,当用过去成绩来作为能力的代理变量时,测量误差就是运气成分。若假定运气属于不具有自相关性的白噪声,则成绩将呈现均值回复性质,一阶自回归模型中的回归系数小于1,这进而会导致我们低估能力对成绩的影响。在经典变量误差框架下,这种低估就是衰减偏误。





作者简介 · 耀军


姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授、博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,浙江省“151人才工程”第三层次培养人员,杭州市“十三五”哲学社会科学应用经济学学科组评审专家。长期从事金融发展理论与实证研究,在《China & World Economy》《Frontiers of Economics in China》《金融研究》《数量经济技术经济研究》《财贸经济》《中国农村经济》等学术期刊上发表论文多篇,部分成果被《新华文摘》《中国法经济学研究》《中国经济的转型升级:新结构经济学方法与应用》《高等学校文科学术文摘》《人大复印资料》收录或者转载。主持教育部人文社科项目、浙江社会科学基金重点项目、浙江省自然科学基金项目等纵向课题多项。荣获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。


你要的工具&方法我都给你整理好了!




工具&方法 | 6张图,3分钟阅读即可掌握stata全部命令

工具&方法 | 10个Python Pandas小技巧让你的工作更高效(附代码实例)

工具&方法 | 6行代码教你用python做OLS回归(内附CFPS实例)

工具&方法丨菜鸟升级打怪系列之python代码优化(1)

工具&方法 | 小刘老师“再”出新招:JSON数据转为面板数据


听说你还在为数据呈现烦恼?看这里!

数据呈现丨好用易懂的matplotlib可视化,快来了解一下!

数据呈现丨想要数据可视化?你还少了它!

数据呈现 | Stata+R+Python:拨开数据迷雾,窥探可视化之“美”(工具书推荐,附PDF资源链接)

数据呈现 |Stata+R+Python:一文帮你解决Paper、PPT中的数据可视化问题


让我猜猜,或许你需要的还有这些!

特别推荐丨老姚专栏:多重共线性问题应该这样理解才对

学术前沿丨机器学习能成为因果推断的“圣杯”吗?

学术前沿 | 规律与因果:大数据对社会科学研究冲击之反思

特别推荐 | 专利引用数据,可以用来做哪些研究?



数据Seminar

这里是大数据、分析技术与学术研究的三叉路口



作者:姚耀军推荐:杨奇明编辑:青酱



    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存