查看原文
其他

特别推荐丨老姚专栏:教科书没有讲的矩估计性质

姚耀军 数据Seminar 2021-06-03

在初级计量经济学中,与∑有关公式几乎无处不在。只要老老实实地对公式进行展开、合并......,相信小伙伴们最终都能搞定这些公式。然而,如果每次都要重复进行这些工作,可能就不甚烦恼了。本文介绍一个简单的方法,能帮助小伙伴们轻松搞定与有关的公式,而这种方法也恰恰反映了我们常用的矩估计所拥有的良好性质。




 一、矩估计的基本原理 


简单来说,矩估计就是用样本均值来估计总体均值,用样本方差来估计总体方差,用样本协方差来估计总体协方差。例如,假设是随机变量的观测值,则对总体均值的估计就是样本均值。更简单一点,我们可以将矩估计理解为,就是用来代替。接下来我们基于这种理解,可以轻松地写出总体方差与总体协方差的矩估计量:

总体方差为若用来代替。则对总体方差的估计就是:,记为样本方差

总体协方差为,其矩估计就是:,记为样本协方差

矩估计背后的统计思想是大数定理——当样本容量趋于无穷大时,样本均值趋近于总体均值(亦即变量的期望值)。大数定理表明,上述三个矩估计量均满足一致性。




 二、矩估计的“神奇”性质 


矩估计还存在一个神奇之处,那就是对应于每一个总体矩公式,都相应存在一个样本矩公式。例如,对于总体矩,我们应该熟悉下列公式:

很容易验证,存在一组与上述公式相对应的样本矩公式:

若约去,则有:

公式(1c)、(2c)与(3c)在初级计量经济学中经常被应用。如果了解相对应的规则,熟悉总体矩公式的同学就能很容易地记住这些公式。实际上,我们还可以记住更多常用的样本矩公式。这是因为,鉴于存在相应的总体矩公式,如下三个样本矩公式一定可以被证明是成立的:

这里,与a是b常数,上标表示样本矩。上述三个公式在初级计量经济学中也经常被应用。

笔者在此提醒小伙伴们要意识到,矩估计的“神奇”之处恰恰体现了矩估计作为一种估计方法的合理性。想一想我们就会明白:如果总体矩具有某些性质,但样本矩却没有相应的性质,那么样本矩绝不可能是对总体矩的良好估计。




 三、推广到不等式 


前面介绍的都是一些等式。其实,如果总体矩满足一些不等式,那么样本矩也存在相应的不等式。例如,总体矩满足:

上述不等式被称为Jensen不等式。(不妨简单验证一下:对于这一凸函数,由于,因此,

Jensen不等式也有“样本版”。如果小伙伴们对微积分比较熟悉,那么一定还记得如下不等式:

上述两个不等式的几何图示非常直观(见图1与图2)。很明显,它们就是Jensen不等式的非随机版本。

为什么在这里要讨论一下推广呢?我们是想借此引出Jensen不等式的一个应用。可以证明,对总体方差的矩估计并不是一个无偏估计,而要获得一个无偏估计,必须进行所谓的自由度调整,下文(“应用”)将证明,总体方差的无偏估计为.进一步地,总体标准差的无偏估计是否为呢?若熟悉Jensen不等式,则我们很容易知道:

由于对总体方差的无偏估计,上述不等式的右边就为总体标准差。因此低估了总体标准差。




 四、应用 


假设从一个总体中独立抽取,请证明是总体方差的无偏估计量,即

简证:定义为任意常数,首先可以证明下式成立:

简证:定义为任意常数,首先可以证明下式成立:

在这里,我们实际上可以快速写出上述等式,因为存在相应的总体矩公式

接下来可令等于总体均值,则可以证明:

因此有:

故得证:

文章附注

—————————————————
很容易发现,无论是样本方差还是样本协方差,它们实际上都属于某个“复合变量”的样本均值。
若定义:,则该式可以变为我们所熟悉的公式:








►往期推荐

回复【Python】👉简单有用易上手

回复【学术前沿】👉机器学习丨大数据

回复【数据资源】👉公开数据

回复【可视化】👉你心心念念的数据呈现

回复【老姚专栏】👉老姚趣谈值得一看


►一周热文

数据呈现 | R语言绘图包大全(共40个包)

特别推荐丨老姚专栏:利用实验方法进行因果识别的效度问题

工具&方法 | 黑科技!Excel中的rept函数也能绘图

数据呈现 | 用 pyecharts 绘制时间线动图

特别推荐 | “正则表达式”在工业企业数据库匹配中的运用(二)




数据Seminar

这里是大数据、分析技术与学术研究的三叉路口


作者:姚耀军
推荐:杨奇明编辑:青酱






    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存