查看原文
其他

OLS及其假设

秋枫澜 不止点滴 2022-12-31

建立起计量模型仅仅只是实证分析中的一小步,接下来更为关键的是根据合适的数据估计出模型中的参数,而选用什么样的计量方法来估计这些未知参数又尤为重要。计量方法何其之多,应该怎么选择呢?之前听到一位不懂计量的老师告诫其学生:既然你使用的是横截面数据,那么你的计量方法要比较复杂才行。不用细想也知道这话肯定是没道理的。


首先,不同类型的数据并没有天然的优劣,面板数据不一定就比横截面数据高贵;其次,对于实证研究,方法并不在于复杂和时尚,合适的才是最好的,否则只会适得其反;最后,真正的高手的基本素质之一就是用简单的语言和方法来讲述复杂的故事,一味追求所谓的高大上只会显得很low。


去年还是前年有人专门统计过近些年发表在美国顶级经济学期刊上的文献所使用的计量方法,出乎不少人意料的是,传统的最基本的OLS方法占据了绝大部分份额。其实,OLS虽然看上去最简单,却是其他计量方法的基础和基石,只有理解了OLS的原理和假设,才能更好地运用其他计量方法。


一般来说,OLS有如下4个假设:


假设1. 线性(Linearity):

其中,是一个标量,是一个(k+1)×1的向量。要注意的是,在经典线性回归模型中的“线性”指的是回归模型对于系数而非自变量为线性,换句话说,之间可以是非线性关系。在线性假设下,系数可以表述为的边际影响。


假设2. 严格外生性(StrictExogeneity):

该假设在不同教材中的表述可能不一样,有的教材将之表述为:X独立。由于该假设意味着扰动项与所有的X都不相关,从而将时间序列模型(过去的影响现在,现在的影响未来)排除在外了。事实上,该假设过于严苛,存在的意

义主要在于推导出有限样本分布理论,在大样本理论下,该假设可以放松为

。由于在理论上,n>30就可以算大样本了,而我们实际运用的数据动辄成千上万,因而可以直接以为准。


假设对于得到参数的一致估计至关重要(大样本理论下,无偏性其实变得不再重要)。我们都知道,内生性是实证分析中的一大问题,内生性的存在会导致估计结果不准确。内生性问题为什么会存在呢?就是因为也就是假设不成立导致的。


假设3. 非奇异性(Nonsingularity):

      3aK×K矩阵的最小特征根λ为非0

      3b:当时,的概率为1

假设3a意味着矩阵为非奇异矩阵,从而该假设不允许回归模型中存在严格的多重共线性(某个自变量是其他自变量的线性组合)。由于特征根能够用于总结矩阵中包含的信息,假设3b事实上说的是,当样本规模趋向于无穷大的时候,样本必须带来新的信息,即随着t的增加,不能仅仅只包含一些重复的值。这个假设很好理解,如果的值没有变化,那还怎么来确定YX的关系呢?


假设4. 球形扰动方差(Sphericalerror variance):

      4a. 条件同方差:

      4b. 条件不自相关:

假设4a意味着,即扰动项的方差为不变值。假设4b意味着当t ≠ s时,扰动项之间互不相关(以前的扰动项与现在的扰动项不存在序列相关,也是排除了时间序列分析)。


在有些教材里,还会有假设5,即正态性(Normality):。这是一个过强的假设。


在上述假设下,我们可以开始放心地对模型进行OLS估计和假设检验。事实上,尽管OLS4个假设是由几个看上去简陋的式子描述的,但是却反映了相当多的信息。根据假设1可以确定模型的基本形式并对参数进行解读;根据假设2可以知道为什么会存在内生性以及要对内生性进行处理;根据假设3知道为什么回归时要检查模型中是否存在多重共线性;根据假设2和4知道不能用时间序列分析的方法(尽管看上去可能高大上和复杂)来对非时间序列数据进行分析,以及为什么要考虑异方差问题。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存