OLS及其假设
建立起计量模型仅仅只是实证分析中的一小步,接下来更为关键的是根据合适的数据估计出模型中的参数,而选用什么样的计量方法来估计这些未知参数又尤为重要。计量方法何其之多,应该怎么选择呢?之前听到一位不懂计量的老师告诫其学生:既然你使用的是横截面数据,那么你的计量方法要比较复杂才行。不用细想也知道这话肯定是没道理的。
首先,不同类型的数据并没有天然的优劣,面板数据不一定就比横截面数据高贵;其次,对于实证研究,方法并不在于复杂和时尚,合适的才是最好的,否则只会适得其反;最后,真正的高手的基本素质之一就是用简单的语言和方法来讲述复杂的故事,一味追求所谓的高大上只会显得很low。
去年还是前年有人专门统计过近些年发表在美国顶级经济学期刊上的文献所使用的计量方法,出乎不少人意料的是,传统的最基本的OLS方法占据了绝大部分份额。其实,OLS虽然看上去最简单,却是其他计量方法的基础和基石,只有理解了OLS的原理和假设,才能更好地运用其他计量方法。
一般来说,OLS有如下4个假设:
假设1. 线性(Linearity):
其中,
假设2. 严格外生性(StrictExogeneity):
该假设在不同教材中的表述可能不一样,有的教材将之表述为:
义主要在于推导出有限样本分布理论,在大样本理论下,该假设可以放松为
假设3. 非奇异性(Nonsingularity):
3a:K×K矩阵
3b:当
假设3a意味着矩阵
假设4. 球形扰动方差(Sphericalerror variance):
4a. 条件同方差:
4b. 条件不自相关:
假设4a意味着
在有些教材里,还会有假设5,即正态性(Normality):
在上述假设下,我们可以开始放心地对模型进行OLS估计和假设检验。事实上,尽管OLS的4个假设是由几个看上去简陋的式子描述的,但是却反映了相当多的信息。根据假设1可以确定模型的基本形式并对参数进行解读;根据假设2可以知道为什么会存在内生性以及要对内生性进行处理;根据假设3知道为什么回归时要检查模型中是否存在多重共线性;根据假设2和4知道不能用时间序列分析的方法(尽管看上去可能高大上和复杂)来对非时间序列数据进行分析,以及为什么要考虑异方差问题。