查看原文
其他

二值选择模型(2):Probit与Logit

秋枫澜 不止点滴 2020-02-10

对于二值选择模型:,通常采用Probit模型或Logit模型进行估计。

 

当连接函数p(x)为标准正态的累计分布函数Φ(x)时,模型被称为Probit:

当连接函数p(x)为logistic分布的累计分布函数时,模型被称为Logit:

由于Probit与Logit模型本质上属于非线性模型,通常采用最大似然估计法(MLE)进行估计。在满足独立同分布(i.i.d.)假设和已知分布函数的情况下,最大似然估计是最佳无偏估计(BUE,比线性模型的BLUE少个L)。

 

通过MLE得到模型参数的估计值后,接下来的重要工作便是对参数的经济解释。在线性模型的情况下,回归系数的经济意义即解释变量对被解释变量y的边际效应:

但是对于本质是非线性模型的Probit与Logit,其估计量一般并非边际效应,不能直接从边际效应的角度进行经济解释。以Probit为例:

可以发现,Probit的真正的边际效应为,其并非常数,会随着解释变量x而变化。

 

在实际运用中,有三种常用的边际效应:

1)平均边际效应即先分别计算在每个样本观测值上的边际效应,然后进行简单算术平均得到最终的边际效应。这种边际效应也是Stata默认计算的边际效应。

2)样本均值处的边际效应。

3)在某代表值处的边际效应。

 

小结:Probit模型等的估计参数并不具备经济意义,不能直接进行解释,需要先转换为平均边际效应。这也是看文献时,回归表格的注释里都有“表中报告的是估计的边际效应”这样一句话的原因。

 


附:

一般来说,在得到一组回归参数的估计值后,往往会从拟合优度的角度对模型的拟合情况给出一个评价。对于常规的线性模型,判定系数是最为常用的拟合优度指标了,根据平方和分解公式:SST=SSR+SSE,有。但是,对于非线性的Probit模型与Logit模型,并不存在和线性情况下一样的平方和分解公式,也就是说,无法计算。在用Stata进行probit或logit回归时,软件会给出一个(伪)。不过,不管是还是,都没必要给予过多的关注。

关于不必过多关注R square的原因,可回顾R square,真的很重要吗?这一篇推文。


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存