二值选择模型（2）：Probit与Logit

查看原文

其他

二值选择模型（2）：Probit与Logit

秋枫澜不止点滴 2020-02-10

对于二值选择模型：，通常采用Probit模型或Logit模型进行估计。

当连接函数p(x)为标准正态的累计分布函数Φ(x)时，模型被称为Probit：

当连接函数p(x)为logistic分布的累计分布函数时，模型被称为Logit：

由于Probit与Logit模型本质上属于非线性模型，通常采用最大似然估计法（MLE）进行估计。在满足独立同分布（i.i.d.）假设和已知分布函数的情况下，最大似然估计是最佳无偏估计（BUE，比线性模型的BLUE少个L）。

通过MLE得到模型参数的估计值后，接下来的重要工作便是对参数的经济解释。在线性模型的情况下，回归系数的经济意义即解释变量对被解释变量y的边际效应：

但是对于本质是非线性模型的Probit与Logit，其估计量一般并非边际效应，不能直接从边际效应的角度进行经济解释。以Probit为例：

可以发现，Probit的真正的边际效应为，其并非常数，会随着解释变量x而变化。

在实际运用中，有三种常用的边际效应：

1）平均边际效应。即先分别计算在每个样本观测值上的边际效应，然后进行简单算术平均得到最终的边际效应。这种边际效应也是Stata默认计算的边际效应。

2）样本均值处的边际效应。

3）在某代表值处的边际效应。

小结：Probit模型等的估计参数并不具备经济意义，不能直接进行解释，需要先转换为平均边际效应。这也是看文献时，回归表格的注释里都有“表中报告的是估计的边际效应”这样一句话的原因。

附：

一般来说，在得到一组回归参数的估计值后，往往会从拟合优度的角度对模型的拟合情况给出一个评价。对于常规的线性模型，判定系数是最为常用的拟合优度指标了，根据平方和分解公式：SST=SSR+SSE，有。但是，对于非线性的Probit模型与Logit模型，并不存在和线性情况下一样的平方和分解公式，也就是说，无法计算。在用Stata进行probit或logit回归时，软件会给出一个（伪）。不过，不管是还是，都没必要给予过多的关注。

关于不必过多关注R square的原因，可回顾R square，真的很重要吗？这一篇推文。

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

跟着南通住建局学“朝令夕改”

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

当“上帝”变为“老天爷”

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...