Stata:横截面及面板分位数回归
分位数回归方法从1978年提出后,无论从理论还是应用方面都得到了很大的发展。它不仅能够拓展模型使用的范围,而且还能够度量出回归变量对分布的影响,以及分布的尾部特征,较之经典的最小二乘法更具有优势。随着分位数回归理论和算法的不断发展,分位数应用的领域更加广泛。
传统的线性回归模型具有悠久的历史,其中经典的最小二乘回归应用最为广泛。它描述了因变量的条件均值分布受自变量X的影响过程。最小二乘法是估计回归系数的最基本的方法。如果模型的随机误差项来自均值为零,且方差相同的分布,那么回归系数的最小二乘估计为最佳线性无偏估计如果随机误差项是正态的,那么回归系数的最小二乘估计,与极大似然估计一致,均为最小方差无偏估计。此时它具有无偏性、有效性等优良性质。
但是,在实际的经济生活中,这种假设常常得不到满足。例如当数据中存在严重的异方差,或者存在厚尾、尖峰等情况时,最小二乘法的估计将不再具有上述的优良性质,而且稳健性极其糟糕。特别的,对于大量数据而言,应用最小二乘回归只能得到一条回归线,而一条回归线所能反映的信息量是有限的。因此,人们在使用经典的线性回归的同时,也一直在不断的探索更新更好的回归方法。
为了弥补最小二乘法在回归分析中的缺陷,有科学家提出了分位数回归,分位数回归相对于最小二乘回归,应用条件更加宽松,挖掘的信息量更加丰富。它依据因变量的条件分位数对自变量X进行回归,这样得到了所有分位数下的回归模型。因此分位数回归相比普通的最小二乘回归,能够更精确的描述自变量X对于因变量Y的变化范围,以及条件分布形状的影响。分位数回归能够捕捉到分布的尾部特征,当自变量对因变量分布的不同位置产生不同的影响时,它就能更加全面的刻画分布的特征,从而得到全面的分析,而且分位数回归系数估计比最小二乘回归系数估计更加稳健。
二、分位数回归stata操作汇总
本部分综合整理自stata该命令介绍
分位数回归相关的命令语法格式:
分位数回归相关的命令:
(1) 只做一个分位数回归,使用默认的标准误
Quantile regression
qreg depvar [indepvars] [if] [in] [weight] [, qreg_options]
qreg y x1 x2 x3 (默认中位数回归)
qreg y x1 x2 x3,q(#) (#分位数回归)
(2)使用自助标准误法,只做一个分位数回归
Bootstrapped quantile regression
bsqreg depvar [indepvars] [if] [in] [, bsqreg_options]
set seed #
bsqreg y x1 x2 x3,q(#) reps(#)
(3) 使用自助法计算协方差矩阵,做多个分位数回归
Simultaneous-quantile regression
sqreg depvar [indepvars] [if] [in] [, sqreg_options]
sqreg y x1 x2 x3,q(0.25 0.5 0.75) reps(#)
检验系数是否相等
test [q25=q50=q75]:x1
(4)不同分位数系数和置信区间图形比较
ssc install grqreg #安装grqreg命令
set seed #
bsqreg y x1 x2 x3,reps(#) q(#)
grqreg ,cons ci ols olsci
案例1:
1、同时进行0.25,0.5,0.75的分位数回归
. sysuse auto
sqreg price weight length foreign, quantile(.25 .5 .75) reps(100)
结果为:
2、分位数检验:test [q25=q50=q75]:weight
. sqreg price weight , quantile(.25 .5 .75) reps(100)
(fitting base model)
Bootstrap replications (100)
----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5
.................................................. 50
.................................................. 100
Simultaneous quantile regression Number of obs = 74
bootstrap(100) SEs .25 Pseudo R2 = 0.0688
.50 Pseudo R2 = 0.0905
.75 Pseudo R2 = 0.2026
------------------------------------------------------------------------------
| Bootstrap
price | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q25 |
weight | .7540984 .2525686 2.99 0.004 .250612 1.257585
_cons | 2188.639 740.2909 2.96 0.004 712.8965 3664.382
-------------+----------------------------------------------------------------
q50 |
weight | .9688312 .3973103 2.44 0.017 .1768076 1.760855
_cons | 2232.39 937.1269 2.38 0.020 364.2613 4100.518
-------------+----------------------------------------------------------------
q75 |
weight | 2.614474 .6280936 4.16 0.000 1.362392 3.866555
_cons | -102.4737 1250.495 -0.08 0.935 -2595.29 2390.342
------------------------------------------------------------------------------
. test [q25=q50=q75]:weight
( 1) [q25]weight - [q50]weight = 0
( 2) [q25]weight - [q75]weight = 0
F( 2, 72) = 5.06
Prob > F = 0.0088
三、面板分位数回归
qregpd depvar indepvars [if] [in] [weight] , [quantile(#)
instruments(varlist) identifier(varlist) fix(varlist)
optimize(string) MCMC options Grid-search options ]
面板分位数回归案例
该数据与Stata高级班中A10面板数据专题数据一致
use "C:\Users\admin\Desktop\wage1810.dta", clear
xtset idcode year
desc
qregpd ln_wage tenure union, id(idcode) fix(year)