Stata:空间计量模型双权重
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
连享会 · 2022空间计量专题
作者:彭甲超 (中国地质大学)
邮箱:pengjiachao@cug.edu.cn
编者按:本文摘译自下文,特此致谢!
Source:Atella V, Belotti F, Depalo D, et al. Measuring spatial effects in the presence of institutional constraints: The case of Italian Local Health Authority expenditure[J]. Regional Science and Urban Economics, 2014, 49: 232-241. -PDF-
目录
1. 简介
2. 双权重模型
3. 命令介绍
4. Stata 实例操作
5. 结语
6. 参考资料
7. 相关推文
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
1. 简介
已有文献认为地理上接近的样本数据不是独立的,而是在空间上相关,这意味着更接近样本单元的观测值往往比其他样本单元的观测值更相似。经济和社会人口变量,如失业率、犯罪率、房价、人均卫生支出等,经常观察到空间聚集或基于地理的相关性特征。理论模型通常承认空间溢出的存在,空间溢出随着单元之间距离的增加而下降。
从经验上讲,这些特征可以通过权重矩阵的方法,将较高的权重附加到邻近地区。比如邻近样本单元的环境污染可能影响当地的环境,那么在实际研究中该如何控制临近样本单元对当地的环境污染呢?通常利用引入空间权重的方式考察这种空间溢出。引入空间计量主要有2个好处:一是可以防止空间溢出效应性影响内生性,二是可以考察空间溢出的影响方向。
一般常见的引入空间权重仅使用单一权重,但实际中仅依赖单一空间权重缺乏经济含义。以空间杜宾模型 (SDM) 为例:
其中, 为被解释变量; 表示与相邻地区 的空间自相关部分, 为空间权重矩阵,显示 与相邻地区的其他 有关系; 表示与自变量相关部分, 与自变量 有关,也就是最简单的线性回归模型; 表示与相邻地区 的空间自相关部分, 与相邻地区的其它 有关系。
公式中使用的 一般仅可引入单一的空间权重,如地理距离等,但现实环境污染也不仅仅与地理距离或是空间邻接相关,也可能与邻近地区经济发展需要额外排放污染相关,那么此时仅使用地理距离或是空间邻接权重就无法控制经济发展权重带来的影响。spm
命令能够很好的解决两种空间权重对被解释变量的影响。
2. 双权重模型
spm
命令主要适用平衡面板双权重的空间自回归模型 (SAR)、空间误差模型 (SEM) 和 SDM 固定效应空间计量模型。SE 其实就是将回归项放到了误差里面,简单的来说,SAR 是研究因变量自相关,而 SEM 是研究误差项自相关。SDM 是 SAR 和 SEM 的扩展形式,同时考虑了因变量和自变量的自相关性含有空间权重矩阵的模型。
SDM 模型可以计算变量的直接效应、间接效应和总效应,因而被广泛使用。其中直接效应表示区域的变量对区域的被解释变量产生的影响,总效应表示所有区域的变量变动对区域的被解释变量产生的影响,间接效应表示其他区域变量变动对本区域的被解释变量产生的影响,也为空间溢出效应。
以 SDM 模型为例,双权重主要模型形式为 (Manski,1993;Atell 等 2014):
其中 和 表示两种不同的空间权重,其他参数解释与一般情形下的 SDM 一致。
需要注意的是,spm
允许使用双权重矩阵估计平衡空间面板数据模型 (Atella 等,2014),当方差-协方差矩阵不是正定时,使用 Rebonato 和 Jackel (1999) 中的修正正定矩阵计算直接、间接和总效应标准误差。
3. 命令介绍
*命令安装
cnssc install lxhget, replace
lxhget spm.pkg, install
*命令语法
Spatial Autoregressive (SAR) model
spm depvar [indepvars] [if] [in] [weight] [, SAR_options]
Spatial Error (SEM) model
spm depvar [indepvars] [if] [in] [weight] , model(sem) [SEM_options]
Spatial Durbin (SDM) model
spm depvar [indepvars] [if] [in] [weight] , model(durbin) [DURBIN_options]
spm
:仅适用 SAR、SEM、Durbin 模型;depvar
:被解释变量;indepvars
:解释变量;SAR_options
:包括sarwmat(name)
、sarw2mat(name)
、固定效应选项,稳健性估计选择和置信区间选项。其中sarwmat(name)
代表第一个 Stata 空间权重,sarw2mat(name)
代表第二个 Stata 空间权重,固定效应选择可设定控制个体效应和时间效应;SEM_options
:与SAR_options
类似,包括sarwmat(name)
、sarw2mat(name)
、固定效应选项、稳健性估计选择和置信区间选项,含义与SAR_options
类似;DURBIN_options
:与SAR_options
和SEM_options
具体内容差别不大。但需要注意durbin(varlist [, SDM_options])
中,SDM_options
包含indirect
和nsim(#)
,分别用于展示不同变量的空间溢出效应,设置 Lesage 和 Pace (2009) 过程的模拟次数以计算直接和间接影响的标准误差。
4. Stata 实例操作
示例数据中的空间矩阵是一个一阶 188×188 邻接矩阵 ,如果区域 和 共享公共边界,则其对角线元素等于 0,非对角线元素等于 1。如果区域 和 共享共同边界并且属于同一机构群集,则记为 ,如果区域 和 虽然共享共同边界但属于不同群集,则记为 。
首先,下载示例数据,并载入两种空间权重 和 :
. lxhget spm.pkg, replace
. use spm_demo.dta, clear
. mata mata matuse w1.mmat, replace
. mata st_matrix("W1", W1)
. mata mata matuse w2.mmat, replace
. mata st_matrix("W2", W2)
特别需要注意的是,spm
使用的空间权重矩阵是 mmat 格式而非 dta 格式数据,下文将给出具体转化代码。
mata
mata clear
mata stata use W1.dta,clear
W1=st_data(.,.)
W1
end
mata st_matrix("W1", W1)
其次,结合 spm
的参考命令执行,结果如下:
. *SDM
. xtset id t
. spm y x1, model(durbin) sarwmat(W1) sarw2mat(W2)
SDM with spatial fixed effects Number of obs = 940
Group variable: id Number of groups = 188
Time variable: t Obs per group: min = 5
avg = 5.0
max = 5
Log-likelihood = -1319.3380
------------------------------------------------------------------------------
y | Coefficient Std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
Main |
x1 | 0.411 0.034 12.09 0.000 0.345 0.478
-------------+----------------------------------------------------------------
Durbin |
x1 | 0.601 0.063 9.55 0.000 0.478 0.725
-------------+----------------------------------------------------------------
Durbin2 |
x1 | 0.321 0.064 4.98 0.000 0.195 0.448
-------------+----------------------------------------------------------------
Spatial |
rho | 0.237 0.022 10.97 0.000 0.195 0.279
rho2 | 0.674 0.019 36.38 0.000 0.638 0.710
-------------+----------------------------------------------------------------
Variance |
sigma2 | 1.016 0.038 26.62 0.000 0.941 1.091
------------------------------------------------------------------------------
其中,
y 表示人均卫生费用支出,x1 为核心变量,具体指标解释请参阅 Atella 等 (2014); Main 汇报的是 部分; Durbin 和 Durbin2 汇报的分别是 、; rho 和 rho2 则分别对应 、。
. *SAR
. spm y x1, model(sar) sarwmat(W1) sarw2mat(W2)
SLM with spatial fixed effects Number of obs = 940
Group variable: id Number of groups = 188
Time variable: t Obs per group: min = 5
avg = 5.0
max = 5
Log-likelihood = -1378.5699
------------------------------------------------------------------------------
y | Coefficient Std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
Main |
x1 | 0.434 0.036 12.21 0.000 0.364 0.503
-------------+----------------------------------------------------------------
Spatial |
rho | 0.306 0.020 15.16 0.000 0.267 0.346
rho2 | 0.660 0.018 37.26 0.000 0.625 0.695
-------------+----------------------------------------------------------------
Variance |
sigma2 | 1.121 0.042 26.49 0.000 1.038 1.204
------------------------------------------------------------------------------
. *SEM
. spm y x1, sarwmat(W1) sarw2mat(W2)
SLM with spatial fixed effects Number of obs = 940
Group variable: id Number of groups = 188
Time variable: t Obs per group: min = 5
avg = 5.0
max = 5
Log-likelihood = -1378.5699
------------------------------------------------------------------------------
y | Coefficient Std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
Main |
x1 | 0.434 0.036 12.21 0.000 0.364 0.503
-------------+----------------------------------------------------------------
Spatial |
rho | 0.306 0.020 15.16 0.000 0.267 0.346
rho2 | 0.660 0.018 37.26 0.000 0.625 0.695
-------------+----------------------------------------------------------------
Variance |
sigma2 | 1.121 0.042 26.49 0.000 1.038 1.204
------------------------------------------------------------------------------
5. 结语
与传统的单一空间权重分析相比,spm
命令同时引入两种空间权重是对空间计量模型的一种改进。此外,spm
命令能够汇报 SDM 模型的直接效应、间接效应和总效应,本文不在此赘述。
6. 参考资料
Cameron A C, Gelbach J B, Miller D L. Robust inference with multiway clustering[J]. Journal of Business & Economic Statistics, 2011, 29(2): 238-249. -PDF- Atella V, Belotti F, Depalo D, et al. Measuring spatial effects in the presence of institutional constraints: The case of Italian Local Health Authority expenditure[J]. Regional Science and Urban Economics, 2014, 49: 232-241. -PDF- Manski C F. Identification of endogenous social effects: The reflection problem[J]. The review of economic studies, 1993, 60(3): 531-542. -PDF- Rebonato R, Jäckel P. The most general methodology to create a valid correlation matrix for risk management and option pricing purposes[J]. Available at SSRN 1969689, 2011. -PDF-
7. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh 空间, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:Stata命令 Stata:空间计量之用-spmap-绘制地图.md 专题:Stata绘图 Stata空间计量:莫兰指数绘图moranplot命令介绍 专题:倍分法DID 倍分法(DID)的标准误:不能忽略空间相关性 专题:空间计量 重磅推荐:范巧——空间计量经济学公开课 Stata:批量获取经纬度数据-空间计量 Stata空间计量:STAR-时空自回归模型 Stata:一文遍览Stata官方空间计量命令:sp系列命令 刘迪:Stata空间溢出效应的动态图形-空间计量 空间面板数据模型及Stata实现 空间计量溢出效应的动态GIF演示 空间权重矩阵的构建 空间计量:地理加权归回模型-(GWR)-参数估计 直播课 - 空间面板模型及动态设定
课程推荐:因果推断实用计量方法
主讲老师:丘嘉平教授
🍓 课程主页:https://gitee.com/lianxh/YGqjp
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。