重磅推荐 | 空间计量教程
计量经济学服务中心专辑汇总!计量百科·资源·干货:
Stata |Python |Matlab |Eviews |R Geoda |ArcGis |GeodaSpace |SPSS 一文读懂 |数据资源 |回归方法 |网络爬虫 门限回归 |工具变量 |内生性 |空间计量 因果推断 |合成控制法 |倾向匹配得分 |断点回归 |双重差分 面板数据 | 动态面板数据
本文主要包括空间计量模型之spatwmat、spatgsa、spatlsa、spatcorr、spatdiag、spatreg等命令。该推文适合横截面空间计量。
1
spatswmat
空间数据分析的主要特点之一是,它考虑了观测单元的空间排列,我们称之为位置(Anselin 1992a)。这种空间布局由空间权矩阵W表示,其元素wij表示存在或不存在(二元权矩阵)或每个可能位置对之间的潜在空间相互作用的程度(非二元权矩阵)。
spatwmat的主要目的是生成spatgsa, spatlsa, spatdiag, 和 spatreg等命令所需要的N*N空间权重矩阵。
为了说明spatwmat的实际应用,以及本文中讨论的其他命令,我将使用俄亥俄州哥伦布市(Anselin 1988) 49个相邻规划社区的数据。
*计量经济学服务中心推文之空间计量教程
use columbusdata.dta, clear
describe //描述查看
结果为:
在使用这些数据进行兴趣分析之前,我们必须生成适当的空间权值矩阵。如前所述,完成此任务的方法包括导入存储在外部Stata数据文件中的用户定义矩阵。
spatwmat using columbusswm.dta, name(W) //计量经济学服务中心
结果为:
当一切都完成, spatwmat告诉我们 , 一 个 名叫 W,49 * 49 的空间权重 矩阵创建;此外,spatwmat检测到导入的矩阵由二进制权值组成。如果我们愿意只分析前十个社区,我们可以使用option ,drop(数字列表)来进行操作
spatwmat using columbusswm.dta, name(W) drop(11/49) //计量经济学服务中心
结果为:
最后,spatwmat可以用来生成spatreg需要的特征值矩阵:
spatwmat using columbusswm.dta, name(W) standardize eigenval(E)
结果为:
2
空间自相关检验命令汇总
主要包括spatgsa、spatlsa、spatcor等命令。
1、spatgsa
spatgsa计算三个全局空间自相关统计数据:Moran's I, Geary's c, and Getis and Ord's G。spatgsa计算并以表格形式显示统计本身的期望值、全局空间的零假设下的独立零假设,标准差的统计,z值和相应的单尾或者双侧检验。
全局自相关检验用到的命令为spatgsa,语法格式为:spatgsa varlist , weights(matrix) [ moran geary go twotail ]
其中:
weights(matrix)总是需要权值(矩阵)。它指定用于计算请求的全局空间自相关统计信息的空间权重矩阵的名称。这个矩阵一定是由spatwmat生成的。
moran请求计算并显示moran的I和相关的值。
geary请求计算并显示Geary's c统计量。
go请求计算Getis and Ord's G。此选项要求由选项权值(矩阵)指定的空间权值矩阵为非标准化的对称二进制权值矩阵。
twotail请求计算和显示双尾p值,而不是默认的单尾p值。
要运行spatgsa,必须至少指定以下选项之一:moran、geary和go。
案例代码为:
use columbusdata.dta,clear
spatgsa hoval income crime, weights(W) moran geary go
spatgsa hoval income crime, weights(W) moran geary twotail
结果为:
2、spatlsa
上述命令spatgsa为全局空间自相关度量提供了感兴趣的变量的空间分布的“平均”图,因此,可能隐藏了正在研究的现象的有趣特征。为了克服这一限制,在过去十年中,人们设计了一些局部空间自相关的测量方法。这些统计数据可以用于不同的目的。
当应用于缺乏全局空间自相关的数据集时,局部统计可能能够揭示一个或多个有限的区域,这些区域与空间随机性有显著的偏差。当应用于存在全局空间自相关的数据集时,局部统计可能有助于识别对空间聚类的总体模式贡献最大的位置(Sokal等人)。1998)。更一般地,使用局部统计来检测个别位置(有时称为热点)周围的显著空间聚类。
spatlsa计算四种局部空间自相关统计:Moran's Ii, Geary's ci, Getis and Ord's G1i, and Getis and Ord's G2i.。对于每个请求的统计量和每个分析的位置对象,spatlsa以表格的形式计算并显示统计量本身、统计量在局部空间独立的原假设下的期望值、统计量的标准差、z值,以及相应的1尾或2尾的p值。作为一个选项,spatlsa还显示一个Moran scatterplot、一个Moran scatterplot值的映射、一个G1i z值的映射或一个G2i z值的映射。
局部自相关检验用到的命令为spatlsa,语法格式为:
spatlsa varname , weights(matrix) [ moran geary go1 go2 id(varname) twotail sort graph(moran|go1|go1) symbol(id|n) map(filename) xcoord(varname) ycoord(varname) savegraph(filename [, replace]) ]
为了说明spatlsa的实际应用,让我们再次考虑哥伦布的数据。对变量 crime进行局部空间自相关检验, 我们必须输入以下commands:
案例代码为:
use columbusdata.dta,clear
spatlsa crime, weights(W) moran go2
结果为:
有时,按z值的升序显示结果可能会很有用:
spatlsa crime, weights(W) moran sort
结果为:
作为一个选项,spatlsa计算并显示一个Moran散点图(Anselin 1995)。然而,这个选项要求使用行标准化的权值矩阵,代码为:
spatwmat using columbusswm.dta, name(W) standardize
spatlsa crime,weights(W) moran graph(moran) symbol(n)
结果为:
作为一个选项,spatlsa可以显示一个地图的莫兰散点值,代码为:
spatlsa crime, w(WS) moran graph(moran) map(columbusboundary.dta) x(x) y(y)
结果为:
图:Map of Moran scatterplot values for variable crime.
3、spatcorr
spatcorr根据两个或多个连续的或累积的距离计算并可选地绘制Moran's I or Geary's空间相关图。spatcorr以表格的形式计算并显示所要求的统计量、在全局空间依赖的零假设下统计量的期望值、统计量的标准差、z值以及相应的单尾或双尾p值。
案例代码为:
use columbusdata.dta,clear
spatcorr crime,bands(0(1)5) xcoord(x) ycoord(y)
默认Moran'sI 统计量;距离范围:0-5,距高带宽:1
spatcorr crime,bands(0(1)5) xcoord(x) ycoord(y) geary
设置为Geary's c统计量
spatcorr crime,bands(0(1)5)xcoord(x) ycoord(y) twotail
设置为双尾检验
spatcorr crime,bands(O(1)5) xcoord(x) ycoord(y) cumulative
设置为累计分段
spatcorr crime, bands(0(1)5) xcoord(x) ycoord(y) graph
//绘制指数图
结果为:
3
空间诊断
主要包括spatdiag命令。
空间自相关统计给出的重要空间聚类模式的指示,只是空间数据分析的第一步。这些统计数据表明,与随机赋值相比,感兴趣的变量Y在不同位置所取的值在空间上更集中,但它们不能解释为什么会出现这种聚集(Anselin 1992b)。要回答这个问题,可以使用标准的OLS回归模型。
其中,Y 表示 一 个 N *1的的观测向量,即被解释变量Y, X 表示 一 个 N* k列矩阵的观测变量,即解释变量X, β表示 k *1列向量系数 。
当观测是空间单元,即地理位置时,由于观测之间存在空间依赖性,标准OLS回归模型可能会被错误指定。在这个情况下中,将考虑两种空间依赖关系。第一个在误差项上采用空间自回归过程的形式,对应如下空间回归模型
我们把这个模型称为空间误差模型。
第二种空间依赖是以混合回归空间自回归过程的形式出现的,对应如下空间回归模型
我们把这个模型称为空间滞后模型。
spatdiag对这两种类型的空间依赖性进行了一些测试。在进行这些测试之前,必须使用回归估计OLS回归模型。回到哥伦布市的数据,假设我们想把犯罪(每1000户家庭中发生的入室盗窃和车辆盗窃)表示为被解释变量,解释变量为hoval(房屋价值以美元计,数千美元)和收入income(家庭收入以美元计,数千美元)的线性和附加函数:
案例代码为:
use columbusdata.dta,clear
spatwmat using columbusswm.dta, name(W) standardize
regress crime hoval income
spatdiag, weights(W)
结果为:
我们可以看到从spatdiag执行三个空间误差依赖的统计量 (Moran’s I 、Lagrange multiplier、Robust Lagrange multiplier) 和两个测试空间 滞后依赖的统计量 (simple Lagrange multiplier LM、and robust Lagrange multiplier LM)
4
空间回归分析
主要包括spatreg命令。
spatreg使用Stata的最大似然估计空间误差和空间滞后回归模型。
代码为:
use columbusdata.dta, clear
spatwmat using columbusswm.dta, name(W) eigenval(E) standardize
*计量经济学服务中心推文之空间计量回归分析
spatreg crime hoval income, weights(W) eigenval(E) model(error)
结果为:
除了通常的统计之外,spatreg为空间误差模型生成的输出还报告了以下信息:
Sigma这是最大似然根MSE。
三 个测试结果假设是 (Wald, likelihood-ratio, LM).虽然这三种检验是渐近等价的,但它们在有限样本中往往产生不同的结果。在大多数情况下,测试统计数据的顺序,他们大小是W> LR> LM (Anselin 1988 ).只有在未指定选项稳健性robust的情况下才进行概率比检验。
spatreg对空间滞后模型产生的输出与对空间误差模型产生的输出完全相同
代码为:
use columbusdata.dta, clear
spatwmat using columbusswm.dta, name(W) eigenval(E) standardize
*计量经济学服务中心推文之空间滞后回归模型
spatreg crime hoval income, weights(W) eigenval(E) model(lag)
结果为:
◆◆◆◆
精彩回顾
点击上图查看:
《零基础|轻松搞定空间计量:空间计量及GeoDa、Stata应用》
点击上图查看:
点击上图查看:
空间计量第三部:空间计量及Matlab应用课程(SPATIAL AUTOREGRESSIVE MODELS USING STATA)