GWR|ArcGIS中地理加权回归的操作与解读(一)总体思路与空间自相关分析
点击上方蓝色字体,关注我们
站在巨人的肩膀上,俯瞰世界。
”
几点说明:
1.本文使用的软件是:ArcGIS10.7
2.本文从应用角度出发,侧重于操作方法,有关理论基础和数学推导可参考其他公开发表的论文
3.主要参考来源:ArcGIS帮助文档、公众号:曾冰在路上,虾神daxialu
4.考虑到本人水平有限,如有错误,欢迎大家批评指教!
5.如果本文对您有所帮助,欢迎点赞、转发与在看!感谢!
6.关注公众号,未来会分享更多精彩内容!希望我们能共同成长!
01
地理加权回归(GWR)简介
地理加权回归(Geographically weighted regression, GWR)是一种空间分析技术,广泛应用于地理学及涉及空间模式分析的相关学科。GWR通过建立空间范围内每个点处的局部回归方程,来探索研究对象在某一尺度下的空间变化及相关驱动因素,并可用于对未来结果的预测。由于它考虑到了空间对象的局部效应,因此其优势是具有更高的准确性。
在空间分析中,观测数据一般按照给定的地理位置作为采样单元进行采样,随着地理位置的变化,变量间的关系或者结构会发生改变,即GIS中所说的“空间非平稳性 。这种空间非平稳性普遍存在于空间数据中,如不同省份的AIDS发病率、湖泊不同深度TN含量、城市工业区与非工业区PM2.5浓度等等。如果采用传统的线性回归模型来分析空间数据,一般很难得到令人满意的结果,因为全局模型在分析前就假定了变量间的关系具有“各向同性”,所得结果只是研究区域内的某种“平均”。因此,有必要采用一种新的局部回归方法,来应对空间数据自身的这种属性。
02
总体思路
1.对被解释变量做空间自相关分析。通过全局莫兰I指数和局部莫兰指数来判断被解释变量是否存在空间集聚现象,如莫兰I指数显著则说明被解释变量并不是随机独立的,考虑使用地理加权回归(GWR)。
2.普通最小二乘法回归(OLS)
应该始终从普通最小二乘法 (OLS) 回归开始回归分析。首先获得一个正确指定的 OLS 模型,然后使用同样的解释变量运行GWR
3.地理加权回归(GWR)
注意事项:
(1)GWR 为数据集中的各要素构建了一个独立的方程,用于将各目标要素的带宽范围内的要素的因变量和解释变量进行合并。带宽的形状和范围取决于用户输入的核类型、带宽方法、距离以及相邻要素数等参数,但也存在一条限制:如果相邻要素的数目超过 1000,则仅将最相邻的 1000 个要素合并到各个局部方程中。对于GWR来说最重要的就是尺度,尺度的体现就是带宽。
(2)GWR 通常被要求用于处理包含数百个要素的数据集,以便获得最佳结果, GWR 不适用于小型数据集。看一些文献中样本数量在30左右貌似也可以。
(3)因变量和解释变量应该是包含各种值的数值型字段。GWR不适于预测二进制结果(例如,因变量的所有值不是 1 就是 0)。请勿使用人工解释变量来表示 GWR 模型中的不同空间组织(例如,向城镇中心外的人口普查区赋予值 1,而向其他区域赋予值 0)。由于 GWR 允许解释变量系数发生变化,这些空间组织解释变量并不必要,并且如果包含了这些变量,则会产生局部多重共线性问题。
4.GWR结果检验
如果回归残差的空间自相关具有统计学上的显著性,或者在一个或多个解释变量的系数当中发生了非期望的空间变化,则表明错误指定了您的模型。如果回归模型缺少关键解释变量,则会导致回归模型的指定错误。您应该尽一切努力(例如,通过 OLS 残差分析和 GWR 系数变化分析)来查找这些丢失的关键变量,以便在模型中包含这些变量。
参考来源:
https://desktop.arcgis.com/zh-cn/arcmap/10.7/tools/spatial-statistics-toolbox/geographically-weighted-regression.htm
03
空间自相关分析
1.导入shp格式图层
2.把表格导入arcgis并关联到相应图层
不会导入和关联表格的朋友可以参考下面这个链接,有详细的步骤。
3.对被解释变量做全局莫兰I指数
4.全局莫兰I指数解读
被解释变量的z得分和p值都满足条件,考虑进行地理加权回归
5.局部高低聚类分析
6.局部高低聚类图
可得到具体冷热点图
7.局部莫兰I指数图
打开属性表可以看到更为具体的情况
分析完全局和局部莫兰指数后,我们便可进行下一步地理加权回归!
具体操作我们下一篇推送见!
往期内容精选
5.免费共享|中国省、市、县夜间灯光数据(1992-2019年)
欢迎扫码关注公众号
公众号|星8氪
分享有关区域经济的感悟