查看原文
其他

GWR|ArcGIS中地理加权回归的操作与解读(二)地理加权回归操作与结果解读

张家星 星8氪 2021-09-21

点击上方蓝色字体,关注我们


站在巨人的肩膀上,俯瞰世界。



几点说明:

1.本文使用的软件是:ArcGIS10.7

2.本文从应用角度出发,侧重于操作方法,有关理论基础和数学推导可参考其他公开发表的论文

3.主要参考来源:ArcGIS帮助文档、公众号:曾冰在路上,虾神daxialu

4.考虑到本人水平有限,如有错误,欢迎大家批评指教!

5.如果本文对您有所帮助,欢迎点赞、转发与在看!感谢!

6.关注公众号,未来会分享更多精彩内容!希望我们能共同成长!



01

普通最小二乘法回归(OLS)操作


注意事项:


(1)应该始终从普通最小二乘法 (OLS) 回归开始回归分析。首先获得一个正确指定的 OLS 模型,然后使用同样的解释变量运行GWR。


(2)仅当数据和回归模型满足该方法固有要求的所有假定条件时,OLS 回归得出的结果才可信。


(3)唯一ID字段用于将模型预测连接到各个要素。因此,每个要素的唯一 ID 值都必须唯一,而且通常应是与要素类一同保留的永久性字段。最好避免将图层所带的FID直接当作唯一ID,可以新建和FID值相同的一列当作唯一ID,否则当图层发生变化时,FID会随着改变,那OLS的结果也会随之发生变化。


(4)只要回归残差存在统计上明显的空间自相关,OLS 模型就会视为指定有误,从而使 OLS 回归的结果变得不可靠。如果模型错误原因是因为使用全局模型回归导致的(OLS是一种全局回归),则可以考虑使用GWR。


1.打开ols工具并设置参数


2.主要回归结果解释



(1)系数:每个解释变量的系数既反映它与因变量之间的关系强度,也反映它与因变量之间的关系类型。

(2)概率:显著性p值

(3)R方:多重可决系数 (Multiple R-Squared) 和校正可决系数 (Adjusted R-Squared) 的值都可用于测量模型的性能。R方越大拟合效果越好。

(4)AICc:性能的测量。AICc值越小越好。

(5)VIF:用于测量解释变量中的冗余。一般来说,与大于 7.5 的 VIF 值关联的解释变量应逐一从回归模型中移除。


解释注意事项:


模型选择时OLS和GWR主要对比R方AICc值的大小

详细OLS解读参考:

https://desktop.arcgis.com/zh-cn/arcmap/10.3/tools/spatial-statistics-toolbox/interpreting-ols-results.htm


02

地理加权回归(GWR)操作


1.打开地理加权回归



2.得到地理加权回归结果


3.附加表格的参数解读



(1)Bandwidth /Neighbors:是指用于各个局部估计的带宽或相邻点数目,并且可能是“地理加权回归”的最重要参数。它控制模型中的平滑程度。通常,您将通过程序选择所需的带宽值或相邻点值,方法是为带宽方法参数选择修正的 Akaike 信息准则 (AICc)交叉验证 (CV)。这两个选项都将尝试识别最佳固定距离或最佳自适应相邻点数目。由于“最佳”条件对于 AICc 和 CV 并不相同,因此通常会获得不同的最佳值。还可以通过为带宽方法选择如下指定参数来提供精确的固定距离或特定的邻域数还可以通过为带宽方法择 BANDWIDTH_PARAMETER 来提供精确的固定距离或特定的邻域数


带宽单位取决于指定的核类型。如果选择 FIXED,带宽值将使用与输入要素类相同的单位来反映距离(例如,如果使用 UTM 坐标对输入要素类进行投影,报告的距离将以米为单位)。如果选择 ADAPTIVE,带宽距离将根据输入要素类中要素的空间密度发生变化。带宽将成为最近相邻点数的函数,这样每个局部估计都将基于相同数量的要素。将报告用于分析的相邻点的数目,而不是特定距离。

(2)ResidualSquares:指模型中的残差平方和(残差为观测所得 y 值与 GWR 模型所返回的 y 值估计值之间的差值)。此测量值越小,GWR 模型越拟合观测数据。此值还在其他多个诊断测量值中使用。

(3)EffectiveNumber:此值反映了拟合值的方差与系数估计值的偏差之间的折衷,与带宽的选择有关。带宽接近无穷大时,每个观测值的地理权重都将接近 1,系数估计值与全局 OLS 模型的相应值将非常接近。

(4)Sigma:此值为正规化剩余平方和(剩余平方和除以残差的有效自由度)的平方根。它是残差的估计标准差。此统计值越小越好。Sigma 用于 AICc 计算。

(5)AICc:这是模型性能的一种度量,有助于比较不同的回归模型。考虑到模型复杂性,具有较低 AICc 值的模型将更好地拟合观测数据。AICc 不是拟合度的绝对度量,但对于比较适用于同一因变量且具有不同解释变量的模型非常有用。如果两个模型的 AICc 值相差大于 3,具有较低 AICc 值的模型将被视为更佳的模型。将 GWR AICc 值与 OLS AICc 值进行比较是评估从全局模型 (OLS) 移动到局部回归模型 (GWR) 的优势的一种方法。


6)R2:R 平方是拟合度的一种度量。其值在 0.0 到 1.0 范围内变化,值越大越好。此值可解释为回归模型所涵盖的因变量方差的比例。R2 计算的分母为因变量值平方和。向模型中再添加一个解释变量不会更改分母但会更改分子;这将出现改善模型拟合的情况(但可能为假象)。请参阅下文中的“校正的 R2”

(7)R2Adjusted:由于上述 R2 值问题,校正的 R 平方值的计算将按分子和分母的自由度对它们进行正规化。这具有对模型中变量数进行补偿的效果,因此校正的 R2 值通常小于 R2 值。但是,执行此校正时,无法将该值的解释作为所解释方差的比例。在 GWR 中,自由度的有效值是带宽的函数,因此与像 OLS 之类的全局模型相比,校正程度可能非常明显。因此,AICc 是对模型进行比较的首选方式。


4.GWR回归结果表格解读



建议:在arcgis中看表格比较累,可以通过转表工具,转换成excel文件后再进行分析。


部分回归结果:



(1)Cond(条件数):此诊断用于评估局部多重共线性。存在较强局部多重共线性的情况下,结果将变得不稳定。与大于 30 的条件数相关联的结果可能不可靠。

(2)Local R2:这些值的范围是 0.0 与 1.0 之间,表示局部回归模型与观测所得 y 值的拟合程度。如果值非常低,则表示局部模型性能不佳。

(3)C1(预测值):这些值是由 GWR 计算所得的系数

4)残差:要获得残差值,可从观测所得 y 值中减去拟合 y 值。标准化残差的平均值为零,标准差为 1。

(5)系数标准误差:这些值用于衡量每个系数估计值的可靠性。标准误差与实际系数值相比较小时,这些估计值的可信度会更高。较大标准误差可能表示局部多重共线性存在问题。


更多解释请参考:

https://desktop.arcgis.com/zh-cn/arcmap/10.3/tools/spatial-statistics-toolbox/interpreting-gwr-results.htm


03

地理加权回归(GWR)检验

   

考虑到:如果回归模型缺少关键解释变量,则会导致回归模型的指定错误。如果回归残差的空间自相关具有统计学上的显著性,和/或在一个或多个解释变量的系数当中发生了非期望的空间变化,则表明您的模型被错误指定了。您应该尽一切努力(例如,通过 OLS 残差分析和 GWR 系数变化分析)来查找这些丢失的关键变量,以便在模型中包含这些变量。


所以:需要对回归结果的残差再做一次空间莫兰I指数,看残差是否呈现随机分布,如果残差出现集聚现象,则说明GWR模型参数构建出现问题,需要增加或减少解释变量



GWR模型参数设计或许出现一些偏差,不过有些文章中并没有对残差进行空间自相关分析,所以这也是一个我困惑的点,希望大家不吝赐教!


04

有待讨论的问题

1.AICc值为负的怎么解读?

2.是否需要对GWR残差进行空间自回归分析?

3.GWR操作起来比较容易,困难在于一个好的研究问题以及结果的解读

4.如有错误,请大家批评指教!


往期内容精选

1.ArcGIS|制作Cartogram变形地图

2.MGWR|案例重现:北京二手房价格影响因素空间探索

3.Ucinet|社会网络分析之点度中心性可视化

4.stata|生成空间权重矩阵之邻接矩阵(0-1矩阵)

5.免费共享|中国省、市、县夜间灯光数据(1992-2019年)

6.GTWR|地理时空加权回归插件安装与操作

7.stata|如何将横截面数据转换成面板数据

8.GWR|ArcGIS中地理加权回归的操作与解读(一)总体思路与空间自相关分析


欢迎扫码关注公众号

公众号|星8氪

分享有关区域经济的感悟

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存