地理探测器及其在人文地理学中的应用
点击蓝字
关注我们
作为人文地理学专业的硕士生,会有参加学术年会的机会。在暑假期间,小编就参加了人文地理学年会,在大会期间,听了王劲峰老师关于地理探测器的报告,觉得尤为受用。在会后对其进行了学习。现在和小伙伴们一起分享!
一 简介
1.1 引言
随着定位及观测技术的发展和普及,无论是更精细或者更大范围的研究,还是空间大数据,空间分层异质性(spatial stratified heterogeneity) 问题凸显。空间分层异质性,简称空间分异性或区异性,是指层内方差小于层间方差的地理现象,例如地理分区、气候带、土地利用图、地貌图、生物区系、区际经济差异、城乡差异以及主体功能区等,是空间数据的另一大特性。“层 ”是统计学概念,大体对应地理上的类或子区域。
地理探测器是探测空间分异性,以及揭示其背后驱动力的一组统计学方法。其核心思想是基于这样的假设:如果某个自变量对某个变量有重要影响,那么自变量和因变量的空间分布应该具有相似性。地理探测器擅长分析类型量,而对于顺序量、比值量或间隔量,只要进行适当的离散化,也可以利用地理探测器对其进行统计分析。因此,地理探测器既可以探测数值型数据,也可以探测定性数据,这正是地理探测器的一大优势。地理探测器的另一个独特优势是探测两因子交互作用于因变量。交互作用一般的识别方法是在回归模型中增加两因子的乘积项,检验其统计显著性。然而,两因子交互作用不一定就是相乘关系。地理探测器通过分别计算和比较各单因子q 值及两因子叠加后的q 值,可以判断两因子是否存在交互作用,以及交互作用的强弱、方向、线性还是非线性等。两因子叠加既包括相乘关系,也包括其他关系,只要有关系,就能检验出来。
1.2 原理
空间分异性是地理现象的基本特点之一。地理探测器是探测和利用空间分异性的工具。地理探测器包括4 个探测器。
(1)分异及因子探测:探测Y的空间分异性;以及探测某因子X多大程度上解释了属性Y的空间分异(图1)。用q 值度量。q 的值域为[0, 1],值越大说明Y的空间分异性越明显;如果分层是由自变量X生成的,则q 值越大表示自变量X对属性Y的解释力越强,反之则越弱。极端情况下,q 值为1 表明因子X完全控制了Y的空间分布,q值为0 则表明因子X与Y没有任何关系,q值表示X解释了100×q%的Y。
(2)交互作用探测:识别不同风险因子Xs 之间的交互作用,即评估因子X1 和X2 共同作用时是否会增加或减弱对因变量Y 的解释力,或这些因子对Y 的影响是相互独立的。
(3)风险区探测:用于判断两个子区域间的属性均值是否有显著的差别。
(4)生态探测:用于比较两因子X1 和X2 对属性Y 的空间分布的影响是否有显著的差异。
其中,Yi代表的是变量Y在样本单位i的值;h(Y)表示Y的划分;h(X)代表一个解释变量X的划分。
1.3 功能
地理探测器由四种功能组成:
(1)风险探测器显示潜在危险区域Y(X);
(2)因子检测器q统计量测量变量Y的SSH,或者说是Y的协变量X的行列式;
(3)生态探测器确定了两个风险因素之间的影响差异;
(4)交互检测器揭示了风险因素X1和X2(以及更多的X)是否对Y有交互影响。
1.4 进展
王老师团队利用Excel和R分别开发了地理探测器软件。这些工具可以免费下载的,并且没有任何GIS插件组件和“一次点击”的执行,易于使用。在下面软件下载部分有下载网址,小伙伴们可以自行下载使用。下面一部分,小编将展示Excel Geodetector软件操作步骤。
二 操作步骤
2.1 下载软件并在Excel中输入数据
(1)下载Excel Geodetector软件,解压缩下载的文件,你会发现一个Excel文件(这是一个示例数据集Geodetector软件),双击Excel文件,图2和图4显示。图2给出了地理探测器的输入数据的格式:每一行表示一个样本单元(例如一个村庄);第一栏记录疾病流行率(Y);第二列和下面的列表示Y或因子X的分区,后者是根据地层中的相似性进行划分的。
(2)以图2的格式输入你的数据到Excel 地理探测器软件。然后进入第2步。
(3)如果你的数据是GIS格式,请将GIS数据转换为Excel数据,如图2所显示。
其中,Y为数值型变量;X为分级变量。例如,土地使用类型。如果X是数值,它应该被转化为分级,例如,人均GDP分为5个等级。
2.2 运行GeoDetector软件
设计一个操作接口(图4),“读取数据”按钮的功能是加载数据;因此,当点击按钮时,所有的变量都列在“变量”列表框中。然后,将Y或环境因素变量的疾病和分区选择到相应的列表框中,在接口的右侧。最后,通过单击“Run”按钮来执行地理探测器软件。
三 结果输出
在“风险检测器”表(图6)中,每个环境风险因素的结果在两个表中显示。第一张表给出了风险因素各层的平均发病率,其名称是在表的左上角写的。第二张表给出了两层平均疾病发病率的统计显著差异;如果有显著的差异,对应的值是“Y”,否则就是“N”。
在“风险检测器”表(图6)中,每个环境风险因素的结果信息在两个表中显示。第一张表给出了风险因素各层的平均发病率,其名称是在表的左上角写的。第二张表给出了两层平均疾病发病率的统计显著差异;如果有显著的差异,对应的值是“Y”,否则就是“N”。
图7显示了每个环境风险因素的q值的输出格式,如因子检测器表所示。表头给出了环境风险因素的名称,而相关的q值(q1、q2、qn)及其相应的p值则在下面一行中给出。
在生态检测器表(图8)中,给出了两个环境风险因素之间的统计显著差异的结果。如果Y(X1)(风险因素名)比Y(X2)(列中的风险因素名)大得多,那么相关的值是Y,而N表示相反的意思。
交互检测器的结果格式如图9所示。表下的交互关系表示这两个因素的交互关系。关系是在一个坐标轴中定义的。它有5个间隔,包括(-∞,min(q(x),q(y)));(min(q(x),q(y)),max(q(x),q(y)));(max(q(x),q(y)),q(x)+q(y));q(x)+q(y);(q(x)+q(y),+∞)。交互关系由5个间隔中的q(x∩y)的位置决定(见表1)。
四 软件下载
软件下载和示例数据集网址:
(1)Excel 软件包
http://www.geodetector.cn/GeoDetector_2015_Example(DiseaseDataset).zip
(2)R语言软件包
https://cran.r-project.org/web/packages/geodetector/index.html
论文学习网址:
http://www.geodetector.cn
http://www.sssampling.cn/down/2017王劲峰_地理探测器_原理与展望.pdf
资源仅供学术交流使用,严禁商用!
如有侵权,联系小编微信:
18211719372
素材来源:http://www.geodetector.cn
王劲峰,徐成东.地理探测器:原理与展望[J].地理学报,2017,72(01):116-134.
推文期数:2018086
责任编辑:张晶飞 骆丹云 李飞 刘亮
推文审核:张天舒 梁龙武 骆丹云
素材审核:胡森林
总审核:学术无界顾问团
下期预告:ENVI实用技术分享(二)
往期回顾:
点击底部广告,支持我们~