查看原文
其他

地理探测器及其在人文地理学中的应用

学术无界 2019-06-30

点击蓝字

关注我们

       作为人文地理学专业的硕士生,会有参加学术年会的机会。在暑假期间,小编就参加了人文地理学年会,在大会期间,听了王劲峰老师关于地理探测器的报告,觉得尤为受用。在会后对其进行了学习。现在和小伙伴们一起分享!

 一  简介

1.1 引言

       随着定位及观测技术的发展和普及,无论是更精细或者更大范围的研究,还是空间大数据,空间分层异质性(spatial stratified heterogeneity) 问题凸显。空间分层异质性,简称空间分异性或区异性,是指层内方差小于层间方差的地理现象,例如地理分区、气候带、土地利用图、地貌图、生物区系、区际经济差异、城乡差异以及主体功能区等,是空间数据的另一大特性。“层 ”是统计学概念,大体对应地理上的类或子区域。

       地理探测器是探测空间分异性,以及揭示其背后驱动力的一组统计学方法。其核心思想是基于这样的假设:如果某个自变量对某个变量有重要影响,那么自变量和因变量的空间分布应该具有相似性。地理探测器擅长分析类型量,而对于顺序量、比值量或间隔量,只要进行适当的离散化,也可以利用地理探测器对其进行统计分析。因此,地理探测器既可以探测数值型数据,也可以探测定性数据,这正是地理探测器的一大优势。地理探测器的另一个独特优势是探测两因子交互作用于因变量。交互作用一般的识别方法是在回归模型中增加两因子的乘积项,检验其统计显著性。然而,两因子交互作用不一定就是相乘关系。地理探测器通过分别计算和比较各单因子q 值及两因子叠加后的q 值,可以判断两因子是否存在交互作用,以及交互作用的强弱、方向、线性还是非线性等。两因子叠加既包括相乘关系,也包括其他关系,只要有关系,就能检验出来。

1.2 原理

       空间分异性是地理现象的基本特点之一。地理探测器是探测和利用空间分异性的工具。地理探测器包括4 个探测器。

       (1)分异及因子探测:探测Y的空间分异性;以及探测某因子X多大程度上解释了属性Y的空间分异(图1)。用q 值度量。q 的值域为[0, 1],值越大说明Y的空间分异性越明显;如果分层是由自变量X生成的,则q 值越大表示自变量X对属性Y的解释力越强,反之则越弱。极端情况下,q 值为1 表明因子X完全控制了Y的空间分布,q值为0 则表明因子X与Y没有任何关系,q值表示X解释了100×q%的Y。

       (2)交互作用探测:识别不同风险因子Xs 之间的交互作用,即评估因子X1 和X2 共同作用时是否会增加或减弱对因变量Y 的解释力,或这些因子对Y 的影响是相互独立的。

       (3)风险区探测:用于判断两个子区域间的属性均值是否有显著的差别。

       (4)生态探测:用于比较两因子X1 和X2 对属性Y 的空间分布的影响是否有显著的差异。

其中,Yi代表的是变量Y在样本单位i的值;h(Y)表示Y的划分;h(X)代表一个解释变量X的划分。

1.3 功能

地理探测器由四种功能组成:

      (1)风险探测器显示潜在危险区域Y(X);

      (2)因子检测器q统计量测量变量Y的SSH,或者说是Y的协变量X的行列式;

      (3)生态探测器确定了两个风险因素之间的影响差异;

      (4)交互检测器揭示了风险因素X1和X2(以及更多的X)是否对Y有交互影响。

1.4  进展

      王老师团队利用Excel和R分别开发了地理探测器软件。这些工具可以免费下载的,并且没有任何GIS插件组件和“一次点击”的执行,易于使用。在下面软件下载部分有下载网址,小伙伴们可以自行下载使用。下面一部分,小编将展示Excel Geodetector软件操作步骤。

二 操作步骤

2.1 下载软件并在Excel中输入数据

        (1)下载Excel Geodetector软件,解压缩下载的文件,你会发现一个Excel文件(这是一个示例数据集Geodetector软件),双击Excel文件,图2和图4显示。图2给出了地理探测器的输入数据的格式:每一行表示一个样本单元(例如一个村庄);第一栏记录疾病流行率(Y);第二列和下面的列表示Y或因子X的分区,后者是根据地层中的相似性进行划分的。

       (2)以图2的格式输入你的数据到Excel 地理探测器软件。然后进入第2步。

       (3)如果你的数据是GIS格式,请将GIS数据转换为Excel数据,如图2所显示。

其中,Y为数值型变量;X为分级变量。例如,土地使用类型。如果X是数值,它应该被转化为分级,例如,人均GDP分为5个等级。

2.2 运行GeoDetector软件

       设计一个操作接口(图4),“读取数据”按钮的功能是加载数据;因此,当点击按钮时,所有的变量都列在“变量”列表框中。然后,将Y或环境因素变量的疾病和分区选择到相应的列表框中,在接口的右侧。最后,通过单击“Run”按钮来执行地理探测器软件。

三 结果输出

       在“风险检测器”表(图6)中,每个环境风险因素的结果在两个表中显示。第一张表给出了风险因素各层的平均发病率,其名称是在表的左上角写的。第二张表给出了两层平均疾病发病率的统计显著差异;如果有显著的差异,对应的值是“Y”,否则就是“N”。

       在“风险检测器”表(图6)中,每个环境风险因素的结果信息在两个表中显示。第一张表给出了风险因素各层的平均发病率,其名称是在表的左上角写的。第二张表给出了两层平均疾病发病率的统计显著差异;如果有显著的差异,对应的值是“Y”,否则就是“N”。

       图7显示了每个环境风险因素的q值的输出格式,如因子检测器表所示。表头给出了环境风险因素的名称,而相关的q值(q1、q2、qn)及其相应的p值则在下面一行中给出。

        在生态检测器表(图8)中,给出了两个环境风险因素之间的统计显著差异的结果。如果Y(X1)(风险因素名)比Y(X2)(列中的风险因素名)大得多,那么相关的值是Y,而N表示相反的意思。

        交互检测器的结果格式如图9所示。表下的交互关系表示这两个因素的交互关系。关系是在一个坐标轴中定义的。它有5个间隔,包括(-∞,min(q(x),q(y)));(min(q(x),q(y)),max(q(x),q(y)));(max(q(x),q(y)),q(x)+q(y));q(x)+q(y);(q(x)+q(y),+∞)。交互关系由5个间隔中的q(x∩y)的位置决定(见表1)。

四 软件下载

软件下载和示例数据集网址:

(1)Excel 软件包
http://www.geodetector.cn/GeoDetector_2015_Example(DiseaseDataset).zip

(2)R语言软件包

https://cran.r-project.org/web/packages/geodetector/index.html

论文学习网址:

http://www.geodetector.cn

http://www.sssampling.cn/down/2017王劲峰_地理探测器_原理与展望.pdf

资源仅供学术交流使用,严禁商用!

如有侵权,联系小编微信:

18211719372


素材来源:http://www.geodetector.cn

                 王劲峰,徐成东.地理探测器:原理与展望[J].地理学报,2017,72(01):116-134.

推文期数:2018086

责任编辑:张晶飞  骆丹云  李飞  刘亮

推文审核:张天舒  梁龙武  骆丹云

素材审核:胡森林

总审核:学术无界顾问团

下期预告:ENVI实用技术分享(二)

往期回顾:

利用ENVI 中物质识别的功能在高光谱遥感影像上寻找物质攻略—— 以寻找明矾石为例

[随心笔谈]乡村理想交响曲

就业招聘|硕博招聘信息二

学术会议通知

点击底部广告,支持我们~

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存