地理探测器学习与应用(一)
地理探测器是王劲峰老师团队开发的一套用于度量空间分异性、探测解释因子、分析变量之间交互关系的软件,已在自然和社会科学多领域得到了应用。
基本原理
地理探测器主要帮助研究地理学第二定律,空间异质性相关的问题。
空间分层异质性(spatial stratified heterogeneity),简称空间分异性或区异性,是指层内方差小于层间方差的地理现象,例如地理分区、气候带、生物区系、区际经济差异、城乡差异及主体功能区等。
“层(strata)”是统计学概念,大体对应地理上的类(classes) 或 子区域(sub regions)。
最开始我是先看的地理探测器的网站,看到了“strata”这个词,我是蒙圈的,后来看了王老师的中文论文才明白,这是个统计学概念,我觉得可以不用管它,只要知道地理探测器讨论的是不同地理子区域之间的异质性问题就好。
地理探测器特点
地理探测器是探测空间分异性,以及揭示其背后驱动力的一组统计学方法。
核心思想
基于这样的假设: 如果某个自变量对某个因变量有重要影响,那么自变量和因变量的空间分布应该具有相似性。
地理探测器的优势
地理探测器既可以探测定性数据,又可以探测定量数据; 地理探测器可以探测两因子交互作用,且可以探测交互作用的强弱、方向、线性还是非线性。
地理探测器原理
地理探测器是探测和利用空间分异性的工具,包括四个探测器:
分异及因子探测; 交互作用探测; 风险区探测; 生态探测。
1. 分异及因子探测
探测Y的空间分异性;以及探测某因子X多大程度上解释了属性Y的空间分异,用q值度量,公式略。q值越大,自变量X对Y的解释力越强,q值表示X解释了100×q%的Y。
2. 交互作用探测
识别不同风险因子Xs之间的交互作用,即评估因子X1和X2共同作用时是否会增加或减弱对因变量 Y 的解释力,或这些因子对Y的影响是相互独立的。
计算内容:
因子X1对Y的q值 q(X1) 因子X2对Y的q值 q(X2) X1,X2相交后对Y的q值 q(X1∩X2)
计算结果:
当q(X1∩X2)小于q(X1)、q(X2)中最小的一个时,X1,X2对Y的解释力呈非线性减弱关系; 当q(X1∩X2)大于q(X1)、q(X2)中最小的一个,且小于它俩最大的一个时,X1,X2对Y的解释力呈单因子非线性减弱关系; 当q(X1∩X2)大于q(X1)、q(X2)中最大的一个时,X1,X2对Y的解释力呈双因子增强关系; 当q(X1∩X2)等于q(X1)、q(X2)之和时,X1,X2对Y的解释力相互独立; 当q(X1∩X2)大于q(X1)、q(X2)之和时,X1,X2对Y的解释力呈非线性增强关系。
3. 风险区探测
用于判断两个子区域间的属性均值是否有显著的差别,用t统计量来检验,公式略。如果在置信水平α下,两属性均值相等未通过假设检验,则认为两子区域间属性值存在明显差异。
4. 生态探测
用于比较两因子X1和X2对属性Y的空间分布的影响是否有显著的差异,以F统计量来衡量。公式略,见论文原文。
当X1、X2层内方差之和在α的显著性水平上不相等时,X1和X2对Y的空间分布的影响存在显著差异。
以上就是地理探测器的原理部分介绍,更详细的还请大家阅读王老师的论文。
论文中王老师的网站网址发生了变化,需要下载和查阅地理探测器更多资料的同学请点击阅读原文跳转最新的地理探测器网址。
参考文献
王劲峰, 徐成东. 地理探测器:原理与展望[J]. 地理学报, 2017, 72(001):116-134.
欢迎大家留言讨论。
如果觉得不错还请分享、点赞、再看,谢谢支持!