专辑论文 | 朱庆等:环境因子空间特征约束的区域滑坡敏感性模糊逻辑分析方法 | 武汉大学学报·信息科学版
本文改编自学术论文《环境因子空间特征约束的区域滑坡敏感性模糊逻辑分析方法》
已刊载于《武汉大学学报·信息科学版》2021年第10期
朱 庆1 张曼迪1 丁雨淋1 曾浩炜1 王 玮2 刘 飞1,3
1. 西南交通大学地球科学与环境工程学院,四川 成都,611756
2. 轨道交通工程信息化国家重点实验室 (中铁一院), 陕西 西安,710043
3. 四川测绘地理信息局测绘技术服务中心,四川 成都,610081
朱 庆
博士,教授,研究方向为多维动态GIS与虚拟地理环境。zhuq66@263.net
摘 要
中国西部山区灾难性滑坡事件频繁发生,滑坡敏感性分析已成为灾前科学预警和主动防范的必要手段。传统滑坡敏感性分析方法中单一知识驱动模型对滑坡灾害环境因子定权主观性强,数据驱动模型过分依赖样本数据的质量及数量。
针对上述问题,提出了一种环境因子空间关联特征与启发式模糊逻辑模型耦合的区域滑坡敏感性分析方法,通过灾害环境因子滑坡频率比与信息熵权等空间统计指标,显式描述滑坡灾害环境因子的贡献度与空间分布特征,以此约束多因子耦合的区域滑坡敏感性计算。选择中国重庆市奉节县内的灾害多发地带进行验证评估,实验结果表明,所提方法优于单一的信息量模型、信息量-逻辑回归模型方法。
引 用
朱庆, 张曼迪, 丁雨淋, 曾浩炜, 王玮, 刘飞. 环境因子空间特征约束的区域滑坡敏感性模糊逻辑分析方法[J]. 武汉大学学报 · 信息科学版, 2021, 46(10): 1431-1440. doi: 10.13203/j.whugis20200653
滑坡敏感性分析是滑坡研究的热点与难点,通过分析区域内滑坡灾害环境因子与滑坡的关系,挖掘滑坡分布规律,定性或定量分析现存或潜在滑坡空间分布和发生概率。滑坡成因复杂,其影响因子包括引起滑坡的内部孕灾因子(地形地貌、地层岩性、地质构造、交通水系等)与外部诱发因子(降雨、地震、人类工程活动等)。
当前最常用的滑坡敏感性分析方法有:(1)知识驱动类型,包括模糊逻辑法、模糊综合评判法、层次分析法和专家系统法等;(2)数据驱动类型,包括信息量、熵值数、支持向量机、随机森林、人工神经网络。两种方法各有其优缺点:
1)知识驱动方法简便、可操作性强,不依赖数据样本,其结果能较好地表达滑坡成灾机理。但当前滑坡灾害知识库构建不完备,存在“数据-信息-知识”转化能力不足问题,滑坡灾害环境因子定权受专家主观性较强,难以灵活应对不同研究区域与灾害场景。
2)数据驱动方法,通过客观数理分析与非线性特征保证了计算分析结果的准确性,但需要大量且全局空间代表性好的观测样本,无法深度挖掘滑坡的成灾机理,分析结果易出现欠拟合或过度拟合现象。这与当前观测数据量大但时空信息量少、滑坡的隐蔽性高、滑坡目录数据集收录不完整等客观现状相矛盾。
近年来,知识驱动与数据驱动模型相结合的滑坡敏感性分析方法得到广泛关注,许多学者系统分析滑坡成因机理,深度挖掘多源滑坡监测数据和机理模型变量的时空变化特征及物理含义进行滑坡敏感性分析。
本文提出了一种滑坡灾害因子空间特征与模糊逻辑模型耦合的区域滑坡敏感性分析方法,通过滑坡频率比与信息熵权等空间统计指标显式描述滑坡灾害环境因子的贡献度,分析滑坡灾害环境因子定性机理规律与定量统计规律,顾及环境因子空间特征构建约束型的模糊逻辑模型,实现区域滑坡敏感性计算。
1 滑坡敏感性分析方法原理
本文方法主要包括两个核心步骤:
(1)环境因子空间特征分析。确定滑坡敏感性评价因子集,计算滑坡频率比和信息熵权值两个空间统计指标,综合评价因子的定量统计规律与滑坡定性知识规律,显式描述区域内滑坡灾害环境因子的地理空间特征。
(2)滑坡敏感性模糊逻辑分析。基于滑坡灾害环境因子的地理空间特征构造模糊隶属度函数,建立各敏感性评价因子与滑坡空间敏感性的非线性映射关系,并基于环境因子熵权值筛选核心影响因子,约束多因子滑坡敏感性的模糊叠加耦合运算,实现区域滑坡敏感性分析。
1.1
滑坡灾害环境因子空间特征分析
滑坡孕灾机理复杂,滑坡灾害因子对滑坡内部结构变形破裂过程的影响作用随着地理环境的变化,呈现出非线性、不平稳的变化特征。融合滑坡机理知识和空间统计结果推理分析得到的滑坡灾害发育演化规律能削弱单一规律认知的片面性,具有较好的客观全面性。本文顾及滑坡灾害环境差异性,进行灾害环境因子空间特征分析,主要包括如下两步。
1)基于滑坡定性知识规律选取构成滑坡灾害环境的敏感性评价因子。参考滑坡灾害领域专业文献、灾害案例数据及百科网页等多途径知识源,综合考虑因子数据的易获得性、经济适用性与历史地理环境特征,本文选取了使用频率高、互相关性低的6类代表性环境因子,即坡度、地质岩层、断裂带构造、道路、水系、植被覆盖。
2)为量化滑坡灾害环境因子与滑坡灾害环境的空间关联规律及贡献度,通过计算滑坡频率比及信息熵权值,总结区域滑坡灾害环境因子与滑坡演变的特征规律。滑坡频率比及信息熵权值计算公式为:
式中,Wi为熵权值;Ei为信息熵。熵权值与信息熵呈反比,信息熵越小,灾害环境因子样本数据中的信息不确定性越小;熵权值越大,该因子对滑坡灾害发育贡献度越大。Ni、Si分别表示分布在环境因子ui中某一分级类别中的滑坡单元数和分级区域面积;N、S为研究区域滑坡单元总数和研究区总面积;Fij、pijFij、pij分别为第i个环境因子指标下第j个分级类别的滑坡频率比和分布概率,Fij > 1表明因子该类别的状态条件利于滑坡发生,Fij < 1表明该状态条件不利于滑坡发生;K为常数项,由每个滑坡灾害环境因子的分级类别数ki取值决定。
1.2
滑坡敏感性模糊逻辑分析
模糊逻辑多用于表达界限不清晰的定性知识与经验,借助隶属度概念处理模糊关系,定义某现象属于集合的可能性大小,其值属于,适用于解决滑坡灾害这类非线性、非平稳性、不确定集合事件。滑坡灾害中的模糊逻辑分析是基于启发式知识评估某灾害环境发育条件下的空间位置属于滑坡敏感区域的可能性,具有在空间大范围区域尺度内组合滑坡多因子的灵活性。§1.1描述总结的滑坡灾害环境因子空间特征构造模糊隶属度函数,以环境因子贡献度排序约束滑坡的敏感性模糊逻辑分析,主要包括滑坡灾害环境因子模糊映射和滑坡敏感性模糊叠加推理两个过程。
1.2.1 | 滑坡灾害环境因子模糊映射 |
滑坡灾害环境因子的模糊映射即通过构建模糊隶属度函数来表达环境因子与滑坡灾害环境空间敏感性的非线性关系,将滑坡灾害环境因子特征值转换为滑坡空间敏感性的隶属度,即环境因子的滑坡发育状态物理值隶属于滑坡敏感性集合的程度。隶属度为1时表明该环境因子状态条件完全属于滑坡空间敏感集合;隶属度为0时表明该环境因子状态条件明确不属于滑坡空间敏感集合。灾害环境因子隶属度越大,滑坡空间敏感性越高。
本文通过耦合宏观可靠的滑坡定性知识与由分级度量的滑坡频率比FijFij的空间定量统计结果,共同推理分析得到滑坡灾害因子与滑坡灾害发育演化规律,用于构造各个环境因子合适的隶属度函数。以模糊集合映射的形式描述模糊关系如下:
式中,hi(x)是将环境因子的状态条件值x模糊映射到滑坡敏感性模糊隶属度y的对应法则,即隶属度函数;ui为某一滑坡灾害环境因子状态数值集合;fi为该因子对应映射转换的模糊隶属度集合。
本文滑坡灾害因子评价集U包含6类滑坡灾害评价因子,因此需构造对应的一组隶属度函数H(x)来完成模糊映射,转换得到滑坡灾害环境因子隶属度集F。常用于模糊映射的隶属度函数hi(x)有S形曲线、Z形曲线和钟形曲线(见图 1)。
图1 隶属度函数类型
1.2.2 | 滑坡敏感性的模糊分级叠加 |
滑坡敏感性的模糊叠加推理实质是对滑坡这类不确定性事件中的多准则多因素综合作用的交并关系分析。简单的线性运算缺乏对滑坡灾害环境因子空间特征和实际贡献度的考虑,可能使局部区域滑坡敏感性被平均。改进的模糊逻辑分析研究中提出约束因子概念,采用非线性叠加方式进行滑坡敏感性分析。但该方法未考虑滑坡灾害环境的异质性,对约束因子的选择确定缺乏探讨,缺乏空间适应性和可靠性。
针对上述问题,本文基于信息熵权值Wi衡量统一滑坡敏感性评价体系中各滑坡灾害环境因子的相对贡献度,选择贡献度优先级大的环境因子作为关键约束因子uRS,并采用Fuzzy Gamma和Fuzzy Product两种非线性叠加算子分级叠加组合的方式进行敏感性分析,以约束因子的敏感性值调节局部区域内过高或过低的累积敏感性值,减少多因子综合评价过程中的错分漏分现象。其中,Fuzzy Gamma算子将模糊映射过程中建立的滑坡灾害环境因子隶属度集合FF叠加组合成一个初步敏感性输出集合L1。再引入关键约束因子的隶属度集fRS,采用Fuzzy Product算子组合叠加fRS和L1,约束调节区域敏感性结果,最终模糊推理得到整个区域滑坡多因子耦合累积作用下的滑坡敏感性集合L2。
本文提出的敏感性分析方法对于不同滑坡灾害环境下关键性约束因子的选择确定具有普适性和可靠性。其映射计算过程如式(3)和图 2所示。
式中,G(f)为Fuzzy Gamma算子;P(f)为Fuzzy Product算子;γ参数取值在[0, 1]范围内,当γ=1时,G(f)即为Fuzzy Sum,当γ=0时,G(f)即为Fuzzy Product算子。分析过程以0.1为间隔进行变化测试,确定合适的γ参数值,得到敏感性分析结果。
图2 滑坡敏感性的模糊分级叠加
2 区域滑坡敏感性实验与分析
2.1
研究区概况
本文研究区位于重庆市奉节县的北部,是中国三峡库区地质灾害频发区,区内地质灾害类型以滑坡、崩塌为主,其地理范围为109.094 5°E~109.766 6°E,30.830 2°N~31.332 1°N(见图 3)。研究区内地貌以山地丘陵为主,最高海拔达1 830 m。研究区内水系发达,长江干流流经该地,并包含梅溪河、大溪河、草堂河、朱衣河等主要水系。奉节区域分布有二叠系P、侏罗系J、三叠系T等10种岩层,岩性以灰岩、页岩沉积岩为主,包含少量砂岩及石英砂岩。研究区内构造形式以褶皱为主,断裂少,主要断裂带有北西走向的沙市隐伏断裂和北东走向的七曜山基底断裂带两条。
图3 研究区地理位置
2.2
实验数据
实验采用的数据源包括:(1)2.5 m分辨率坡度数据;(2)1∶20万矢量地质图,用于提取岩层及断裂带等信息;(3)1∶5 000国情地理监测数据,用于提取道路及水系数据;(4)30 m分辨率植被覆盖数据,用于提取研究区域植被覆盖率;(5)1 108个历史滑坡灾害点收录数据集。根据实验需要构建非灾害负样本点,避开历史滑坡灾害点的500 m缓冲区及河流水域,按照1∶1随机抽样生成1 110个非灾害点数据。采用随机选取与交叉验证方法提取70%样本数据用于分析训练模型,30%用于测试验证模型精度。
实验数据呈现多源异构特点,需要对数据进行数据规范化预处理,包括数据格式、分辨率、空间参考统一等。其中,滑坡灾害环境因子中存在连续型和离散型两种变量类型,对离散型环境因子进行分类量化,对连续型环境因子采取分级离散化处理,统一模型输入。针对多种形式的专业文献与滑坡灾害知识源[16-19]综合提取形成各环境因子分级量化(见表 1),并生成滑坡环境因子专题图(见图 4)。
表1 滑坡灾害环境评价因子量化分
图4 滑坡灾害环境因子分级专题图
2.3
实验分析
2.3.1 | 滑坡灾害环境因子空间特征分析 |
本文应用空间统计分析方法,根据式(1)利用研究区滑坡训练样本数据和滑坡灾害环境因子图层计算滑坡频率比及信息熵权,其频率比曲线如图 5所示,结合滑坡定性知识与研究区基础地理概况综合推理滑坡灾害环境因子空间特征规律(见表 2)。
图5 各环境因子滑坡频率比曲线
表2 各环境因子滑坡频率比曲线
2.3.2 | 环境因子空间特征约束的滑坡敏感性模糊逻辑分析 |
根据§2.3.1提取的研究区滑坡灾害环境因子空间特征构造合适的模糊隶属度函数,对环境因子进行模糊映射操作(见表 3)。植被覆盖、道路距离、地质岩层、坡度4类因子的熵权值较大,历史灾害点样本数据所包含的有效信息量较大,且与滑坡定性机理相互吻合印证,其滑坡频率比具有良好统计意义和地理意义,频率比分布曲线规律可直接用于构造隶属度函数。植被覆盖、道路距离、地质岩层这3类滑坡环境灾害因子的离散化状态值都与滑坡灾害发生呈负相关,其因子状态值越大,发生滑坡的可能性越小,可选择Z型函数中的Small函数表达映射关系,计算公式为:
式中,x表示环境因子状态条件值;h表示隶属度;a表示散度;b表示中点。
表3 滑坡灾害环境评价因子隶属度函数
坡度状态值与滑坡灾害发生呈正态分布,坡度在20°左右,滑坡发生可能性最大,偏离该值,滑坡敏感性逐渐降低,可选择钟型函数中的Gauss函数表达映射关系,计算公式为:
断裂带与水系因子的熵权值均小于0.05,数据信息量不足,不确定性大。滑坡频率比无法准确挖掘研究区内因子的潜在空间分布特征。实际研究区内断裂带构造分布少,且其活动年代古远,能量较弱,影响面小,区域内因子特征相似性较小,局部空间异质性较强,基于栅格单元的全局统计模式难以准确捕捉其局部特征规律。
区域内支流水网密布,而收集的滑坡样本数据仅集中分布在主水系滑坡发育带,数据信息单一,缺乏远离水系的对照样本,导致水系距离对滑坡统计规律不明显。因此,本文耦合滑坡定性机理知识弥补这一缺陷,引导隶属度函数构造,定性机理规律中滑坡发育与断裂带、水系因子的分布距离呈负相关,距离越远,其滑坡发生可能性越小,可选择Z型函数中的Small函数表达两种因子的映射关系。
利用上述隶属度函数进行模糊化计算得到各环境因子的隶属度图层,表征单因子滑坡敏感性关系。为综合分析多因子对区域滑坡发育的最终累积作用,基于信息熵权值排序优先级,选取对滑坡发育贡献度最大的植被覆盖和道路距离灾害环境因子作为约束因子。这两种约束因子的区域滑坡灾害特征规律具有良好的全局代表性和相似性,且可用于调节局部区域不均衡现象。
首先根据式(3)对坡度、地质岩层、断裂带距离及水系距离4个环境因子隶属度图层进行Fuzzy Gamma叠加计算,其中参数γγ取值0.7。然后,通过Fuzzy Product算子分级叠加植被覆盖和道路距离两个约束因子的隶属度图层,约束得到综合滑坡敏感性图层。最后,利用自然断点法将连续型滑坡敏感性图层重分类为极低、低、中等、高、极高5个离散型滑坡敏感性分区图(见图 6)。
图6 研究区域滑坡敏感性分区
将本文实验得到的敏感分区结果与历史滑坡灾害点的分布状况进行叠加分析,统计每个分区的面积比、滑坡比及两者频率比。由统计结果可知(见表 4),随着敏感性等级的提高,滑坡比及滑坡频率比随之增加,且80%以上的历史滑坡灾害点都落在中敏感区以上。其中,极高敏感区滑坡频率比达1.95,分区面积仅占18.22%,涵盖35.47%的历史滑坡灾害点。极低敏感区与低敏感区的滑坡频率比均小于1,其分区面积共占48.67%,而滑坡灾害点仅占18.68%,滑坡密度仅为0.38,说明滑坡灾害点集中落在敏感性区内,本文研究区的敏感性空间预测结果能较好地反映滑坡发生的空间分布状况。
表4 滑坡敏感分区统计结果
2.3.3 | 不同方法的分区结果对比 |
为进一步验证本文方法的可靠性和有效性,将本文模型与目前最常用的信息量(information value, IV)模型、信息量-逻辑回归(information value and logistic regression,IVLR)模型进行滑坡敏感性评价对比。本文采用滑坡敏感性分区统计和受试者工作特征曲线(receiver operator characteristic curve, ROC)验证这两种方法来衡量滑坡敏感分析结果的准确性和优越性。
1)滑坡敏感性分区统计验证。滑坡敏感性分区结果应呈现以下规律:分区滑坡密度从低敏感区向高敏感区逐渐递增,分区面积从低敏感区向高敏感区逐级递减,极低与低敏感区的滑坡发生频率应小于1,中、高和极高3类敏感区内滑坡隐患发育概率增大。实验中对3种方法的滑坡敏感性结果进行分区统计,其滑坡比及滑坡频率比结果如图 7所示。
图7 3种模型分区统计结果
3种方法的分区结果中,80%以上的历史灾害点都分布在中敏感区等级以上,分区滑坡比及滑坡频率比都随敏感性等级提高而呈现不断增大趋势,分区结果都具有一定参考价值。其中,IV模型在极高敏感区的滑坡频率比高,但其分区面积高达65.43%,分区面积冗余,可能存在过拟合问题,分区结果的平滑性和合理性不足。IVLR模型较IV模型滑坡分区结果有一定改善,各分区面积相对均衡,但极高敏感区分区面积仍存在冗余现象。相较而言,本文方法结果的分区滑坡频率比从极低敏感分区向高敏感区逐渐递增。极高敏感区内分区面积仅占18.22%,分区滑坡频率比高,滑坡分布密度大,本文方法的滑坡敏感性分区结果更均匀平稳,能更好地反映滑坡发育的空间分布规律。
结合图 8中的典型区域A、B的分区结果进行分析可进一步反映这一优势。区域A、B中,滑坡灾害点与3种模型的敏感分区都能保持包含关系,但IV模型的极高敏感性分区面积明显高于IVLR与本文方法,对包含滑坡灾害点区域的敏感性等级过度拟合,夸大了区域滑坡灾害的敏感程度,导致分区粒度不够细腻,高敏感分区面积冗余,区域滑坡密度低。同时,区域A内存在水系,从机理上分析水系周围容易孕育滑坡灾害,但其本身不存在滑坡灾害,因此水系流域内滑坡敏感性应为低,IV模型的结果未能准确将水系流域敏感性分区表达,而本文方法与IVLR分区结果都能将区域内的水系流域划分至低敏感区,其周围滑坡密集处分区对应高敏感区,分区对应性更准确。
图8 3种方法的典型区域对比
2)ROC曲线验证。ROC曲线[6,9]是一种常用的简单直观模型方法性能评价指标,其曲线下面积(area under curve,AUC)越大,模型准确性越好。本文实验基于验证数据集对3种方法进行计算检验,其ROC曲线如图 9所示,3种方法的AUC都大于0.7,具有一定的预测价值。其中,本文提出的环境因子空间特征约束的模糊逻辑模型AUC达0.854,预测精度高于其余两种方法精度,模型性能相对更佳,保证了方法的可靠性和准确性。
图9 3种模型ROC曲线
3 结 语
本文基于全局栅格单元进行滑坡敏感性分析,计算滑坡灾害环境因子滑坡频率比和信息熵权值,显式描述滑坡灾害环境因子对滑坡发育的贡献度,结合定量空间统计规律与定性滑坡机理知识共同约束滑坡敏感性模糊逻辑分析,一定程度上克服了滑坡敏感性分析对历史观测样点数量、空间代表性的严格要求,并通过分级叠加策略提升了滑坡敏感分析的准确性。进一步的研究将探索局部回归分析模式,针对不同灾害环境构建局部灾害环境研究单元,建立统一的滑坡敏感性分析模型,并融入外部诱发因子探究滑坡灾害的动态影响规律,以实现滑坡灾害的时空态势预测。
往期精选
关于 武汉大学学报·信息科学版
《武汉大学学报·信息科学版》(Geomatics and Information Science of Wuhan University)是由武汉大学主办、国内外公开发行的测绘专业学术期刊,月刊,创刊于1957年,其前身是《武汉测绘科技大学学报》。
学报办刊宗旨为:立足国内,面向国际测量界,通过发表具有创新性和重大研究价值的测绘学术成果,展示中国测绘研究的最高水平,促进测绘学术交流,引导测绘研究方向,推动测绘科技进步,服务测绘行业发展。主要刊登内容包括摄影测量学与遥感、大地测量学与导航、地图学与地理信息等相关的学术论文。收录本刊论文的国际著名检索系统和数据库有EI、Scopus、CSA、JST、SA等。2019年入选中国科技期刊卓越行动计划项目,2020年荣获湖北十大名刊成就奖、中国高校杰出科技期刊,连续6年获中国国际影响力优秀学术期刊。
长按二维码 关注学报微信号
Whuxxb GeoInfoSciwhu
点击下方阅读原文获取官网全文