本文内容来源于《测绘通报》2022年第10期,审图号:GS京(2022)0980号
基于InSAR与随机森林的滑坡敏感性评价与误差改正1. 湖南师范大学地理科学学院,湖南 长沙 410081;
2. 湖南师范大学地理空间大数据挖掘与应用重点实验室,湖南 长沙 410081;
3. 中南大学地球科学与信息物理学院,湖南 长沙 410083基金项目:国家重点研发计划(2018YFC1505101);国家自然科学基金(41704001;42030112);湖南省自然科学基金(2020JJ2043;2022JJ30031);云南省地质灾害隐患识别中心建设项目(2021年)(云财资环[2021]22号)关键词:随机森林 SBAS-InSAR 滑坡敏感性 假阴性误差 引文格式:黄龙, 孙倩, 胡俊. 基于InSAR与随机森林的滑坡敏感性评价与误差改正[J]. 测绘通报,2022(10):13-20. DOI: 10.13474/j.cnki.11-2246.2022.0288. 摘要 :滑坡不仅影响社会经济的可持续发展,而且威胁人类的生命安全。滑坡敏感性图(LSM)被认为是预测滑坡空间位置的有效手段之一,但现有方法生成的LSM因受假阴性误差的影响,难以得到可靠的预测结果。针对该问题,本文提出了基于InSAR形变结果的LSM改进方法。在甘肃省舟曲县的试验结果表明,研究区范围内滑坡敏感性等级提升2.74%。对两个具体区域的原始LSM和改进后LSM进行比较,结果表明,利用改进后的方法,可在受滑坡蠕动现象影响的区域制作更可靠的LSM。近年来我国地质灾害频发,其中滑坡灾害占比最大,严重威胁人民群众的生命和财产安全,直接影响社会经济的可持续发展[1]。为有效预防滑坡灾害,减小滑坡灾害所造成的损失,需对滑坡灾害的发生具有较全面的认识,从而更加针对性地制定滑坡灾害防治对策[2]。滑坡敏感性评价是预测某个地区在一定的地质环境条件下发生滑坡灾害的可能性大小,并综合分析这些地质环境因素对滑坡灾害发生的贡献大小,最终从空间上对滑坡灾害发生的概率和可能性进行综合性度量和评价[3]。因此,科学、准确地进行滑坡敏感性评价,得到滑坡敏感性图(landslide sensitivity map,LSM),已成为灾前科学预警和主动防范的重要手段之一[4]。目前,国内外常用的滑坡敏感性评价模型主要包括统计模型[2, 5-6](评率比、逻辑回归等)和机器学习模型[7-10](随机森林、支持向量机、人工神经网络等)。统计模型能较好地反映滑坡发生与影响因子之间的空间关系,但滑坡敏感性评价是复杂的非线性问题,因此通过统计技术和统计方法获得的结果无法达到较高精度;而机器学习模型的优势在于灵活性和高准确率,特别是随机森林模型(random forest,RF),因其拥有高稳定性、抗过拟合特性与准确性广受学者青睐[11]。虽然现有研究在不同区域均取得了不错的成果,但仅利用传统方法难以解决滑坡敏感性评价中存在的假阴性误差(即失稳区域被判定为稳定区域)。为解决上述滑坡敏感性评价中的不足,部分学者引入合成孔径雷达干涉测量技术(interferometric synthetic aperture radar,InSAR)对其进行改善[12-18],主要包括3类方法: ①通过时序InSAR技术获取年均形变速率,将年均形变速率结果用于优化区域原有LSM,得到新的结果;②通过时序InSAR技术获取形变速率图,用于改进原有的LSM,达到减少假阴性误差的目的;③通过融入时序InSAR结果,将其作为影响因子之一,得到基于时序InSAR结果的LSM。上述研究解决了传统滑坡敏感性评价中的一些不足,但也存在自身问题:滑坡是一个复杂的动态过程,是多因素(内部因素、外部诱发因素、坡体运动状态等)共同影响的结果,时序InSAR结果反映了区域内一段时间的稳定程度,作为影响滑坡发生的因素之一,代表了坡体的运动状态。而现有的假阴性误差改正研究中未将形变结果作为滑坡影响因子纳入滑坡敏感性评价模型,只是在常规滑坡敏感性评价后,利用时序InSAR形变结果对其进行改正。针对传统研究方法[13-14, 17]存在的现象和问题,本文综合考虑影响滑坡发生的多个致灾因子,以甘肃省舟曲地区为例进行滑坡敏感性评价研究。首先基于历史滑坡编目数据,通过RF模型,充分识别历史滑坡数据的位置特征;其次将2018—2020年Sentinel-1A升降轨数据得到的形变结果作为滑坡影响因子之一,参与滑坡敏感性评价,得到融入升轨和降轨时序InSAR结果的LSM;然后对融入升轨和降轨时序InSAR结果的LSM进行逐像素改正,得到融合升降轨InSAR结果的LSM;最后将其与基于历史滑坡数据得到的LSM进行逐像素改正,得到最终优化后的LSM结果。研究区位于青藏高原东缘、白龙江流域中游,区域范围约为21 km×22.5 km。研究区受青藏构造带的强烈控制和青藏高原构造隆升的影响,断裂带横穿该区域,区域内滑坡灾害频发,河道下切严重,属于典型的高山河谷地带[19]。区域内地层复杂、岩性多样,主要有志留系、泥盆系、石炭系、侏罗系、白垩系及第四系,其中侏罗系和白垩系分布较少,各时代地层大多以构造线为界,沿主要断裂构造、主要沿河谷走向呈条带状分布[20]。舟曲县年均降雨量为500~900 mm,总降雨量的80%集中在6—9月。正是由于该区域地质构造丰富,地形复杂,降水集中,因此滑坡等地质灾害频发。
本文收集了2018年3月22日—2020年9月19日的Sentinel-1A卫星数据,包括70景升轨数据和74景降轨数据。为了抑制失相关现象和噪声的影响,选择较短的时空基线组成干涉对,其中升轨数据以71 d和60 m的时空基线为阈值,降轨数据以80 d和80 m的时空基线为阈值,利用最小费用流方法进行相位解缠后,从干涉对中剔除失相关严重和存在解缠误差的干涉对,最终生成190对升轨干涉对和300对降轨干涉对。研究数据还包括:①全球公开下载的30 m分辨率的SRTM高程数据;②Landsat 8 OLI数据;③中国地质调查局地灾灾害详查的历史滑坡编目数据;④由OpenStreetMap提供的水系数据;⑤用于提取断层和地层岩性等数据的1∶50 000地质图;⑥清华大学共享的10 m分辨率的土地利用分类数据。根据研究区实际情况,本文选取了影响滑坡的高程、坡度、距离水系距离、距离断层距离、地形湿度指数(TWI)、平面曲率、归一化植被指数(NDVI)、剖面曲率、坡向地层岩性、土地利用等11个相关因素作为评价因子。考虑到DEM数据为30 m分辨率,为了获得相同像元个数的数据以方便后续模型的训练,将上述所有数据均采样为30 m分辨率。首先从研究区滑坡点中抽取70%的数据作为训练样本,将选取的11个影响因子与滑坡样本点作为特征数据集,引入RF模型对研究区滑坡敏感性进行评价,利用ROC曲线与AUC方法对评价结果进行精度验证。然后通过SBAS技术获取的研究区升降轨年均形变速率结果,将其作为影响因子之一与上述11个影响因子一起构建特征数据集,利用RF模型生成LSM,并通过ROC曲线验证结果。最后对原始滑坡敏感性结果进行逐像素的假阴性误差改正,以提升滑坡敏感性评价等级。
通过RF模型获得基于历史滑坡编目数据的LSM,但是该LSM无法发现蠕动类型滑坡,存在一定的假阴性误差,为了对此进行改正,需要引入时序InSAR结果。而若直接利用时序InSAR结果进行改正,会导致将不属于滑坡的形变结果带入最终结果,引入新的误差,因此需要将利用SBAS-InSAR技术反演得到的升降轨形变结果作为滑坡影响因子之一纳入滑坡敏感性评价体系,得到融入升轨和降轨时序InSAR结果的LSM。由于哨兵升降轨几何成像的差异性,单独的升轨或降轨InSAR结果无法探测到所有的蠕动型滑坡,因此需要融合升降轨InSAR结果中探测到的蠕动滑坡,并去除时序InSAR结果中的部分误差。将其与原始LSM进行逐像素判断,保留两者中的最大值作为最终LSM结果,完成对原始LSM的误差改正。融合改正的技术流程如图 1所示。
受试者工作特征(receiver operating chara-cteristic,ROC)曲线又称为感受性曲线,通过绘制分类检验的敏感度以评估模型预测的准确性,能简单、直观地反映模型方法与危险性的关系,具有良好的试验准确性[21]。AUC(area under curve)值可表示并比较模型的精度。其中,特异度即误判率,是指预测与实际不符的可能性;灵敏度指预测正确且实际也正确的可能性;AUC值指ROC曲线下面积,其值域为[0, 1],值越大,表明模型评价精度越好。3 结果及分析3.1 升降轨SBAS-InSAR结果舟曲县2018年3月—2020年9月升降轨形变速率分布结果如图 2所示。研究区中,沿升轨LOS方向探测到了-113.8~42.5 mm/a的形变位移速率,沿降轨LOS方向探测到了-55.3~56.0 mm/a的形变位移速率。在Sentinel-1A卫星升降轨影像时序分析得到的形变结果基础上,通过光学卫星影像对滑坡边界进行人工目视解和圈定,共探测出27处存在持续地表形变的滑坡隐患。大部分高形变速率点分布在受之前滑坡影响的区域及其周围,其中有记载的滑坡包括H03(锁儿头滑坡)、H12(南山桥头滑坡)、H15(泄流坡滑坡)、H19(南峪乡江顶崖滑坡)等。通过Sentinel-1A升轨数据观测到的形变区包括H01、H05、H06、H07、H09、H12、H14、H16、H17、H21、H24、H26,通过Sentinel-1A降轨数据观测到的形变区包括H01、H02、H04、H08、H09、H10、H11、H13、H18、H19、H20、H22、H23、H25、H27,导致升降轨观测到不同区域结果的主要原因为,升轨和降轨数据的成像几何差异造成的几何畸变不同。因此,相对于单个升轨或降轨数据的观测结果,通过升降轨联合观测,能够更全面地对潜在滑坡隐患点进行识别与监测。值得说明的是,由于InSAR观测值是由真实的三维地表形变投影到LOS向所得,LOS形变速率正值代表观测对象靠近卫星,负值则代表观测对象远离卫星[22]。因此对于滑坡形变而言,面向卫星的中等陡峭斜坡的沿下坡方向的LOS向形变可能显示为正值。由于研究区域没有实地测量数据,因此为了检验InSAR结果的真实性,选取对照了部分区域(如H06、H19)的Google Earth影像,查看该区域地表的真实情况,对照结果如图 3所示,红色范围代表主滑区。可以看出,上述区域均出现了明显的滑坡迹象,可在一定程度上证明SBAS-InSAR监测结果的可靠性。 |
图 3 区域Google Earth影像与InSAR结果对比 |
|
本文对舟曲县进行滑坡敏感性评价与误差改正研究,试验过程如下:①选取影响滑坡发生的11维特征(如图 3所示),并计算每个网格中相应的特征值,以构建特征矩阵;②提取所有已知滑坡点和同数量的负类样本点所对应的特征值,以构建训练数据集;③从训练数据集中随机选取70%的数据用于训练,剩余30%的数据和袋外数据组合用以验证,通过数据划分、交叉验证、参数调优、平衡模型训练复杂度等方法选取最佳模型;④将特征矩阵导入预先训练好的模型进行分类预测,得到每个网格滑坡发生的概率并进行制图;⑤将其按照相同间隔概率大小进行分级[23],极低(0,0.2]、低(0.2,0.4]、中等(0.4,0.6]、高(0.6,0.8]、极高(0.8,1];⑥将升降轨时序InSAR结果与上述11个影响因子一起构建特征矩阵;⑦从升降轨时序InSAR结果中选取一定数量的已知滑坡点与非滑坡点,随机选取70%的数据点用于训练,剩余30%的数据进行验证;⑧将特征矩阵导入预先训练好的模型进行分类预测,得到每个网格滑坡发生的概率,制图生成基于升降轨InSAR结果的LSM,并按照相等间隔概率大小进行分级;⑨利用融入升降轨时序InSAR结果后的LSM对原始LSM进行改正。获得舟曲升轨和降轨LOS向年均形变速率结果后,将其作为滑坡影响因子与其他因子一起通过RF模型参与训练,分别得到融入升轨和降轨InSAR结果的LSM,结果如图 4所示。灰白色是由于InSAR在该区域中存在失相干现象,为保证结果的准确性,在融入升降轨InSAR结果的LSM中将其剔除,因此灰白区域滑坡概率以基于历史滑坡数据的LSM为准。由图 4可知,高敏感性区域主要对应升降轨InSAR结果中的高形变区域。这是因为InSAR作为地表真实形变监测结果,直接反映区域的稳定程度。InSAR中的高形变结果表明区域已由稳定状态演变为失稳状态,区域内坡体的稳定体结构已遭到破坏,相对于其他坡体结构完整的区域而言,在同等的外界条件诱因下,后续发生滑坡的概率更高,这与LSM的预期相吻合。顾及InSAR成像几何与地形特征,仅通过InSAR的LOS向形变观测难以反映滑坡的真实形变方向情况。但有研究表明,通过升降轨SAR数据进行互补的方式能够有效避免SAR单轨数据在高山峡谷地区产生的几何畸变,从而能够较全面地反映滑坡区形变状况[24]。本文研究的主要目的是通过InSAR技术更全面地监测滑坡隐患点位置,从而判断其是否属于滑坡隐患点,滑坡隐患点形变大小远比形变方向更重要。因此,尽管一维LOS向结果难以代表滑坡真实形变方向,但是联合升降轨InSAR技术能够较好地解决单轨InSAR由几何畸变导致的滑坡区域监测不全的问题。
对不同数据构建的RF模型获得的滑坡敏感性评价结果进行ROC曲线分析,结果如图 5所示,ROC曲线下面积(AUC值)对比见表 1。结果显示,RF模型与融入升降轨InSAR结果的RF模型预测精度都较好,显著性均小于0.05,表示几种模型均能客观准确地完成滑坡敏感性评价。基于历史滑坡数据得到的AUC为0.867,融合升轨结果和降轨结果的AUC分别为0.971和0.967,表明结果具有较高的可信度。其中由历史滑坡数据构成的LSM存在一定的假阴性误差,因此AUC低于融合InSAR结果的AUC。
得到原始LSM和融入升降轨InSAR结果的LSM后,采用本文方法进行逐像素判断改正,得到最终改正后的LSM结果,如图 6所示。由图 6(a)可知,舟曲县敏感性等级主要以极低和低为主,分别占整个区域的56.94%和25.99%,中等敏感性区域占12.34%,高敏感区域和极高敏感性区域分别占4.13%和0.60%。其中,高敏感区域和极高敏感性区域主要沿白龙江两岸分布,北岸的风险远大于南岸。分析其原因可知,当地常年的河流冲刷易使水流渗入坡体,加大孔隙水压力,软化岩石、土体,增大坡体容重,从而促使或诱发滑坡的发生;河流水位上下变动,也会加大坡体的动水压力,使斜坡无法支撑过大重量,失去平衡,从而沿软弱面下滑。由于白龙江北岸的坡度比南岸较缓,因此人群聚集现象和活动强度远高于南岸,导致北岸的植被覆盖度明显弱于南岸,人类活动对于坡脚的开采破坏在一定程度上破坏了坡体的稳定性,降低了土壤的抗剪性强度。白龙江北部刚好被S313省道贯穿,而该道路又是舟曲县使用率最高的道路,道路清理频繁,因此各坡体靠近公路部分被逐渐掏蚀,稳定性大大降低,滑坡风险概率上升,这与本文的结果相一致。综上可知,白龙江北岸的整体滑坡风险高于南岸,后续应加强防范。由图 6(b)可知,改正后提升明显的区域主要为10个红色矩形区域:A01、A02、A03、A04、A05、A06、A07、A08、A09、A10。原始和改正后LSM的分级面积占比见表 2。极低敏感性等级由原始的56.94%减少到54.19%,同比下降了2.75%;低敏感性等级由原始的25.99%上升到26.66%,同比增加了0.67%;中等敏感性程度由原始的12.34%上升到13.14%,同比增加了0.80%;高敏感性程度由原始的4.13%上升到4.48%,同比增加了0.35%;极高敏感性由原始的0.60%上升到1.51%,同比增加了0.92%。总体而言,增加了低、中等、高、极高敏感性分级程度的占比,降低了极低等级的占比,提升了舟曲县2.74%的敏感性等级,研究区范围内敏感性程度升高,有效减少了2.07%的假阴性误差。
此外还可看出,LSM与InSAR结果相关性并不高,存在一部分区域在LSM显示为(极)高敏感性,但是在InSAR升降轨结果中并未出现形变信号的情况,说明结果中可能存在一定的假阳性误差(稳定区域被判定为高风险区域)。这是因为LSM是基于历史累计滑坡位置训练得到的结果,历史滑坡中可能存在一定的老滑坡体,滑动年份较久远,而如今已趋于稳定;也有可能在以往的滑坡事件中,滑坡体滑落后坡体构造完全改变,临空面消失,滑动条件改变,使其趋于稳定,因此在基于InSAR的监测结果中显示为稳定区域。
为进一步验证本文结果的可行性,选择H04和H08两个区域进行更详细的讨论。细节对比分别如图 7、图 8所示。H04区域位于罗家峪村附近,最高点为2496 m,最低点为1059 m,地形的主要特点为沟谷发育、切割强烈、山势陡峭,区内沟谷断面多呈V字形。2010年8月7日,罗家峪沟爆发特大泥石流,泥石流淤塞白龙江,抬高水位,致使舟曲县三分之一被淹。根据历史滑坡点位得到的原始LSM(如图 7(a)所示)可知,结果只预测出了部分区域呈现高敏感性,而其余大部分区域并没有显示出高敏感性。根据升降轨SBAS-InSAR结果可知,该区域仍在滑动。该情况下,可利用本文方法进行有效的改进,改正后的LSM显示了这些变化区域。改正工作完成后,建议更新已有滑坡编目数据,扩充滑坡边界范围。为进一步说明改正结果的正确性,图 7(c)展示了该区域的Google Earth影像,可以看出该区域有显著的滑动迹象,已不再属于稳定区域,而是属于活跃的滑坡区。改正后的LSM对这些新发的滑坡区域具有较高的敏感性,能够准确地更新滑坡边界并对原始LSM进行改正。对该区域的结果进行对比发现,本文方法提升了区域的敏感性程度,起到降低假阴性误差的作用,具有可行性和正确性。H08区域位于岷山山系上。岷山山系呈东南—西北走向,贯穿全境,该区域海拔3600 m左右,地形陡峭、土质疏松,难以进行人工探测。因此在历史滑坡数据库中,并未在该山区发现滑坡点,导致H08区域附近普遍呈低敏感性(如图 8(a)所示)。而降轨SBAS-InSAR监测结果显示其仍处于运动活跃状态,形变速率超过30 mm/a。该情况下,同样利用本文方法进行改正(如图 8(b)所示),该区域的敏感性程度得到提升。通过查看Google Earth影像(如图 8(c)所示)并调研资料发现,该区域充满大量的松散堆积物,非常不稳定,且出现明显滑动迹象。分析其原因为,该区域地形陡峭,土质疏松,冬季常年冰雪覆盖,当冰雪消融时,雪水渗入斜坡岩土体,增加了坡体的重量,降低了岩土体的抗性强度,造成斜坡失稳,从而发生滑动现象。对该区域的结果进行对比发现,本文方法适用于受滑坡蠕动现象影响的区域。
本文通过融合随机森林与SBAS-InSAR技术,对舟曲县滑坡敏感性进行了分析,改正了假阴性误差。结果表明,舟曲县升轨LOS向的形变速率为-113.82~42.46 mm/a,降轨LOS向的形变速率为-55.30~55.99 mm/a。本文基于历史滑坡数据和升降轨InSAR数据,绘制了3幅LSM,并对其进行相应的融合改正,得到最终的LSM,达到减少假阴性误差的目的。改正后的LSM显示,极低敏感性区域面积减少,其余等级敏感性区域面积增加,提升了研究区内2.74%(即6.84 km2范围)的敏感性程度。通过对两个区域原始LSM和改正后LSM的对比可知,该方法非常适用于受滑坡蠕动现象影响的区域,改进效果明显。作者简介:黄龙(1997—),男,硕士生,研究方向为滑坡敏感性分析。E-mail:525422032@qq.com通信作者:孙倩。E-mail:sandra@hunnu.edu.cn