高空间分辨率遥感影像箱线图变化检测方法
面向对象的高空间分辨率遥感影像箱线图变化检测方法
张春森1, 吴蓉蓉1, 李国君1, 崔卫红2, 冯晨轶1
1.西安科技大学测绘科学与技术学院,西安 710054
2.武汉大学遥感信息工程学院,武汉 430079
摘要
传统基于统计的高空间分辨率遥感影像变化检测需假设数据服从正态分布,如基于卡方检验的变化检测,但受困于样本数据不严格服从正态分布,检测效果并不理想。针对此问题提出一种基于箱线图的变化检测方法,不需任何假设,根据数据结构本身固有模型进行变化检测。首先,经由矢量引导的增长式分割获得对象; 然后,结合纹理与光谱特征计算其余弦值; 最后,采用箱线图算法获得变化对象。以高分一号融合影像为实验数据进行验证,结果表明,结合矢量夹角余弦与箱线图进行变化检测的总体精度可达88.21%,相比马氏距离与卡方检测的方法和结合马氏距离与箱线图的方法具有更好的准确性与稳定性。
关键词: 变化检测 ; 高空间分辨率遥感影像 ; 增长式分割 ; 箱线图
本文引用格式
张春森, 吴蓉蓉, 李国君, 崔卫红, 冯晨轶. 面向对象的高空间分辨率遥感影像箱线图变化检测方法. 国土资源遥感[J], 2020, 32(2): 19-25 doi:10.6046/gtzyyg.2020.02.03
ZHANG Chunsen, WU Rongrong, LI Guojun, CUI Weihong, FENG Chenyi. High resolution remote sensing image object change detection based on box-plot method. REMOTE SENSING FOR LAND & RESOURCES[J], 2020, 32(2): 19-25 doi:10.6046/gtzyyg.2020.02.03
近年来随着对地观测卫星技术的日益成熟,高空间分辨率遥感影像已广泛应用于变化检测之中[1,2,3],如森林生态系统变化检测[4]、城乡结构变化检测[5]和其他需要详细地表信息的变化检测[6]等。
现有的变化检测方法依据影像空间分辨率大致分为基于像素的变化检测和面向对象的变化检测2类[7]。面向对象的变化检测方法减弱了基于像素变化检测方法中普遍存在的“椒盐”现象,且随着高空间分辨率遥感影像的不断发展,有着越来越广泛的应用[8,9]。面向对象的变化检测方法将影像分割方法与影像的空间信息、光谱信息和纹理信息相结合,以影像对象为实验单位进行变化检测[10,11]。面向对象变化检测方法包括分类后比较和直接比较2种方法。其中分类后比较法利用面向对象方法在高空间分辨率遥感影像上的优势对不同时相的遥感影像进行分类,然后对分类结果进行比较分析,实现变化检测。此方法依赖于分类结果,虽经一系列改进,如Liang等[12]引入马尔可夫随机场与最大似然法,Moghadam等[13]引入基于标记的分水岭算法与最大似然法,但由影像分类所产生的误差累积问题仍不容忽视。鉴于此,面向对象的直接比较法具有更好的精度与结果[14,15],如Bogaert等[16,17]分别采用差值和马氏距离来度量对象的变化程度,并采用卡方检测进行变化阈值的确定。然而上述方法都需假设被检测数据服从正态分布,受困于数据有时并不严格服从正态分布,检测结果并不理想。为解决此问题,本文应用基于箱线图的阈值确定方法进行变化阈值的确定,此方法不需任何假设,根据数据结构本身固有模型进行变化检测。
1 研究方法2006年,Bogaert等[16]作为多时空对象变化检测的先驱,通过合并多时相影像的分割结果构建影像对象,计算植被指数、光谱均值和光谱标准差等特征,将特征差值作为变化指数,在假设所有对象的变化指数服从正态分布的前提下,将统计学中异常点挖掘的思路引入变化检测,采用基于卡方检验的方法对样本数据进行迭代剔除,获得变化对象; 2008年Bogaert等[17]在前文的基础上进行了改进,引入了马氏距离作为相似性度量的方法,舍弃了单纯的特征差值作为衡量反射率变化程度的指标。此后,基于统计检验与面向对象相结合的变化检测方法被继续应用与推广。
以往采用卡方检验迭代剔除变化对象的方法,受困于样本数据不严格服从正态分布,检测效果并不理想[18]; 而马氏距离法存在不稳定性,即对微小变量较敏感[19]。针对此问题,本文应用一种更稳定的基于矢量夹角余弦的相似性度量方法。技术流程如图1所示,首先进行基于矢量引导的增长式分割获得影像对象,再提取对象的光谱特征与纹理特征构造特征空间,后计算变化指数,最后应用箱线图迭代剔除法获得变化对象并评价其结果。
图1 本文方法流程
Fig.1 Flowchart ofproposedmethod
1.1 增长式分割
本文应用面向对象多尺度分割算法实现图像分割,获取影像对象。所选分割参数包括: 尺度参数、影像波段权重和同质性标准(形状参数和紧致度参数)。针对具体实验数据,经反复调试对比选优,最终选择尺度参数为220,波段权重为1,形状参数为0.3,紧致度参数为0.7。传统多时相影像分割方法多为直接合并每幅影像各自的分割结果,或将影像叠加后进行分割,这样的分割方法易产生对象边界不一致描述,且随着参与变化检测的影像增多,图块的数量将成指数增长,这种过度分散的分割结果将为后续的变化检测带来很大不便。为解决此类问题,文献[20]描述了一种增长式的分割方法,该分割过程分为3个步骤: ①选择合适的参数分割t时相影像(尺度参数为220); ②将分割结果作为主题图层(thematic layer); ③基于主题图层对第t+1时相影像以相同的参数进行增长式破碎分割,以此重复至分割完所有时相影像。此种方法利用t时相的分割结果作为边界约束t+1时相影像的分割结果,避免因合并多次分割结果,或因影像叠加对同一对象产生过于细碎的边界。增长式分割需在底图的约束下进行,从而克服传统分割方法对象描述不一致的现象。此外,进行增长式分割过程中,当且仅当t+1时相影像与t时相影像存在显著不同时才产生新的对象。增长分割流程如图2所示。
图2 增长式分割流程
Fig.2 The flowchart of incremental segmentation
1.2 构造对象级特征空间
随着遥感影像数据获取技术的发展,高空间分辨率影像不断出现,影像包含的几何、光谱与纹理信息愈发丰富,通过选取相应光谱、几何和纹理特征组合可作为检测影像对象是否变化的变化区分指标[21,22]。
本文将光谱与纹理特征相结合构建影像特征空间。并引用最佳指数因子(optimum index factor,OIF)筛选拥有最大信息量的特征组合,通过去除冗余信息对特征空间的表达进行优化。OIF计算表达式为
式中: Si为特征i的标准差; Rij为在某个特征组合中特征i和j之间的相关系数。若某个特征组合中不同特征间的相关性越小,并且各个特征的标准差越大,则该特征组合的OIF越大,即此特征组合信息量越大。本文提取影像的光谱特征(如各波段的均值,中位数,标准差)和纹理特征(如角二阶矩,熵,对比度,同质性和相异性),并随机选取6组特征组合进行评价,从表1可以看出随着纹理、NDVI和NDWI等特征的加入,OIF逐渐变大,说明其包含的信息逐渐增多。此外将所有特征进行主成分变换(principal component analysis,PCA),取其前3个主成分分量。表1中,MEA为均值特征,MED为中位数特征,STAN为标准差特征,R,G,B及NIR分别代表相应红、绿、蓝及近红外波段,其中MEAR+G+B+NIR代表对象在R,G,B及NIR波段的均值特征,其他符号以此类推。根据表1,以主成分为特征的组合6包含信息最多,选此组合进行后续实验。
表1 不同特征组合的OIF
Tab.1 OIF of different features combination
序号 | 特征组合 | OIF |
---|---|---|
1 | MEAR+G+B+NIR+MEDR+G+B+NIR+STANR+G+B+NIR | 0.073 6 |
2 | MEAR+G+B+MEDR+G+B+STANR+G+B | 0.120 1 |
3 | MEAR+G+B+NIR+MEDR+G+B+NIR+STANR+G+B+NIR+NDVI+角二阶矩 | 0.808 8 |
4 | MEAR+G+B+NIR+MEDR+G+B+NIR+STANR+G+B+NIR+NDWI+NDVI+熵+角二阶矩 | 1.031 5 |
5 | MEAR+G+B+NIR+MEDR+G+B+NIR+STANR+G+B+NIR+NDWI+NDVI+熵 | 1.628 1 |
6 | PCA前3个主成分分量 | 3.827 5 |
1.3 对象变化指数计算
面向对象的高空间分辨率遥感影像变化检测需基于特征空间计算不同时相影像对象的相似性,对同一对象不同时相特征向量进行相似性度量。通过相似性度量,每个影像对象可以计算得到一个衡量变换的指标,记作变化指数。假设存在t1时刻的影像对象P1与t2时刻的影像对象P2,它们的特征向量分别为
本文选取矢量夹角余弦计算对象变化指数,其中n为特征向量数。矢量夹角余弦是一种相似性度量函数,它描述了三角形中的一个角与3条边的关系,假设三角形的3条边分别为a,b和c,对应的3个角分别为∠A,∠B和∠C,则∠A的余弦为
若将矢量夹角余弦推广到多维空间,则计算p1与p2之间余弦角的公式为
式中: θ为p1和p2的夹角; i为当前特征向量序号; d(p1,p2) ∈[0,1]。余弦值越接近1,2个影像对象的差异越小; 余弦值越接近0,2个影像对象的差异越大。利用矢量夹角余弦进行相似性度量反映了模式的几何特征,同时修正了特征之间存在的度量标准不统一的问题,更具有稳定性。
1.4 基于箱线图的变化检测
Tukey[23]于1977年提出的箱线图理论是数据挖掘最经典的方法之一。箱线图不要求样本数据严格服从统计学分布,直接处理样本,因此对于待挖掘的样本数据具有极强的抗差能力。箱线图判断变化对象的标准不同于卡方检测以耐抗性极小的均值和标准差为基础,而是以四分位数和四分位间距为基础。数据中的四分位数在选定时并不依赖极值点而只与数据主体有关,因此不易受变化对象的干扰,具有较强的鲁棒性,在识别变化对象方面有一定的优越性,可较客观地对数据进行分析。
鉴于箱线图原理不需假设数据分布,不易受变化对象干扰,具有较强鲁棒性的优点,将其用于变化阈值的确定。箱线图结构如图3所示,图中IQR为上、下四分位之差,Qi中i取1,2,3,分别为下四分位数、中位数、上四分位数。
图3 箱线图结构
Fig.3 Configuration of box-plot
假设Li为分位数所在样本数据中的位置,n为数据个数,dataj为第j个数据,则
将数据按升序排列,若位置参数为整数则取出相应数据即可,若不是整数,则其取值计算公式为
式中⌊Li」和「Li⌉表示将Li向下和向上取整。
在箱线图结构中上四分位数与下四分位数以外1.5倍IQR位置对应的位置称为内限,上四分位数与下四分位数以外3倍IQR位置对应的位置称为外限。在内限与外限之间的数据点称为界外值也叫轻度离群点,外限以外的数据点称为极端值,也叫极端离群点。本文应用箱线图算法将所得影像的变化指数进行迭代剔除变化对象[24],筛选出位于上四分位数与下四分位数以外3倍四分位间距的极端数据点,直至无对象被判别为变化对象。首先对所得变化指数进行排序,根据式(5)与式(6)获得箱线图四分位数,计算阈值Q1-3IQR与Q3+3IQR,根据阈值对数据进行筛选,迭代输出,直至无对象被判定为变化对象。
2.1 研究区概况及数据源
实验数据为高分一号(GF-1)多光谱影像(8 m空间分辨率)和全色影像(2 m空间分辨率)的融合影像,空间分辨率为2 m,包含红、绿、蓝和近红外4个波段,后续处理中选择红、绿、蓝3个波段。影像覆盖范围在E85°27'~85°40',N37°53'~38°20'之间,该地区常年有风沙侵蚀,对其进行变化检测,有利于及时了解土地沙漠化的变化趋势。根据遥感影像的目视判读结果,参照现有的地理国情普查分类体系,结合实验区地理特点,确定该实验区地物类别包括: 道路、建筑物、裸地、农田、沙漠、白沙漠、水体,滩涂和植被等9类。图4(a)为拍摄于2014年4月的B4(R),B3(G),B2(B)假彩色合成影像,图4(b)为拍摄于2015年2月经直方图匹配后的假彩色影像,图4(c)为通过目视判读结合地理国情调查数据所得的地面真实参考数据,图4(d)为应用本文所提方法的变化检测结果。
图4 变化检测影像与结果
Fig.4 Data and change detection result
2.2 实验结果
首先利用增长式分割方法获得带有ID号标记的实验对象,然后进行变化检测。本文所应用的算法旨在改进发现变化对象的过程,故只给出了第一个维度的精度,暂不考虑对变化的对象重新分类的精度。对研究区应用马氏距离和矢量夹角余弦2种相似性度量方法以及卡方检测与箱线图变化2种阈值确定方法,实验结果如图5所示。图5(c)为示例区域1在不同置信区间下,马氏距离与卡方检测变化检测方法的结果,图5(d)为示例区域1的马氏距离与箱线图相结合方法的变化检测结果,图5(e)为示例区域1的矢量夹角余弦与箱线图(本文方法)变化检测结果,图5(h)为示例区域2在不同置信区间下,马氏距离与卡方检测变化检测方法的结果,图5(i)为示例区域2马氏距离与箱线图相结合方法的变化检测结果,图5(j)为示例区域2的矢量夹角余弦与箱线图(本文方法)变化检测结果。根据以上结果发现,应用马氏距离作为相似性度量方法,虽得到更多的变化对象,但正确率也随之变小,符合其对微小变量敏感的特性。
图5 研究区采用不同方法变化检测结果(局部)
Fig.5 Subsets of the study area encompassing some objects detected as having changed with different method
表2为不同置信区间下马氏距离与卡方检测的变化检测精度,如表2所示,卡方检测在置信区间为0.99时取得最优精度,因此选取此结果同另外2种方法作对比(表3)。
表2 不同置信水平下的精度评定
Tab.2 Accuracy in different confidence(%)
评价指标 | 0.90 | 0.95 | 0.97 | 0.99 |
---|---|---|---|---|
正确率 | 50.37 | 70.67 | 73.67 | 79.43 |
遗漏率 | 6.58 | 10.30 | 15.21 | 19.67 |
总体精度 | 58.37 | 77.10 | 80.21 | 85.35 |
表3 不同方法的变化检测精度评定
Tab.3 Accuracy assessmentof change detection(%)
评价指标 | 马氏距离与 卡方检测 | 马氏距离与 箱线图 | 矢量夹角余弦 与箱线图 |
---|---|---|---|
正确率 | 79.43 | 80.25 | 83.14 |
遗漏率 | 19.67 | 16.82 | 17.37 |
总体精度 | 85.35 | 86.34 | 88.21 |
由表3可知,在相似性度量方法中,矢量夹角余弦同马氏距离相比,矢量夹角余弦结果更精确稳定; 在变化阈值确定方法中,箱线图同卡方检测相比,箱线图方法更具优势; 且不同于卡方检测需受置信区间的限制,基于箱线图的变化阈值确定方法更具稳定性。
2.3 实验分析
为分析不同相似性度量方法之间的优劣,本文构造了含有纹理与光谱信息的特征向量。然后分别采用基于马氏距离与矢量夹角余弦的相似性度量方法计算每个对象的变化指数。针对马氏距离进行数据拟合,结果如图6所示,发现数据并不严格服从正态分布,可能对基于此假设的变化检测方法产生一定的影响。本文又给出基于不同方法的类内相似度量方法的变化指数曲线与变化对象确定的箱线图(图7)。
图6 马氏距离数据拟合图
Fig.6 Mahalanobis distance data graph
图7 基于不同相似度量方法的箱线图及变化指数曲线
Fig.7 Box-whisker plot and change index based on different similarity measure method
从图7可以看出,矢量夹角余弦和马氏距离对异常点有相同的变化趋势,如在出现较大波动的位置基本一致,即检测到的变化对象基本一致; 但矢量夹角余弦的曲线整体更加平稳,对于变化对象有更好的甄别能力,表明矢量夹角余弦具有更高的正确检出率。马氏距离由于自身特点即对于各个特征分量的微小变化较为敏感,虽减少了遗漏检出率,但正确率较差,使得所有样本数据的整体曲线不够平缓,所以总体精度相对较低。
3 结论本文在研究基于多时空对象变化检测的基础上,分别引入了统计学中矢量夹角余弦计算对象的变化指数,以及基于箱线图的变化阈值确定算法迭代发现变化的对象,得出以下结论:
1)由于采用卡方检验的变化阈值确定算法要求数据服从正态分布,变化对象对平均值与方差产生的扰动较为明显,而基于箱线图的变化阈值确定算法不要求样本数据严格服从统计学分布,真实数据较高精度的实验检测结果验证了方法的优越性。
2)由于区分影像对象是否变化本身也是一个分类的过程。常规的影像分类会考虑特征的可分性,本文采用OIF方法选择特征,但发现信息量最大的特征组合检测的结果并不是最优异的,这表明检测时须根据实际情况考虑特征的选择。
3)由于本文应用场景为变化面积所占比例比较少,对于如何在变化面积所占比例比较大的情况下进行变化检测将是后续需要进一步研究的内容。
参考文献(略)
排版:喜马拉雅审核:晨风小语