论文推荐|明冬萍:遥感模式分类中的空间统计学应用——以面向对象的遥感影像农田提取为例
如何有效地从遥感图像中提取所需信息,是遥感图像处理和应用的关键,而尺度选择问题一直是影响遥感信息提取精度的关键问题之一。本文论述了利用空间统计学方法解决遥感影像模式分类中的尺度问题的理论基础。针对面向对象影像分析问题,将影响遥感影像多尺度分割的尺度分割参数概括为空间属性分割参数、光谱属性分割参数和影像对象面积阈值参数,并分别提出了基于统计学的尺度参数估计方法。以SPOT-5影像面向对象农田提取为例,基于变异函数方法进行了尺度优选试验,系列尺度分类试验结果表明基于空间统计学尺度估计得到的尺度分割结果进行分类能得到最高的精度,进而证明了基于空间统计学方法进行面向对象信息提取尺度估计的有效性。该方法是完全数据驱动的方法,基本不需要先验知识参与。不同于以往分割后评价的尺度选择方法会占用大量计算资源且耗费大量时间,本文提出的方法不仅能在一定程度上保证面向对象信息提取的精度,而且在一定程度上也提高了面向对象信息提取的效率和自动化程度。
高精度的遥感信息提取是遥感图像处理和应用的关键。传统的中低空间分辨率遥感信息提取,主要采用像元分类方法。基于像元光谱特征的硬分类不考虑相邻像元之间的空间相关性和尺度因素,或者即使有些分类算法融合了纹理特征,其本质上考虑了像元之间的空间相关性和影像特征的尺度因素,但是纹理分析的尺度或窗口大小往往采用人为给定,缺少对纹理特征尺度的定量分析,在遥感像元模式识别的自适应尺度选择上存在一定的主观性和盲目性。
随着高空间分辨率遥感的发展,像元之间的空间相关性不断增强,传统的遥感图像像元光谱分类方法面临着更大的挑战,高空间分辨率遥感像元分类的精度更是难以达到实际应用的需求。在这种背景下,“对象级”或者“面向对象遥感影像分析”(geo-object-based image analysis,GeOBIA)方法逐渐受到重视,并被誉为是遥感(RS)和地理信息系统(GIS)之间的桥梁。基于GeOBIA的“对象级”遥感影像分析主要是将影像划分成均质的影像对象,不仅能够表达影像区域的光谱特征,还能表达丰富的空间和上下文特征等语义信息,从而避免了分类中的椒盐效应,使光谱相似的地类区分成为可能[-]。在这个过程中,多尺度分割是“对象级”遥感影像分析的基础和关键,直接关系到后续的变化信息提取与分析[-],但是如何选择合适的分割尺度参数依旧是一个挑战[]。
实际上,无论是遥感像元分类,还是面向对象遥感分类,二者的实质是相同的,只是分类的客体从单个的规则的像素变成了连续的不规则的影像对象区域,分类所依据的特征由单纯的光谱或者纹理分类变成了多特征(不仅包括光谱或者纹理,还包括形状、尺度上下文关系等)协同的模式分类。在这两种分类中,尺度选择的不同会带来不同的分类效果和精度,前者体现为影像数据源的空间分辨率不同或者纹理分析采用的计算窗口大小不同[-],后者体现为多尺度分割采用的尺度参数不同[-]。正是由于尺度选择是否合适会极大地影响遥感信息提取的精度,遥感模式分类的最佳尺度选择成为遥感研究的关键科学问题和技术问题。
然而,由于尺度概念内涵本身的复杂性及尺度处理方法的复杂性,遥感处理与分析中的尺度选择一直是困扰遥感学界的难题。本文在系统总结遥感模式分类中的尺度问题的基础上,论述了将空间统计学应用于遥感模式分类尺度选择的理论基础和可行性,并以面向对象的高分辨率遥感影像农田提取为例,进行了将空间统计学应用于面向对象影像分析最佳尺度估计的实例验证。
尺度是一个广泛使用的术语,在一般科学研究领域,尺度主要指研究的范围或者详细程度[]。文献[-]对尺度概念的总结相对较为全面,可以扩展到地学其他研究领域,它们定义了4种与空间现象有关的尺度:制图尺度,指地图比例尺;观测尺度或地理尺度,即研究区域的空间扩展;量测尺度或分辨率,指空间数据集中最小的可区分部分,如遥感影像像素大小;运行尺度或操作尺度,指地学现象发生的空间环境范围。文献[]和文献[]将上述地学尺度的一般含义应用在遥感领域,结合面向对象遥感分析技术和影像理解的思想,从遥感数据处理、应用和分析的角度,提出了“像素-影像对象-格局”三层次的遥感尺度内涵,并将其与遥感信息处理与分析具体环节相结合,初步分析了各个层次尺度研究的重点。在此三层次的遥感尺度内涵基础上,本文针对前两个层次,结合遥感模式分类具体问题,提出了如所示的遥感分类中像素级与对象级尺度研究框架。
遥感分类中像素级与对象级尺度研究框架
在地学尺度的一般范畴里,合适的尺度本质上是恰好能反映地物间空间相关性是否存在的一个临界点[],因而空间统计学方法被认为是遥感处理与分析中尺度问题研究的一个重要途径[, ],且已被应用于面向遥感像元分类的最佳空间分辨率选择[-, ]以及面向对象遥感分析多尺度分割的尺度参数选择中[-]。
对于像元级尺度和遥感像元分类而言,尺度是与分辨率有内在联系的[],空间分辨率的大小反映了空间细节水平以及和背景环境的分离能力[]。对这种空间细节水平的描述,实质就是对地物空间相关性尺度依赖关系的描述,最简单也最有效果的方法就是经典地统计学中的变异函数方法(也称半方差方法),其在遥感影像尺度问题中得到应用的理论前提就是空间统计学中空间依赖性理论,即空间上相邻近的地物之间的相似性程度要强于空间上相距较远的地物[],也就是强调在短距离之内观察值比远距离的观察值更要相似,即方差较小[]。变异函数方法通过绘制地物属性值随空间幅度变化的方差图(semivariogram)来反映尺度变化[],方差图中几个明显的断点就是影像上的景观在不同尺度水平下的表现结果[],并以此来确定基于地物类别的景观研究所应采用的最佳分辨率。一个典型变异函数曲线如所示,根据影像数据统计计算确定的变程Range成为最佳空间分辨率选择的依据,合适的空间分辨率就是这个恰好能反映像元间空间相关性是否存在的自相关阈值范围。
半方差和局部方差计算过程
基于这个基本思想,文献[]提出利用局部方差图(LAVariogram)来近似替代semivariogram,二者的区别仅仅在于变异函数法考虑了地物自相关的方向性,而局部方差方法则综合计算了各个方向的方差,因而局部方差方法方法相当于是变异函数法的多方向综合后的计算结果,因而二者的空间统计学思想基础在一定程度上是相似的。这种理解与文献[]提出的在一定计算窗口下局部方差随影像空间分辨率变化的最大值对应的空间分辨率能更好地反映地物尺寸的思路殊途同归,都最终在方差曲线变程或地物自相关空间阈值上找到出路,因为大量实际统计计算表明当空间幅度计算间隔数量足够多的情况下,LAVariogram的形态和走势与多方个向下综合平均半方差曲线synthetic semivariogram基本一致(其示意图如所示)。换句话说,两种理解的实质都是最终将最佳空间分辨率(或地物尺寸)归结到了地物空间自相关的阈值。
将上述遥感影像尺度问题的空间统计学理解扩展到面向对象影像分析中,虽然尺度分析的对象由离散的规则的像元变为连续的形状不规则的影像对象,但尺度问题的本质依旧是空间统计学的空间自相关或者尺度依赖思想。在面向对象影像分析中,目前学术界还没有对对象级尺度概念进行明确的界定。根据影像对象的定义,对象级尺度是指影像对象(对象细节)在空间跨度上的大小;而从影像对象提取(影像分割)算法的角度,对象级尺度主要对应了多尺度分割算法中的尺度参数。其中前者体现了对象级尺度在理论上的定义,后者体现了对象级尺度在方法技术上的定义。因此对象级尺度研究的焦点目前主要集中在多尺度分割的尺度优选问题上。
关于对象级尺度选择方法的研究,在模式识别领域,主要进行了多尺度聚类分割过程中的尺度参数(带宽参数)选择的研究,如文献[]对均值漂移(mean-shift)聚类分割算法的属性带宽参数自动选择进行了研究,但同时指出这种方法对多变量聚类(多波段影像分割)的效果缺乏实际意义[]。此外也有研究对聚类过程中的带宽参数选择进行了研究,但其试验数据为现实生活中很少出现的离散的模拟数据[]。目前,图像处理领域也对多尺度分割的尺度参数选择问题进行了探讨,目前研究的思路主要分为两大类:一类是基于大量尺度分割结果进行监督或非监督分割评价进行的尺度优选,另一类是基于空间统计学计算的尺度预估计[-]。前者的实质是一种分割后的评价,而不是分割前的估计,无疑这种方法进行大量分割和评价要耗费大量的计算资源,普适性和自动化程度欠佳。后者的基于空间统计学计算的尺度预估计思想与地学空间数据分析领域提出的基于方差和频率计算的连续数据离散化处理的思想[-]有相通之处,只不过地学空间数据分析领域更多地关注属性数据的离散化,而遥感数据的分割是同时基于空间和属性信息的离散化处理,且遥感数据对应自然地表,遥感影像分割要顾及面积最小的地物类别也能准确划分,故影像分割的离散化过程中只能关注方差较小的部分以避免过度分割。总体上来说,遥感影像的分割尺度参数的确定应该是基于原始影像上全局或者局部特征的一种统计估计,因此空间统计学方法无论从空间统计学的科学思想基础,还是在算法计算效率等方面,都是解决面向对象影像分析尺度问题的根本且可行的方法。
遥感影像是一种特殊的空间数据,具有空间数据的两大基本特征,即空间特征和属性特征,因此,不同于一般非空间数据聚类,遥感影像的分割可以依据空间特征和属性特征进行。同时,考虑到遥感目标识别或信息提取的地学应用目标,许多分割算法将分割斑块(在面向对象影像分析中被称作影像对象)的大小也作为分割的主要参数,而在空间统计学意义上,影像对象的大小则是地物空间自相关在二维空间上的表现,因此影像对象的大小的尺度估计最终仍可归结到空间特征的尺度估计。
在此分析基础上,将影响遥感影像多尺度分割的尺度分割参数概括为空间属性分割参数hs、光谱属性分割参数hr和影像对象面积阈值参数M。其中,空间属性分割参数hs的实际含义是分割过程中像元在空间域的距离阈值,对应实际计算窗口的尺寸;光谱属性分割参数hr的实际含义是分割过程中像元在属性域的属性阈值,对应两类别间的灰度特征差值;影像对象面积阈值参数M的实际含义是分割斑块合并的阈值,即分割后最小斑块的像元数目。这3个参数是基于空间数据的一般属性提出的,几乎可以部分或者全部地应用于所有遥感影像分割算法中。进而,基于上文提出的遥感模式分类中的尺度问题的空间统计学理论基础,提出如所示的基于数据驱动的面向对象影像分析中的分割尺度自适应估计方法。详细的计算过程及原理见参考文献[-]。
数据驱动的分割尺度自适应估计方法示意图
研究区及试验影像
基于尺度估计的面向对象农田提取流程图
尺度选择问题一直是影响遥感信息提取精度的关键问题之一。本文论述了利用空间统计学方法解决遥感影像模式分类中的尺度问题的理论基础及可行性,并以面向对象农田提取为例,针对面向对象提取中最优分割尺度预测问题,基于变异函数方法进行了尺度优选试验,并以面向对象农田提取的多尺度分类为应用案例,进行了上述理论可行性及有效性的验证。试验结果证明了基于空间统计学理论方法进行面向对象信息提取尺度预测的有效性,该方法虽然难以估计绝对最佳尺度参数,但是通过该方法估计出的最佳尺度参数能从理论上接近最优,进而能在一定程度上保证面向对象信息提取的精度。此外,以往分割后评价的尺度选择方法会占用大量计算资源且耗费大量时间,本文提出的方法是完全数据驱动的方法,基本不需要先验知识的参与,一定程度上提高了面向对象信息提取的效率和自动化程度。
此外,需要说明几点:为进一步优化尺度选择的效果,在尺度参数估计时充分注意参考子影像的选取要有代表性,在计算能力允许的前提下,选择多个参考子区,综合求出折中的参数也是改进最终分类精度的可行途径;在今后的研究中,结合空间统计学理论方法,面向不同类型的地物或景观格局,实现分割前最优尺度分割参数的选择,并进行多个最优尺度的信息综合,更有效提高面向对象遥感影像处理与分析的精度和自动化程度,更深入地研究遥感尺度聚合问题的地学规律及实质,也将成为今后研究的重点。
全文内容请点击下方“阅读原文”
,
,中国地质大学(北京)信息工程学院, 北京 100083
收稿日期:2015-10-14; 修回日期:2016-02-24
基金项目:国家自然科学基金(41371347);中央高校基本科研业务费专项资金(2652013084)
第一作者简介:明冬萍(1976-),女,博士,副教授,主要从事遥感信息提取及地学尺度研究。
E-mail:
更多精彩内容:
高层观点|李维森副局长就新型智慧城市建设2016-2018任务分工及智慧城市时空基础设施建设答记者问
论文推荐|黄昆学:月球重力场模型GL0660B特征分析及其对绕月卫星轨道的影响
全文内容请点击下方“阅读原文”