本文内容来源于《测绘通报》2022年第11期,审图号:GS京(2022)1346号
易俐娜1, 张桂峰2,3, 魏征4,5, 王冕卿1, 刘晋珂1, 王柳靖1
1. 中国矿业大学(北京)地球科学与测绘工程学院, 北京 100083;
2. 中国科学院空天信息创新研究院, 北京 100094;
3. 中国科学院大学, 北京 100190;
4. 国家海洋局南海规划与环境研究院, 广东 广州 510145;
5. 南海遥感测绘协同应用技术创新中心, 广东 广州 510145
基金项目:高分遥感测绘应用示范系统(二期)(42-Y30B04-9001-19/21);国家自然科学基金(61405204);中央高校基本科研业务费项目-中国矿业大学(北京)(2022YQDC12);中国科学院战略性先导科技专项(A类)(XDA13020506);中国科学院科研仪器设备研制项目(YJKYYQ20170044);国家重点研发计划(2018YFB0504903;2016YFB0501402);中国科学院重点研发项目(Y9F0600Z2F);广东省促进经济发展专项资金粤自然资合[2020]012号
关键词:高光谱, 无人机, 红树林, 支持向量机, 面向对象
引文格式:易俐娜, 张桂峰, 魏征, 等. 利用无人机高光谱影像的红树林群落物种分类[J]. 测绘通报,2022(11):26-31. DOI: 10.13474/j.cnki.11-2246.2022.0320.摘要 :近年来红树林群落中物种结构简单、功能退化等环境问题日趋严重,为了及时准确掌握红树林群落的物种空间格局与分布,本文首先基于深圳福田红树林自然保护区无人机高光谱影像,利用归一化差值植被指数和归一化潮间红树林指数提取植被区域;然后在植被区域根据最佳指数法选取信息量大、波段相关性小的波段组合,分别采用基于像素支持向量机分类方法和面向对象影像分类方法对红树林物种进行分类。试验结果表明,基于像素支持向量机分类方法的总体精度为81.03%;利用面向对象影像分类方法的总体精度为85.58%。面向对象影像分类方法能有效去除椒盐噪声,充分利用对象光谱、形状及纹理信息,提供更准确的红树林分布信息。
红树林是生长在热带及亚热带地区海岸潮间带滩涂上的木本植物群落。近50年来,受全球气候变暖、海岸线变迁、环境污染及各种不合理开发的影响,世界红树林面积减少超过1/3,我国红树林被占地面积达12 923.7 hm2,红树林生态系统受到严重威胁。红树林群落物种空间分布信息的准确提取是监测红树林生态系统变化的基础。
红树林与盐沼环境受潮汐影响明显[1-2]。环境较为复杂,常规的野外测量方法难以准确测量,且实地调查工作量大、效率低、费用高[3]。利用卫星遥感技术对红树林进行物种识别和分类可节省数据的收集时间,减少野外工作的困难。但遥感影像受卫星轨道、云层等因素影响较大,难以获取高质量的遥感影像。而无人机航空摄影技术成像不仅具有成本低、数据更新周期短、空间分辨率高的特点,还能搭载各种类型的传感器,如高光谱、激光雷达等,可衍生大量光谱、纹理与结构特征[4]。已有研究结合无人机技术进行红树林种间分类。文献[5]基于多类型无人机遥感影像对研究区影像进行红树林树种精细分类和对比分析。结果表明,固定翼无人机航程远,适合获取大面积红树林数据;消费级旋翼无人机数据采集简单灵活,适合采集小范围的精细数据;专业级旋翼无人机能搭载多种传感器,获取多样化数据。文献[6]通过无人机航拍获取高分辨率影像,采用面向对象的最近邻分类方法对红树林树种类型进行分类研究。结果表明,该方法提取的红树林空间分布信息精度超过了90%。总体而言,高分辨率多光谱数据与机器学习分类算法的结合应用在种间分类方面取得较好的进展,但将无人机高光谱数据应用到红树林种间分类的研究却很少。而利用高光谱无人机遥感影像光谱信息丰富的优势,能够为植被精细分类提供更好的数据基础[7]。
随着轻小型高光谱成像光谱仪与无人机技术的发展,结合无人机高光谱遥感影像的红树林群落物种分类日益成为研究热点。无人机搭载的推扫式扫描仪成像具有容易实现、高分辨率和高系统灵敏度、体积小、重量轻等优点,但该成像方式受像方成像系统和探测器大小的限制,总视场一般在20°~30°,影像几何变形大、矫正难度大[8]。同时,无人机遥感还存在影像幅宽窄的问题,当观测范围较大时需要进行图像拼接,增大了处理难度和工作量[9]。
高光谱遥感影像包含上百个连续波段,可提供植物光谱细节信息。在高光谱遥感植被信息提取方面,应用无人机技术提取红树林信息的研究相对较少。文献[10]基于无人机高光谱数据和DSM数据,利用最邻近法和支持向量机2种分类法对广东珠海淇澳-担杆岛省级自然保护区红树林进行分类,总体精度分别为76.12%和82.39%。这些以像素为基本单元的方法通过光谱分析识别红树林物种,没有充分利用遥感影像纹理、形状等特征,无法避免椒盐效应。
面向对象分类方法首先根据像素间光谱异质性进行多尺度分割,将研究区分割成大小不同的同质性斑块,然后建立分类规则或监督分类法对研究区进行分类。文献[11]基于资源三号高分影像采用面向对象分类法对红树林进行种间分类,精度达到76.67%,总体Kappa系数为0.68。文献[12]结合红树林光谱、空间特征差异,对比使用面向对象方法中不同因子、分割尺度及分类器的分类精度。试验结果表明,当形状因子为0.6、紧致度因子为0.6、分割尺度为46时,随机森林法能有效区分无瓣海桑、白骨壤和秋茄3种红树林,总体精度为87.55%,Kappa系数为0.81[12]。
本文基于无人机搭载的ZK-VNIR-FPG480推扫式成像光谱仪对深圳福田红树林自然保护区进行高光谱影像采集,结合红树林实地调查数据,分别采用基于像素支持向量机方法和面向对象方法进行红树林群落物种分类,并构建混淆矩阵进行精度评价与对比分析。
深圳湾北部福田红树林保护区总面积为367.64 hm2,保护区内红树林的面积为100 hm2,是我国唯一位于市区、面积最小的自然保护区,也被国外生态专家称为“袖珍型保护区”,为我国南方重要湿地之一。该地区属亚热带海洋性季风气候,雨季为每年的3—9月,年均降水量1962 mm,平均气温22.5℃,年均日照时数2134 h,潮汐为不规则半日潮,平均潮差1.36 m,其主要群落物种类型有白骨壤、秋茄、无瓣海桑和海桑等。本文利用无人机搭载ZK-VNIR-FPG480推扫式成像光谱仪采集高光谱影像,该光谱成像仪具有光谱分辨率高,数据量大,影像畸变小等优点。其主要技术指标见表 1。表 1 ZK-VNIR-FPG480成像光谱仪系统主要技术指标由于单条航带的影像覆盖面积较小,为获得整个研究区的无人机高光谱反射率数据,需对无人机高光谱影像数据进行拼接。其主要流程为:①航带复原和旋转,计算反射率;②获取相邻航带同名点;③基于SIFT-RANSAC影像匹配方法获得相邻航带间高光谱影像同名像点,通过仿射变换完成图像配准;④颜色均衡;⑤基于直接平均融合或最佳缝合线法进行图像融合;⑥以正射影像为基准,镶嵌后寻找同名点对其进行地理配准,并采用双线性内插法对镶嵌后影像进行重采样,得到拼接后无人机高光谱影像[13]。红树林种类特征及影像特征见表 2,分类流程如图 1所示。图 1 技术路线
首先对预处理后的高光谱影像进行归一化差值植被指数(normalized difference vegetation index,NDVI)和归一化潮间红树林指数(normalization intertidal mangrove index,NIMI)[14]的计算;然后通过阈值分割提取红树林区域。根据不同红树林群落物种的光谱特征曲线进行分析(如图 2所示),可以对白骨壤、秋茄、无瓣海桑和海桑4类物种进行区分。由图 2可知,绿光和近红外波段较其余波段的物种间光谱特征差异更明显。在绿光波段,秋茄反射率最低,无瓣海桑反射率最高;在近红外波段,无瓣海桑反射率高于海桑,而秋茄反射率较前两者低,白骨壤反射率最低。图 2 白骨壤、秋茄、无瓣海桑和海桑的光谱特征曲线在分类中,高维特征会引发Hughes现象,为去除冗余特征,首先在分类前先利用最佳指数法(optimum index factor,OIF)指数选择信息量大、相关性小的波段组合完成特征选择;然后需选取具有代表性的典型样本,其中70%作为训练样本,剩余30%作为验证样本。基于所选样本分别进行基于像素支持向量机分类和面向对象的最近邻分类,再利用误差矩阵分别对两种分类方法进行精度评价。基于红树林、沙土和海水的光谱特征曲线(图 3所示)可知,红树林和海水均在560 nm附近出现反射峰后,两者的峰谷值开始呈现出差异。红树林在680 nm处存在波谷,在730~865 nm附近存在波峰,之后出现下降趋势。沙土反射率整体高于水体并呈上升趋势,在670 nm处存在波谷,在720~910 nm远低于植被。而海水在波段560 nm处达到峰值后,在较低反射率数值区间呈波动趋势。本文采用NDVI和NIMI[14]区分红树林与沙土和海水,其计算公式为式中,Bnir为近红外波段反射率;Bred为红光波段反射率;Bred_edge为红边范围内波段反射率。经多次波段计算,最终选取B114和B190对影像进行NDVI计算,对B114、B148、B166和B190进行NIMI计算,选择NDVI和NIMI分别属于[0.451 5,0.960 5]和[-0.923 0,-0.607 2]的像素掩膜得到研究区红树林分布结果。OIF综合考虑了单波段图像的信息量及各波段间的相关性,更接近于波段选择的原则,且计算简单,易于实现,在遥感影像特征选择中得到广泛的应用。计算公式为式中,si为第i个波段的标准差,Rij为i、j两波段的相关系数。选取部分蓝光、绿光、红光及近红外波段,计算OIF指数,OIF最大值对应波段组合即为最佳波段组合。表 3为OIF指数最大的前5组波段组合。支持向量机(SVM)是按监督学习方式对数据进行分类的线性分类器,其优点是分类时无需进行数据降维,能通过核方法解决高特征维度带来的线性不可分问题,在计算速度和分类精度方面具有较高质量。参数设置如下:SVM核函数gamma参数为1/3;惩罚参数控制了样本错误与分类刚延伸之间的平衡,设置为100;影像金字塔级别用于SVM训练和分类处理过程,设置为0,以原始分辨率处理。面向对象分类是以对象为最小单元进行影像分类的方法。采用多尺度分割方法在保证对象间平均异质性最小、对象内像素之间同质性最大的基础上进行分割。不仅减少了噪声,也可以充分利用影像形状及空间特征。结合影像尺度、色调、形状、纹理、紧密度及平滑度等参数,设置分割尺度为7,形状因子为0.5,紧致度为0.5,波段权重为1∶1∶1,采用最近邻分类法进行分类。以已有研究中对深圳红树林分类得到的成果图[4]为分类精度评价的参考数据,通过随机采样在影像上获得了1734个像素点作为测试样本,建立混淆矩阵计算总体精度和Kappa系数以进行分类精度评价。基于像素SVM和面向对象分类结果分别如图 4和图 5所示。可知,面向对象遥感影像分类结果能有效消除椒盐噪声。表 4和表 5分别为基于像素SVM分类和面向对象最近邻分类结果的混淆矩阵,可知,面向对象遥感影像分类总体精度较高,能达到85.58%的总体精度。其中,无瓣海桑、秋茄的生产者和用户精度均较高,达到86%以上的用户精度和88%以上的生产精度,然而,白骨壤的生产者精度较低,海桑的用户精度较低,这是由于海桑容易被误分为白骨壤所致。而根据样本光谱曲线(如图 3所示)可知,白骨壤和海桑在光谱特征上差异并不明显,且表 2显示的两种类别的纹理差异也不明显,因此难以区分。海桑是在深圳湾引种造林的人工林,虽然在天然红树林和光滩中出现了大面积的扩散,但是由于其生长时间较短,其在白骨壤群落中的成活率较低,因此在靠近岸边的白骨壤群落中,其零星分布难以得到有效提取,在未来研究中需要引入高程等先验知识辅助分类,以提高其分类精度。表 4 基于像元SVM分类结果的混淆矩阵
表 5 面向对象分类结果的混淆矩阵
本文基于无人机航拍的高光谱影像,对比了基于像素SVM分类算法和面向对象分类方法的红树林群落物种分类结果。主要结论如下:(1) 面向对象分类较SVM分类结果总体分类精度高0.045 5,Kappa系数高0.05,同时其漏分误差明显降低,能提供更准确的红树林分布信息。(2) 由于基于像元分类方法只是利用像元光谱信息,容易出现椒盐效应;面向对象分类方法充分利用了对象光谱、形状及纹理信息,能够有效去除椒盐噪声。因此,在高光谱影像数据红树林种群分类研究中,面向对象分类比基于像元的SVM分类方法更加准确地区分红树林类别。(3) 厘米级分辨率的无人机航拍影像,在多尺度分割中容易出现过度分割,造成红树林群落物种分割对象的边界区域包括多种物种,造成对象内物种不单一,影响最终的分类结果。(4) 无人机采集的高光谱影像对红树林细小斑块有较高的辨识度,能减少红树林漏分现象,对光谱特性较为相似的红树林种类也能更好地区分。本文利用无人机高光谱影像数据通过两种方法对红树林种群进行了系统的分类研究,但仍存在一些不足,需要在之后的工作中改进。通过无人机获取的高分辨率影像虽然具有较高的空间分辨率,但仍无法避免混合像元的影响。想要得到更加精确的分类结果,需要考虑混合像元分解方法对高光谱数据进行解混分析,进而提高分类结果的可靠性。除了高光谱数据外,还可以考虑融合多源数据,引入新的模型从高光谱数据中挖掘更丰富的特征,进而提升分类精度和效果。
作者简介:易俐娜(1986-),女,博士,讲师,研究方向为无人机高光谱遥感、高分辨率遥感、激光点云数据处理及信息提取。E-mail:lina1986350@163.com通信作者:张桂峰,E-mail:zhanggf@aircas.ac.cn