遥感智能之监督分类 VS 非监督分类

GIS前沿 2022-12-04

The following article is from 超擎时空 Author Meta小擎

计算机视觉识别的两大元老

随着遥感卫星星座对地观测时空分辨率的不断提升，海量数据每天不断产生，要从这些影像中快速获取信息与量化数据，遥感智能已经成为必经之路。

作为深度学习与遥感应用深度耦合的交叉领域，遥感智能的热潮始于深度学习方法成功应用于图像识别等领域。目前，人工智能与遥感影像的结合应用，已在遥感目标与场景识别、信息提取、地物分类、变化检测、三维重建等方面取得重要进展。

其中，监督分类与非监督分类作为计算机视觉分类模式，已有几十年发展历史，当其与卫星遥感数据结合应用后，成为从海量遥感图像信息提取、地物分类、定量分析的基础而成熟高效手段，已广泛应用于国土资源与环境监测、森林碳汇估算、农作物估产、地球科学与生态探索等重要领域，提升卫星遥感影像数据转化效率，大幅节省人力成本与时间。

这两大元老，如何实现快速分类地物？一个“非”字带来怎样的不同？优势与软肋又是什么？它们又适合哪些场景？

监督分类 Vs 非监督分类

常有人开玩笑地说，如果将机器看成是学生的话，监督分类和非监督分类最大的区别就是，“有人教学”和“无师自通”。虽然比较浅显，但也说出了这两者的大体区别。其实，这与两者的来源有关——机器学习中的监督学习与非监督学习，当应用到计算机视觉中，其主要任务和目的就是让机器自动执行对图像分类。

机器学习类别与算法 | 超擎时空

所以，监督分类与非监督分类作为计算机视觉两大工作模式的总称，其作用是相同的——对图像中的目标区域进行分类。具体到遥感影像领域的应用，是根据遥感影像中地物的光谱特征，将图像所有的像元按性质分为若干类别，主要区别在于样本、过程和算法。

监督分类

Supervised Classification

监督分类是在分类前人们已对影像样本区中的类别属性有了先验知识，进而利用这些样本类别特征作为依据和训练分类器（即建立判别函数），将每个像元归并到相对应类别中去，进而完成整幅影像的类型划分。

通过监督分类，可快速对地表覆盖实现分类并分析得出百分比，如图中的河流、农田、草原和林地。| flaechennutzung

监督分类是遥感AI最为常见训练模式，它的工作方式就是通过已有的训练样本，对影像中不同区域进行分类、标注或识别。常用的分类算法，也就是分类器有，最大似然法、平行算法、平行六面体法、最小距离法、马氏距离法、二值编码分类法、支持向量机、随机森林、决策树、波谱角等，很多采用的就是上文图中的监督学习算法，分析者可以根据影像中分类的复杂度、精度需求等确定哪一种分类器。

下面是几种典型的监督分类算法介绍——

平行六面体（Parallelpiped）

根据训练样本的亮度值形成一个n维的平行六面体数据空间，其他像元的光谱值如果落在平行六面体任何一个训练样本所对应的区域，就被划分其对应的类别中。平行六面体的尺度是由标准差阈值所确定的，而该标准差阈值则是根据所选类的均值求出。

最大似然 (Maximum Likelihood，ML)

一种参数统计方法。它根据数据的光谱分布计算概率密度函数，以确定像素属于特定类别的概率。

马氏距离 (Mahalanobis Distance，MaD)

计算输入图像到各训练样本的马氏距离（一种有效的计算两个未知样本集的相似度的方法），最终统计马氏距离最小的，即为此类别。

最小距离（Minimum Distance，MD）

利用训练样本数据计算出每一类的均值向量和标准差向量，然后以均值向量作为该类在特征空间中的中心位置，计算输入图像中每个像元到各类中心的距离，到哪一类中心的距离最小，该像元就归入到哪一类。

P.S: 其实这个方法就是计算欧几里得距离~

支持向量机 (Support Vector Machine，SVM)

一种建立在统计学习理论（Statistical Learning Theory或SLT）基础上的机器学习方法。SVM可以自动寻找那些对分类有较大区分能力的支持向量，由此构造出分类器，可以将类与类之间的间隔最大化，因而有较好的推广性和较高的分类准确率。

神经网络 (Neural Network，NN)

用算法实现人脑的识别、记忆、思考过程应用于图像分类，利用多层感知器感知器(MLP) 在输入层和输出层之间建立一个或多个隐藏的神经元层。

波谱角（Spectral Angle Mapper，SAM）

它是在N维空间将像元与参照波谱进行匹配，通过计算波谱间的相似度，之后对波谱之间相似度进行角度的对比，较小的角度表示更大的相似度。

监督分类一般工作流程是， 类别定义 → 选择样本 → 算法选择 → 监督分类 → 分类后处理 → 评价分类结果。

其中，“定义类别”主要是一个目视查看影像的过程，分析者需要根据分类目的、影像数据特征和分类区收集的信息确定分类系统；“选择样本”，就是根据前步骤中分析者目视确定的类别系统去选择相应的训练样本。这两个步骤要求分析者对类别的定义具有典型性和代表性，避免人为主观因素带来影响，比如，分析者定义的类别有可能并不是图像中存在的自然类别，导致各类别间可能出现重叠；或者所选择的训练样本并不代表图像中的真实情形。

接下来就可以根据影像特征或分类目标选择合适的分类器，也就是我们上面介绍的不同算法，并正式开始“监督分类”的过程。

分类后的“处理”以及“评价结果”这两大环节也非常重要。其中，“处理”的主要目的是将自动分类中产生的杂项、斑点进行过滤剔除或分析聚类；最后就是对结果进行验证，以确定分类的精度和可靠性。有两种方式用于精度验证：一是混淆矩阵，二是ROC曲线。比较常用的为混淆矩阵；ROC曲线则是通过图形表达，帮助分析者直观了解分类精度。

采用支持向量机分类后，对分类结果进行人工处理

通过监督分类的操作过程，我们可以看到，监督分类主要优点集中在，

可充分利用先验知识，有选择地决定分类类别，避免出现不必要的类别；
可控制训练样本的选择；
可通过反复检验训练样本，来提高分类精度，避免分类严重错误；

然而，广博的地球表面，物种千差万别，同一大类的地物，也可能分出很多小类，监督分类需要前期拥有海量、准确的训练样本，而这些还是主要依靠人力来标注、评估、检验完成。由此可见，监督分类的不足在于：需要一定的训练样本积累，若某类别由于未被定义，则监督分类不能识别；并且，具体各种类别的训练样本的选取和精准度评估也需花费人力和时间。

非监督分类

Unsupervised Classification

了解了监督分类，我们再来看非监督分类。

非监督分类也称聚类分析，是指人们事先对分类过程不施加任何的先验知识，而仅凭数据（遥感影像地物的光谱特征的分布规律），即运用自然聚类的特性让机器进行自学习并进行分类，它以集群为理论基础，通过计算机对图像进行集聚统计分析，是模式识别的一种方法。非监督分类在遥感影像领域的主要算法为ISODATA、K-means。

ISODATA

一种重复自组织数据分析技术，计算数据空间中均匀分布的类均值，然后用最小距离技术将剩余像元进行迭代聚合，每次迭代都重新计算均值，且根据所得的新均值，对像元再进行分类。

K-Means

使用聚类分析方法，随机地查找聚类簇的聚类相似度相近，即中心位置，是利用各聚类中对象的均值获得一个“中心对象”来进行计算的，然后迭代地重新配置她们，完成分类过程。

ISODATA、K-means较其他分类方法的优势在于，把分析判别的统计聚类算法和简单多光谱分类融合在一起，使聚类更加准确客观。

非监督分类的一般工作流程是， 分析影像 → 算法选择 → 非监督分类 → 类别定义/类别合并 → 验证分类结果。

非监督分类并不采用先验知识和训练样本，所以在分类之前，需要分析者先大体判断影像中主要的地物类别数量和光谱特征，选择算法，即开始分类，与监督分析相比，前期任务较为轻松。但在机器自分类之后，分析者需要通过目视或者其他方式识别分类结果，并填写相应的类型名称和颜色。

通过工作流程，同样也能很好地理解非监督分类的优缺点。其优势在于，机器分类之前，人为约束较少，仅需框定地物类别；并且，当研究区域的现场数据或先验知识不可用时，无监督分类也可以继续工作。但在机器分类后，分析者需要对光谱集群组重新归类和标识，也就是类别定义和类别合并，这个过程也有较大工作量，部分类别需要数据支持，或组织野外实地调查。

PK结果：两者差异及应用场景

通过两者描述、工作流程对比，两者根本差异为，是否有训练样本。

监督分类必须有训练样本，通过训练样本对影像使用规律；非监督没有训练样本，只有一组数据，在该组数据集内寻找规律。

根据两者优劣势对比，它们也都有适用的场景。

对于影像中的地表种类较为常见，或者目标区域光谱特征差异较小时，监督分类显得游刃有余，可广泛应用于常见地物提取，如土地类型与植被覆盖、森林、农田、道路、水体、沙漠等，可用于城市管理、土地利用、道路提取等。

通过对1992年、2000年、2008年三个时相下Landsat影像进行监督分类，分析巴基斯坦林地变化导致的碳排放，证实了24年中土地覆盖变化：森林覆盖率减少、人类居住点与耕地增加，大幅增加了当地的碳排放。| Umer Khayyam，Sarah Waseem，2021

并且，在某些固定地物类型、学科和行业持续深入，可以不断积累准确度更高、更为细分类型的训练样本，形成专业样本库，可在整体上提升分类效率。

基于半监督学习框架的复杂农业种植结构分类。随着训练集样本的增加，图中微小斑点的数量逐渐减少，表明训练集中更多的样本可以获得更高的分类精度。| Ziyi Feng，Guanhua Huang and Daocai Chi，2020

非监督分类，因为不具有先验性规则约束，只是根据光谱“盲目”地对影像中的像素进行分类，但这也带来另外一种优势：这种探索性质的自组织和聚类模式更适合地球物理数据集成、近地表地球资源、绘制地表类型和变化、陆地生态系统等地球科学，可用于生态研究、大尺度下地球变化规律探索等。

利用ISODATA无监督分类对古地质景观进行分类，有助于确定使用真彩色图像无法清晰注意到的地质景观差异。| Dylan S. Davis

不过，监督分类与非监督分类并不总是对手。在复杂的地表或农作物研究中，两者联合将更有效率。例如在复杂农作物种植结构分类中，先采用非监督分类去除非农业用地，再通过监督分类区分农作物，能够有效提升分类效率和精准程度。并且，它们都可以与现场数据、数据模型、多光谱遥感数据灵活协同工作，提升精度和细节。

遥感影像分类的未来

无论监督分类与非监督分类如何的PK，最终目标还是更高效率、更精准、更自动化地对地表物体进行分类和量化，为了这个目标，更多深度学习视觉识别算法也参与到遥感影像分类中来；反观数据源头，获取手段与技术也在不断进步，数据获取类型增多、时空分辨率提升，也对智能分类的可靠程度起到促进作用；同时，随着遥感智能行业的大发展和广泛应用，不断积累行业样本，地物模型数据库，都对产业整体效率起到提升作用。这让监督分类与非监督分类不仅多了很多新伙伴，也进一步提升了精细度与效率。监督分类与非监督分类，这两棵生长了十几年的老树，如今不断长出分支和新芽，枝繁叶茂。

那么，在这些因素的推动下，遥感影像智能分类领域又在发生怎样的变化？且听下回「新选手加入、产业链发展，给遥感智能分类带来怎样的新趋势？」

- END -

龚健雅院士：遥感大数据与智能解译

AI+遥感：释放每个像元价值

张力：基于多源遥感数据的三维实景重建关键技术及应用

80G倾斜正射多光谱数据、谷歌影像、各种遥感数据下载

城市级实景三维浏览