自由微信 | FreeWeChat

查看原文

其他

论文推荐|董杨：主成分分析的匹配点对提纯方法

Original 2017-03-24 董杨，范大昭 测绘学报

《测绘学报》

构建与学术的桥梁拉近与权威的距离

测绘地理信息与导航高端论坛 ——《测绘学报》创刊60周年学术研讨会通知（第一号）

主成分分析的匹配点对提纯方法

董杨, 范大昭, 纪松, 雷蓉

信息工程大学, 河南郑州 450000

收稿日期：2016-05-24；修回日期：2017-01-04

基金项目：国家自然科学基金（41401534）；地理信息工程国家重点实验室开放基金（SKLGIE2013-M-3-1）

第一作者简介：董杨(1992-),男,硕士生,研究方向为数字摄影测量。

E-mail：

通信作者：范大昭

E-mail:

摘要：传统的匹配点对提纯算法通常需要寻找小部分点集作为初始输入，再迭代求解出能够满足大多数点对约束要求的最优解，其提纯结果易陷入局部极值，造成正确匹配点对的遗漏。针对这一问题，本文引入了主成分分析思想，将整体点集作为初始输入，逐步剔除误匹配点对，稳健求解，得到更为准确的全局最优解，降低正确匹配点对的遗漏率，达到较好的提纯效果。试验表明，本文方法在一定的原始误匹配率下，能够得到整体最优解，在剔除误匹配点对的同时，能够避免或减少正确匹配点对的遗漏。

关键词：影像匹配主成分分析奇异值分解提纯 RANSAC

The Purification Method of Matching Points Based on Principal Component Analysis

DONG Yang, FAN Dazhao, JI Song, LEI Rong

Abstract: The traditional purification method of matching points usually uses a small number of the points as initial input. Though it can meet most of the requirements of point constraints, the iterative purification solution is easy to fall into local extreme, which results in the missing of correct matching points. To solve this problem, we introduce the principal component analysis method to use the whole point set as initial input. And thorough mismatching points step eliminating and robust solving, more accurate global optimal solution, which intends to reduce the omission rate of correct matching points and thus reaches better purification effect, can be obtained. Experimental results show that this method can obtain the global optimal solution under a certain original false matching rate, and can decrease or avoid the omission of correct matching points.

Key words: image matching principal components analysis singular value decomposition purification random sample consensus

在影像匹配过程中，经常会存在一些误匹配点对，这时可以通过匹配提纯的方法对误匹配点对进行剔除。一般的提纯思路是寻找一个恰当的匹配点对约束模型，估计出正确的模型参数，利用约束模型进行匹配点对提纯。在匹配点对约束模型中，通常使用变换约束矩阵作为估计模型，其一般包括平移变换、刚体变换、相似性变换、仿射变换、射影变换、极线几何基本矩阵变换等。现行的变换约束矩阵模型已经能够很好地进行匹配点对间的几何约束，因此大多数学者更加倾向于模型参数估计方法的研究。

在模型参数估计中，常用的方法有稳健回归估计和随机参数估计等。对于稳健回归估计方法，如M-估计^[-]，其核心思想是采用迭代加权最小二乘估计回归系数，但其仅能适应误匹配率较小的情况。对于随机参数估计方法，如LMedS(least median of squares)算法^[-]、MLESAC(maximum likelihood estimation sample and consensus)算法^[]和RANSAC(random sample consensus)算法^[]等，其核心思想是随机选择样本子集，迭代挑选出最佳模型参数。其中，RANSAC算法能够在存在大量外点的数据中找到内点，因而得到广泛应用并派生出一系列改进算法^[-]。改进的RANSAC方法主要从两个方面进行了优化。一方面是速度优化，如P-RANSAC(preemptive RANSAC)^[-]和R-RANSAC(randomized RANSAC)^[-]等；一方面是提纯率的优化，如M-RANSAC(multi RANSAC)^[]等。然而这些算法都需要选择一个合适的初始内点集，提纯结果容易陷入局部最优解，造成部分正确匹配点对遗漏；在误匹配率增大时，成功选择内点集的试验次数也急剧增大。除了以上的约束模型及参数估计方法，近期也有一些其他的研究成果^[-]。文献[]提出通过统计模板的旋转角度直方图来剔除误匹配，但其依赖角度区间的划分，仅适用于对精度要求不高的情况；文献[]提出一致性函数(correspondence function)模型，通过学习匹配点对一致性函数来拒绝误匹配；文献[]提出通过Hough变换求解模型参数来进行匹配点对提纯，然而仅适用于模型参数较少的情况。由此，在匹配点对约束模型选定的情况下，本文对如何求解模型参数整体最优解，实现稳健匹配点对提纯的问题进行了研究。

主成分分析(principal components analysis，PCA)^[-]是一种有效的多元统计方法，在信号处理、统计学等领域有重要应用。类似于信号处理过程中利用主成分分析方法进行噪声去除，可将主成分分析思想引入匹配点对提纯的过程，逐步剔除噪声点，实现匹配点对的提纯。为了方便阐述与试验，文中以奇异值分解作为主成分分析的具体实现方法，并以此为基础对提纯方法进行了推导与论述。奇异值分解^[-](singular value decomposition，SVD)是矩阵分析中正规矩阵酉对角化的推广，是一种重要的主成分分析实现方法，能够进行并行化计算^[-]，可用于最小二乘求解^[-]，已被广泛应用于各个领域。

本文分析了奇异值分解中奇异值的对应含义，并将其引用到匹配点对提纯过程中。首先，用特定模型来描述匹配点对之间的变换关系，建立模型误差方程；其次，对含有匹配点对信息的系数矩阵进行奇异值分解，重构大奇异值对应的矩阵，得到差分矩阵；然后，剔除可能的误匹配点对，构造降阶矩阵，进行模型求解；最后，利用求解的模型参数，进行匹配点对约束，达到匹配点对提纯的目的。

1 匹配点对提纯模型与算法1.1 主成分分析与奇异值分解模型

经典的主成分分析算法通过计算输入数据的协方差矩阵及其特征向量来实现数据主成分的提取。当数据规模较大时，这一途径的计算代价非常昂贵。而奇异值分解与主成分分析都是特征正交分解(proper orthogonal decomposition，POD)，具有等价性^[]，在实际应用中处理效果相似^[]。奇异值分解无需计算协方差矩阵，无需进行均值化处理，计算量少，能避免计算协方差矩阵的舍入误差，相对误差较小，因此计算主成分最优的方法是使用奇异值分解^[]。

定义一个秩为r的m×n维矩阵A，则A的奇异值分解形式为

(1)

式中,U为m×m维正交矩阵；V为n×n维正交矩阵,S为m×n维对角阵。U的列向量u_i称为矩阵A的左奇异向量；V的列向量v_i称为矩阵A的右奇异向量；S的对角线元素σ_i称为矩阵A的奇异值，且以递减顺序排列，即σ₁≥σ₂≥…≥σ_r。

由矩阵A的前t个奇异值重新组成对角阵S_t×t=diag[σ₁,σ₂,…,σ_t]，由奇异值对应的左、右奇异向量重新组成矩阵U_m×t=[u₁,u₂,…,u_t]和V_t×n=[v₁,v₂,…,v_t]，利用式(1)可重构矩阵A，得到

(2)

对式(2)进行化简可得

(3)

A′为A的近似矩阵，由矩阵A的主奇异值重构而成，包含了矩阵A的主要信息。两矩阵间的差分矩阵ΔA为

(4)

可以发现,A与A′间仅相差小奇异值对应的部分。研究表明，大的奇异值对应的重构矩阵A′包含更多的主要信息，小的奇异值对应的差分矩阵ΔA包含更多的噪声信息^[-]。基于这种思想，ΔA则反映了矩阵A中噪声信息的大体分布情况。因此，可依据差分矩阵ΔA进行矩阵A中的噪声剔除，得到更为合理的降阶矩阵B，这也是本文主成分分析思想研究的关键。

1.2 主成分分析思想下的提纯模型

随着特征点提取与匹配技术的不断发展，硬件计算能力的日益增长，现行的匹配算法已使匹配精度达到一个较高的水平。但由于算法本身的缺陷，不可避免地存在一些误匹配点对，这时就需要利用一些技术手段将其剔除。在此背景下，本文以“正确匹配点对占据匹配中的主要成分”为先验条件，结合现有的数据分析技术，尝试在匹配点对提纯中引入主成分分析思想，从而求解出较优的提纯结果。

假设点集Φ＝Ρ_ii=0，1，…,n中包含n个点，匹配点对间的约束模型为Ψ。为了求解Ψ的模型参数，可通过数据Φ，得到m个误差方程。对所有误差方程进行主成分分析，得到正确匹配点对对应的误差方程，然后求解出模型参数，最后依据精准的模型进行匹配点对的约束提纯。在此过程中使用整体点对信息进行参数求解，相比于RANSAC方法大大减少了迭代次数，避免了RANSAC方法随机采样造成的多次运行结果可能不一致的现象，从而增加了求解的稳定性。由于主成分分析是一个非精准的过程，以上过程需迭代进行，如所示。

图 1 主成分分析思想下的提纯流程Fig. 1 The process of purification based on principal component analysis

为了具体说明提纯方法，下文以奇异值分解作为主成分分析的具体实现方法，以基本矩阵模型作为约束模型，对以上过程进行详细推导。

1.3 基于奇异值分解的匹配点对提纯算法

匹配点对提纯应遵循两个原则：一是正确匹配点对被剔除的概率应尽量小，即“弃真”错误少发生；二是误匹配点对被接受的概率应尽量小，即“取伪”错误少发生。前者避免了提纯算法过于严格，后者避免了提纯算法过于宽松。两者相互作用，避免了提纯结果陷入局部最优解，确保了提纯过程的稳健性。匹配提纯的实质是匹配点对间模型参数的确定，选择合适的模型以及适当的参数，使其满足提纯的两个原则，即可实现匹配点对间的提纯操作。这里使用基本矩阵模型进行求解推导。

影像间匹配点对一般满足极线几何约束，即对应匹配点应在对应极线上。这一约束可通过基本矩阵描述为

(5)

式中，m=(x,y,1)^T、m′=(x′,y′,1)^T分别为匹配点对齐次坐标；F为基本矩阵。令F=(f_ij)，则式(5)可写为如下形式

(6)

式中，f=[f₁₁ f₁₂ f₁₃ f₂₁ f₂₂ f₂₃ f₃₁ f₃₂ f₃₃]^T。将式(6)作为模型,f作为待解参数，可进行匹配点对的提纯。给定n对匹配点对可以得到线性方程组

(7)

式中,A为n×9维的系数阵。对A进行奇异值分解，利用前t个奇异值得到其对应的差分矩阵ΔA，则每一匹配点对对应的近似误差值为φ_i=，进一步得到近似均方误差

(8)

式中，Δa_ij为ΔA中的元素。以近似均方误差作为阈值，对每一匹配点对误差方程进行筛选，得到约束后的匹配点对误差方程，然后再次重新组成系数矩阵，得到降维矩阵B。对矩阵B再次进行奇异值分解，求解f的最小二乘解，并进行秩2约束，得到最终的模型参数解f。利用求解的参数及相应的模型，对匹配点对进行约束，得到提纯点对。利用提纯后的点对迭代进行以上步骤，直到求解的模型参数f趋于稳定。整个算法流程如所示。

图 2 匹配点对提纯流程Fig. 2 Matching points purification

2 试验及其结果分析

上述算法中，重要的一步是计算重构矩阵时奇异值个数t的确定。一个恰当的t应能使计算的重构矩阵A′中的正确匹配点对部分，与原始矩阵A中对应的正确匹配点对部分尽量相似，而对应的误匹配部分尽量相差较大。即ΔA中正确匹配点对的近似误差值尽量小，而误匹配点对的近似误差值尽量大。

利用多幅影像进行试验，这里选取某幅影像中的1000对正确匹配点对进行说明。如所示，对前100对匹配点对加入随机误差，分别在t=1,2,…,8的条件下求解差分矩阵，计算每一匹配点对对应的近似误差，得到如所示的结果。

图 3 匹配点对示意图Fig. 3 Matching points diagram

图 4 取值误差示意图Fig. 4 Value of the error diagram

中横轴表示匹配点对，纵轴表示对应的近似误差值，其中前100个为误匹配点对，可以看出当t值取5时，已经能够很好地区别正确匹配点对与误匹配点对，当t值增大时，虽然这种区别更加明显，但计算量也随之而增长。在实际操作中取t=5。

在得到恰当的t值后，为了进一步验证本文算法的实际效果，对含有不同误点率的影像匹配点对进行了试验，截取其中6对试验影像，如至所示。其中，每幅图中(a)图表示原始像对图，(b)图表示加入误匹配点对后的像对图，(c)图表示利用本文方法进行点对提纯后的像对图。

图 5 经过本文方法提纯后，误点率由13.85%降到0Fig. 5 The mismatch percentage is reduced from 13.85% to 0

图 6 经过本文方法提纯后，误点率由33.33%降到0Fig. 6 The mismatch percentage is reduced from 33.33% to 0

图 7 经过本文方法提纯后，误点率由36.94%降到0Fig. 7 The mismatch percentage is reduced from 36.94% to 0

图 8 经过本文方法提纯后，误点率由50.00%降到0Fig. 8 The mismatch percentage is reduced from 50% to 0

图 9 经过本文方法提纯后，误点率由71.00%降到2.03%Fig. 9 The mismatch percentage is reduced from 71.00% to 2.03%

图 10 经过本文方法提纯后，误点率由78.33%降到0.77%Fig. 10 The mismatch percentage is reduced from 78.33% to 0.77%

至为手机拍摄影像，至为普通相机拍摄影像，为航拍影像。可以看出，在不同场景中随着误匹配率的不断提升，本文方法仍能保持着优良的提纯率，反映了本文方法较好的稳健性。同时，为了比较本文算法的效率与全局求解的优势，将上述像对分别用经典RANSAC算法进行处理，统计每次的运算耗时与实际迭代次数，统计如所示。其中，设置RANSAC算法迭代上限为2000次，本文算法迭代上限为50次，编号1—编号6数据分别对应—。

表 1 对比结果信息Tab. 1 Comparison results table

编号	试验数据		时间/ms		迭代次数
总点数	误点率 /(%)		本文方法	RANSAC		本文方法	RANSAC
1	65	13.85		11	3		5	36
2	60	33.33	10	4	4	92
3	111	36.94	12	13	4	240
4	200	50.00	13	26	3	446
5	500	71.00	40	205	10	2000
6	6000	78.33	2170	1430	30	2000

中时间栏为多次试验的平均耗时。同时，本文认为试验中处理时间差异在10 ms以内的两种方法处于相同的耗时水平。由可以看出不同情况下本文方法迭代次数皆远小于RANSAC方法的迭代次数。由于全局求解的优势，本文方法在数次迭代后便可得到最优解，而RANSAC方法由于随机抽样的特性，在大数据量与高误点率的情况下，迭代次数骤然上升。试验中编号为5和6的数据试验结果表明RANSAC方法在此种情况下已达到迭代次数上限。同时，由也可以看出在低误点率情况下，本文方法与RANSAC方法时间消耗相当，在中误点率的情况下，本文方法时间消耗少于RANSAC方法，而在高误点率的情况下，本文方法耗时多于RANSAC方法。这种特性是由奇异值分解过程的耗时与迭代次数上限的设置共同造成的。单次奇异值分解的耗时大于单次随机采样求解的耗时，在低误点率的情况下，RANSAC方法迭代次数多于本文方法，总体而言时间消耗相当；在中误点率的情况下，RANSAC方法迭代次数骤然增加，而本文方法迭代次数增加缓慢，总体而言本文方法耗时相对较少；在高误点率的极端情况下，由于RANSAC方法迭代次数已达到上限，而本文方法的迭代次数继续增加，耗时相对较多。在实际应用中可通过奇异值分解算法的并行求解与GPU加速缩短单次求解时间，优化整体耗时。

为了进一步验证本文算法与现有算法间的性能优劣，取1000对正确匹配点对逐步加入随机误差，分别用经典RANSAC算法和本文算法对匹配点对进行提纯，得到结果如和所示。

表 2 对比结果信息Tab. 2 Comparison results table

原始匹配点		RANSAC方法		本文方法
原始总点数	原始误点数		提纯总点数	提纯误点数	弃真率 /(%)	取假率 /(%)		提纯总点数	提纯误点数	弃真率 /(%)	取假率 /(%)
1000	100		848	0	6.13	0.00		900	0	0.00	0.00
1000	200	789	0	1.38	0.00	800	0	0.00	0.00
1000	300	689	0	1.57	0.00	700	0	0.00	0.00
1000	400	593	0	1.17	0.00	600	0	0.00	0.00
1000	500	500	0	0.00	0.00	500	0	0.00	0.00
1000	600	401	1	0.00	0.17	401	1	0.00	0.17
1000	700	295	0	1.67	0.00	300	0	0.00	0.00
1000	800	164	3	19.50	0.38	195	0	2.50	0.00
1000	850	115	4	26.00	0.47	154	4	0.00	0.47
1000	870	84	3	37.69	0.34	129	2	2.31	0.23
1000	880	77	3	38.33	0.34	0	0	100.00	0.00
1000	890	70	3	39.09	0.34	2	1	99.09	0.11
1000	900	68	6	38.00	0.67	1	1	100.00	0.11

图 11 试验结果对比Fig. 11 Comparison of experimental results

试验中，RANSAC算法和本文算法的最终阈值约束都设置为3。根据之前提到的两个原则，定义弃真率的计算公式为P_T=n_t1/n_t，n_t1表示未能被提取出来的正确匹配点对个数，n_t表示总共的正确匹配点对个数；定义取假率的计算公式为P_F=n_f1/n_f，n_f1表示被提取出来的误匹配点对的个数，n_f表示总共的误匹配点对个数。图11中横轴表示原始匹配点对中的误匹配率值，纵轴表示比率值。中括号内的数据表示误匹配点对的个数。由和中数据可以发现，在不同的原始误匹配率下，RANSAC方法始终带有一定的弃真率，这是由求解的模型参数陷入局部极值造成的。而本文方法，在原始误匹配率达到87%之前，都保持着较低的弃真率与取假率，尤其是在误匹配率达到50%之前，有着理想的弃真率与取假率，具有稳健的模型参数解，相对优于RANSAC方法，符合预期结果。但在误匹配率达到87%之后，本文方法的弃真率急剧上升，RANSAC方法弃真率则保持在38%左右。这是由于本文方法引入的主成分分特性所造成的，当误匹配率极大时，正确信息被湮没在噪声信息之中造成了正确主成分提取失败。但在实际应用过程中，原始误匹配率达到80%的情况不易发生，本文方法在弃真率与取假率方面总体而言优于RANSAC方法。

3 结语

经典的RANSAC方法将随机挑选的小部分点对作为输入，计算模型参数，然后验证全部点对，留下能够满足大多数点对的模型参数作为结果，是一种“由小到大”的思想。本文方法首先将全部点对作为输入，利用主成分分析思想，剔除可能的误匹配点对，计算模型参数，然后验证全部点对，迭代求解出稳健的模型参数，是一种“由大到小”的思想。RANSAC方法由于这种随机抽选的特性，使得其容易陷入局部极大值，求解不出最优的模型参数。针对这种不足，本文方法将整体匹配点对作为输入，避免了局部极值的弊端，能够求解出相对稳定的模型参数。试验表明，在中、低原始误匹配率的情况下，本文方法迭代次数较少，总体耗时较短，弃真率与取假率较低，相对优于RANSAC方法；在高原始误匹配率的极端情况下，本文方法相对劣于RANSAC方法。同时，本文在试验中推导并采用了奇异值分解模型和基本矩阵模型，在实际应用中可根据情况更换模型。

【引文格式】董杨，范大昭，纪松，等。主成分分析的匹配点对提纯方法[J]. 测绘学报，2017，46(2)：228-236. DOI: 10.11947/j.AGCS.2017.20160250

更多精彩内容：

重磅 | 国家标准可以免费公开查阅啦！

惊叹！“高景一号”商遥卫星发回高清影像图！

2017国家科学技术奖项目推荐名单公示

行业动态|运载火箭“长二丙”将拉开低轨商用卫星发射大幕！

行业动态 | 北斗在京津冀协同发展中发力

行业动态 | 空间信息领域，哪国基础设施和配套政策最成熟？

行业动态|中国海洋科考连破两个世界纪录意味着什么？

林珲教授荣获美国地理学家协会2017年米勒奖

《测绘学报》2017年第2期网刊发布

审稿专家必看，如何写出一篇优质的评审报告！