查看原文
其他

论文推荐|李佳田:航空图像光流场的逆向金字塔计算方法

2016-11-01 编辑部 测绘学报


航空图像光流场的逆向金字塔计算方法


李佳田1, 李显凯1, 李应芸1, 钱堂慧1, 李果家1, 林艳2         

1. 昆明理工大学国土资源工程学院, 云南 昆明 650093 ;
2. 中国人民公安大学警务信息工程学院, 北京 100038

收稿日期:2015-07-13; 修回日期:2016-06-14

基金项目:国家自然科学基金(41561082;41161061)

第一作者简介:李佳田(1975-), 男,博士,副教授,研究方向为数值最优化方法与机器场景理解.

E-mail:

通信作者: 李显凯

E-mail:

 

摘要:航空图像光流场是低空运动目标检测与变化信息获取的基础,通常将图像金字塔结构引入数值过程以增强全局收敛性。然而,金字塔结构往往是由底层至顶层的递进方式构建,其忽略图像的几何成像过程,造成微小光流或不能得到光流的问题,导致难以支撑后续建模与分析。本文提出了一种以顶层图像为基准的逆向金字塔结构,首先依据中心投影定量地计算出顶层图像的降采样因子,使得顶层图像光流能够反映所设定的地面目标位移阈值;其次,结合顶层与原始图像,以等比方式确定中间层降采样因子;最后,利用高斯平滑与图像插值得到中间层图像,并形成金字塔。对比试验与分析表明,逆向金字塔可准确地计算航空图像光流场,在抑制地面微小位移方面具有优势。

关键词: 航空图像     光流场     逆向金字塔     中心投影     降采样    


A Backward Pyramid Oriented Optical Flow Field Computing Method for Aerial Image


LI Jiatian1, LI Xiankai1, LI Yingyun1, QIAN Tanghui1, LI Guojia1, LIN Yan2     

Abstract: Aerial image optical flow field is the foundation for detecting moving objects at low altitude and obtaining change information. In general, the image pyramid structure is embedded in numerical procedure in order to enhance the convergence globally. However, more often than not, the pyramid structure is constructed using a bottom-up approach progressively, ignoring the geometry imaging process.In particular, when the ground objects moving it will lead to miss optical flow or the optical flow too small that could hardly sustain the subsequent modeling and analyzing issues. So a backward pyramid structure is proposed on the foundation of top-level standard image. Firstly, down sampled factors of top-level image are calculated quantitatively through central projection, which making the optical flow in top-level image represent the shifting threshold of the set ground target. Secondly, combining top-level image with its original, the down sampled factors in middle layer are confirmed in a constant proportion way. Finally, the image of middle layer is achieved by Gaussian smoothing and image interpolation, and meanwhile the pyramid is formed. The comparative experiments and analysis illustrate that the backward pyramid can calculate the optic flow field in aerial image accurately, and it has advantages in restraining small ground displacement.

Key words: aerial image     optical flow field     backward pyramid     central projection     down sample    

光流场(optical flow field)是空间运动目标速度场在二维图像平面的投影[]。由于光流场能够反映出图像的变化,为观察者提供目标的运动信息和几何结构信息,所以其在摄影测量与遥感领域得到越来越多的关注。文献[-]利用光流场进行图像变化检测分析;文献[-]提出用光流向量与图像特征相结合的低空视频运动车辆检测方法;文献[]利用光流的运动信息描述地物变化,设计高分辨率遥感影像土地利用与土地覆盖变化的信息自动获取方法;文献[]则根据光流运动向量能够反映出影像间不同物体的变化,实现车载影像序列的全景匹配。

为寻求全局最优解及提高算法效率,目前多是将金字塔结构嵌入光流的数值计算过程,其核心在于通过降采样构造出图像的多个比例尺空间,然后由小比例尺到大比例尺以传递的方式计算光流场[-]。当光流场算法用于近景场景时,可以回避图像的几何成像过程,通常是以原始图像为基础的等比降采样方式来构建图像金字塔。然而,航空图像是在距离地物较远处获得,直接采用等比图像金字塔缺少降采样的理论依据,即地面目标位移量与光流向量之间的定量关系,进而会导致地面目标移动不能有效地在光流场中反映的问题。以中心投影成像模型为基础,本文通过建立成像大小与航高之间的关系来描述降采样比例因子,提出适用于航空图像的逆向金字塔结构,使得光流场能够定量地反映地面目标运动变化。

1 逆向金字塔

图像金字塔是一系列以金字塔形状排列的分辨率逐步降低的图像集合,金字塔的底部是原始图像的高分辨率表示,而顶部是低分辨率的近似[-]。当向金字塔的上层移动时,尺寸和分辨率降低。在不考虑图像的几何成像过程时,图像金字塔可依据分辨率因子γγf0γf1γf2→…→γfn形式对原始图像降采样并形成n+1层金字塔,此处,建立过程是由下至上的,并且分辨率是逐步减少的,称这种方式为正向金字塔(forward pyramid),如所示。根据中心投影模型描述地物目标的物方(object side)、像方(image side)成像关系,以金字塔结构能够有效地反映物方设定的最小位移为条件,首先需要定量地得出金字塔中最小尺寸图像的降采样因子,进而根据等比关系确定中间层图像分辨率。由于在这种金字塔的构建过程中需要首先确定顶层图像的分辨率,即γb0γbnγb1→…→γbn-1,所以被称为逆向金字塔(backward pyramid),如所示。

图 1 结合中心投影描述的逆向金字塔构建Fig. 1 Construction of backward pyramid using central projection


1.1 降采样因子的中心投影描述

航空相片是地面经过中心投影后在承影面的构象,即通过曝光瞬间将收集到的地物反射光线直接在感光胶片上感光,得到与地面地物亮度一致的正像相片的过程。如所示,f为焦距,H为航高,S是投影中心,地面上的线段aobo经过中心投影后的构象是线段aibi。根据中心投影模型,则物方、像方具有如下的成像关系

 (1)

设地面某点在前后两时刻的位置分别为ao、a′o,依据式(1),则该点在像方的位置分别为ai、a′i。相片成像是以像素(pixel)为单位并且光流向量由像素点移动构成,因此,光流向量在像方的最小长度应大于1。式(1)中,置aibi的长度值大于1,则有式(2)

 (2)

式(2)说明在焦距为f、航高为H的情况之下,理论上像方所能分辨的物方最小位移大小为H/f。更进一步,由式(2)可知,地面目标的位移量在航向或侧向方向的投影值大于H/f时,其在图像上才能有大于1个像素的反映,即可得到光流向量。

通常,将光流应用于某类地物目标,因此,物方位移植在一定范围之内,需要确定光流向量所能区分的位移下限。与此同时,要求所对应的像方位移不能过小。当像方位移过小时,一是光流计算模型会快速收敛,并认为没有变化发生,二是环境光变化会与像方微小位移相互混淆,得到的光流向量不便于观察与分析。为此,在原始图像中由物方单位位移do与式(1)可得所对应的像方单位位移值di如下

 (3)

设物方最小可分辨位移为λ,则有物方位移比为

 (4)

金字塔中图像是原始图像的降采样结果,因此,图像所对应的物方位移比c0=αc0,0 < α < 1,则式(4)变为

 (5)

所示,式(5)的物理意义是,相对于原始图像,当图像的物方位移比为αc0时,相当于焦距减小为αf,或者航高H增大为H/α,即图像成像的分辨率大小为原始图像的α2倍,如果置原始图像为金字塔底层,则顶层图像的边长应降采样为原始图像边长的α倍。

需要金字塔中各层图像均能够识别出物方最小可分辨位移λ,即可用式(6)来确定α

 (6)

α>1/c0α越大,降采样图像越接近于原始图像;α越小,则降采样图像的分辨率越小即尺寸越小。取α的下界1/c0以建立金字塔顶层图像,则其最小降采样分辨率因子γmin

 (7)

式中,ε为小的正数,即可用γmin得到图像金字塔中具有最小分辨率的顶层图像,并且地面上大于λ的位移所构成的光流可由顶层图像计算得出。

1.2 逆向金字塔构建

根据γmin得到金字塔顶层图像大小后,即可依据等比方式计算金字塔中间层图像的降采样因子γ,以w表示原始图像的宽度,则有如下关系

 (8)

式中,n为中间层图像数量,如果置原始相片为金字塔的底层,则n+1表示金字塔的层数。以3层金字塔为例,则n为2,即有

 (9)

确定采样因子后即可建立金字塔,金字塔构建主要包括高斯滤波和降采样。首先采用高斯滤波作用于原始图像以消除噪声,降低异质点影响,然后通过降采样为金字塔的每一层获取图像数据。

高斯滤波属于线性平滑滤波,常被用于图像去噪,其实质是对图像进行加权平均的过程[-]。定义滤波器gfilter,根据正态分布与3σ原则可知,位于当前像素点3σ个像素外的像素点不会对当前像素点产生影响[],则设置滤波器宽度k=3σ×2+1

 (10)

式中,i表示滤波器中像素的位置;di表示其对应像素点与当前像素点的距离;为避免图像过度平滑,σ通常设置为1。高斯滤波有两种作用方式,一是采用滤波模板与图像作卷积,另一种是通过傅里叶变换实现。σ为1时,模板大小为7×7,根据高斯函数的可分离性,可采用两个方向的分离滤波器进行叠加,即把二维窗口卷积分离为两次一维卷积运算。

在降采样过程中,亚像素(subpixel)值的求取可通过图像插值进行,常用的图像插值方式有双线性插值[]和双三次插值[]。以p表示当前像素点的像素值,p1p2p3p4表示当前像素点的四邻域像素点(方位顺序为左上、左下、右上、右下)的像素值,x、y表示当前像素点的坐标,[·]表示取整数,则有

 (11)

双线性插值计算公式如下

 (12)

双三次插值采样需要提供其相邻的16个像素点的像素值,其获得的图像具有相对更好的平滑性,其插值公式为

 (13)

式中,aij是插值系数,可以通过对式(13)求偏导数之后代入相邻像素点的像素值解出。

逆向高斯金字塔构建过程为:首先依据式(4)与式(7)确定金字塔顶层图像的降采样因子γmin,并根据γmin完成金字塔顶层图像的采样;然后用式(8)由γmin计算中间层等比降采样因子γ;当γ的值确定后以原始图像为基础,分别以γ1γ2、…、γn-1为降采样因子完成中间层图像的采样。在采样之前需要先对原始图像进行高斯滤波,然后通过图像插值即可获取降采样图像中每一像素点的像素值。

2 试验与分析2.1 光流场计算过程

航空图像光流场的实质是计算图像间同名像素点的偏移向量。首先建立两帧图像的逆向金字塔,形式化为式(14)

 (14)

式中,Ii为逆向金字塔中的第i层,I0为底层,即原始图像,而In为顶层。

将逆向金字塔嵌入HS(Horn-Schunck)光流场算法[],描述如下:

输入:图像I1、图像I2,物方最小可分辨位移值λ

输出:光流向量。

(1) 根据λ分别构建I1I2的逆向金字塔BP1与BP2

(2) 假设各像素点均未发生位移,设顶层图像中各像素点的光流向量初始值为0,即水平、垂直分量为0,u=0,v=0。

(3) 计算金字塔第i层的光流向量,每个像素点光流分量的求解通过雅克比迭代法得到,公式如下

 (15)

式中,k表示迭代次数;β为平滑系数。

(a) 用有限差分法计算Ii2在x和y方向的梯度图像IxIy,Ii2∈BP2

(b) 计算Ii1Ii2在时域上的差值It,Ii1∈BP1Ii2∈BP2

(c) 用3×3模板,计算每个像素点光流向量的局部平均值uv

(d) 由式(15)计算每个像素点的光流向量。

(e) 判断是否满足迭代收敛条件,如满足转至步骤(4),否则,重复(c)-(e)。

(4) 光流的由顶层至底层传递计算。

(a) 将步骤(3)中解出的ui、vi按金字塔采样因子进行层间扩大,计算如下式

 (16)

(b) i=i-1,判断i层图像和原始图像的关系,当i>0时,以u、v作为第i层光流初值,重复步骤(3)-(4);当i=0时,以u、v作为第i层光流初值,重复步骤(3)。

(5) 输出像素点光流向量。

(6) 算法结束。

2.2 逆向金字塔作用分析

试验地点为云南省曲靖市罗平县,试验区域面积为2 km2。航拍相机为PHASE-ONE IXU-R 1000,镜头焦距为50 mm,相对航高1087 m,图像大小为11 608×8708像素,地面分辨率为0.1 m/像素。采用连续曝光方式获取多张图像,曝光时间间隔为2 s。经过内业处理后得到正摄图像,选取前后时刻相同的图像区域进行光流场计算。分别采用逆向金字塔与正向金字塔,对地面目标大位移、地面目标小位移两种情况的光流场计算进行对比分析如下。


2.2.1 地面目标大位移对比试验

λ为11.1 m,即光流向量可以反映出地面目标11.1 m及以上位移大小的变化。因为曝光时间间隔为2 s,所以对于车辆目标来说,相当于如果其行驶速度大于20 km/h,即可以计算出光流。设ε等于0.001,根据式(4)与式(7),得γmin为0.01。由于航空图像分辨率较高,设置金字塔为5层,由式(9)得γb4=γmin=0.01、γb1=0.316、γb2=0.1、γb3=0.032,用γ1-γ4降采样因子构建逆向金字塔。通常正向金字塔是按0.5倍的方式进行图像降采样[--],得出各图层的采样比率为γf1=0.5、γf2=0.25、γf3=0.125、γf4=0.062 5。原始图像如所示,逆向金字塔与正向金字塔的光流计算结果如所示。

图 2 地面目标大位移光流计算对比Fig. 2 Comparison of optical flow computation for ground target with large displacement


原始图像中包含对向行驶的两辆汽车,速度均大于20 km/h,由于γf4>γb4,所以在几何成像过程上,正向金字塔比逆向金字塔具有更小的地面目标位移分辨率。因此,逆、正向金字塔均能够计算得到汽车位移的光流向量,如中的光流线段所示。在γf4>γb4情况之下,逆、正向金字塔光流计算的差异主要表现在抑制地面目标微小位移。产生微小位移的原因主要有两方面构成,一是风会造成树木等地面目标摆动并在图像上产生位移,二是环境光照的变化会在以像素点为单位的光流计算过程中产生位移。本文算例中,环境光照无变化,主要是以风造成的树木枝叶摆动位移为主,如所示。经统计,非车辆位移在原始图像中的光流表现为,光流向量最小长度3像素,最大长度5像素,平均长度3.5像素,这说明当地面微小位移变化能够被正向金字塔顶层图像的像素值所反映。与此相反,在逆向金字塔中,γb4由几何成像过程严格计算得出,其基础是以反映大位移λ为条件,由于γmin仅为0.01,经过高斯平滑与插值过程使得原始图像中的微小位移被充分过滤掉,在顶层图像中没有反映,如所示。逆向金字塔在地面目标大位移情况之下的表现是优于正向金字塔的,其能够有效地规避地面微小位移的影响,更便于后续分析与处理。


2.2.2 地面目标小位移对比试验

λ为0.5 m,即光流向量可以反映出地面目标0.5 m及以上位移大小的变化。因为曝光时间间隔为2 s,所以对于车辆目标来说,相当于如果其行驶速度大于0.9 km/h,即可以计算出光流。根据式(4)与式(7),得γmin为0.2。同样设置金字塔为5层,得γb4=γmin=0.2、γb1=0.669、γb2=0.447、γb3=0.299,用γ14降采样因子构建逆向金字塔。用降采样比率0.5建立正向金字塔,即γf1=0.5、γf2=0.25、γf3=0.125、γf4=0.062 5。分别用逆向金字塔与正向金字塔进行光流计算,结果如所示。

图 3 地面目标小位移光流计算对比Fig. 3 Comparison of optical flow computation for ground target with small displacement


原始图像是位于清水江边的某处煤炭转运站,货车正处于装煤的小位移位置调整中,原始图像如所示。逆向金字塔计算结果如所示。经统计,光流向量最小长度为7像素,最大长度为11像素,平均长度为8.7像素,光流向量可以正确地反映发生小位移变化的3辆货车。与此相反,正向金字塔并未计算出光流。由于γf4为0.062 5,由中心投影模型可知,能够被正向金字塔顶层图像所反映的地面目标最小位移为1.6 m,因为货车的最大位移仅为1.1 m,因此,理论分析与试验结果得到相互印证。逆向金字塔在地面目标小位移情况之下的表现同样是优于正向金字塔的,其能够准确地生成地面目标小位移的光流向量,更有利于变化检测分析。

需要说明的是,分别用双线性插值与双三次插值进行图像降采样,在本文试验中并未表现出明显差异,从计算效率上考虑,采用双线性插值为宜。

3 结论

用航空图像计算光流场时,首先需要解决的问题是降采样因子的确定,然而,目前仍然缺少定量依据。本文的创新之处是,以中心投影几何成像过程为基础定量地得到降采样因子,提出了一种逆向金字塔结构,对比试验结果表明,其在精确性与鲁棒性方面具有优势。此外,逆向金字塔建立过程简单,已知条件为航空图像地面分辨率。


【引文格式】李佳田,李显凯,李应芸,等。航空图像光流场的逆向金字塔计算方法[J]. 测绘学报,2016,45(9):1059-1064.DOI: 10.11947/j.AGCS.2016.20150367


更多精彩内容:

学术前沿|葛茂荣:GNSS Precise Orbit Determination and Clock Estimation


论文推荐|张永红:京津冀地区1992—2014年三阶段地面沉降InSAR监测


论文推荐|张双成:GNSS-MR技术用于潮位变化监测分析


论文推荐|陈良:北斗/GPS实时精密卫星钟差融合解算模型及精度分析


论文推荐|马志伟:利用Abel-Poisson径向基函数模型化局部重力场


论文推荐|姚宜斌:基于DREAMNET的GPS/BDS/GLONASS多系统网络RTK定位性能分析


论文推荐|宁津生院士:基于卫星加速度恢复地球重力场的去相关滤波法


论文推荐|申二华:圆扫描式机载激光测深系统检校模型及仿真分析




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存