海洋探测▏基于前视声纳的成像与多目标特征提取
导读:本文针对水下目标图像的几何特性,提出了一种基于弦中点的改进Hough变换椭圆检测方法,实现了水下多目标的特征提取。单波束机械扫描前视声纳的图像数据为二维极坐标形式,采用波束内插方法和坐标变换方法生成图像,并对其进行图像预处理和轮廓跟踪,据此再进行多目标特征提取。通过水池实验结果表明,该方法对于水下多目标的特征描述更简明准确,为多目标识别与定位提供了有用信息。
一、引言
作为水下机器人的眼睛和耳目,视觉系统具有极其重要的地位和作用。通过视觉系统,机器人才能够快速获取水下周围环境信息,为其运动和进行水下作业提供引导。在复杂多变的水下环境下,声波是迄今为止唯一可以进行远程信息传输的载体,故声纳成为一种较为理想的用于水下探测与环境感知的仪器。目前技术比较成熟、使用也较多的成像声纳为侧扫声纳和扇扫声纳(前视声纳)。国际上已经用在水下机器人上的扇扫声纳主要分三大类:单波束机械扫描声纳,多波束预成电子扫描声纳和三维成像声纳。本文基于小型ROV构建水下作业实验平台,采用单波束机械扫描声纳作为水声探测设备进行声探测方面的研究。
目标的特征是目标物体区别于其他物体的原始特性或根本属性,特征提取的基本任务就是研究如何从众多特征中求出那些对分类识别最有效的特征。本课题针对前视声纳的特性和水下目标的几何特性,对于声纳图像,椭圆特征能够较好地反映目标物的特征,故提出了一种基于弦中点的Hough变换椭圆检测方法对水下多目标进行特征提取,为多目标定位提供了有用信息。
二、声纳图像获取
本课题基于小型ROV(OUTLAND1000)构建水下作业实验平台,如图1所示为其实体图。在其首部装配有MicronDST超紧密线性调频脉冲数字声纳作为水下探测的工具,如图2所示为该声纳实体图。它是一个单波束机械扫描声纳,它由机械旋转的单波束形成全方位或某固定扇面内的扫描来完成探测,体积小,质量轻,结构简单,价格便宜,非常适用于微小型机器人的装配,并且和传统脉冲相比,它采用了线性调频脉冲技术,显著地提高了分辨率。
图1 OUTLAND 1000实体图
图2 声纳实体图
⒈ 声纳数据生成
声纳总是从正前方开始扫描,每当发送一次指令给声纳,它的步进电动机就会顺时针或逆时针旋转一个步进角度Δθ,并在当前方位发射一个探测波束(Ping),在每个探测波束上设置n个采样点(Bin),那么在此方位可以得到n个回波数据。若需要探测某个固定区域,则步进电动机逐步旋转使探测波束扫描整个区域。
探测波束发射时,没有物体存在的方向上的回波强度很弱甚至接收不到回波信号,而存在物体的方向上可以接收到较强的回波,波动的位置和强度表明了物体的位置和特性。声纳接收器将接收范围在0~80dB的回波信号,有两个重要的参数,一个是采样窗口的最低阈值ADLow,增大该值可以使声纳显示器敏感性降低,并且过滤掉背景噪声和接收器自身噪声;一个是采样窗口的范围ADSpan,将在此范围内的强度转换成[0,255]的灰度范围,有利于灰度图像的生成。低于最低阈值ADLow的强度转换为0,高于最大阈值范围ADSpan的强度均转换为255。
⒉ 声纳图像生成
通用显示器的的扫描方式为逐行扫描或隔行扫描,扫描点的定位为直角坐标方式(x,y),而声纳回波数据的定位为距离-角度的二维极坐标方式(p,θ)。要将其显示在显示器上,不可避免地会遇到直角坐标与极坐标转换的问题,本文采用将直角坐标的(x,y)转换成极坐标的(p,θ)进行坐标变换,这样生成的图像上的像素点都能够与一个数据相对应,不会有空隔产生。
由于在扫描宽度内形成的波束数量有限,通过数据采集得到的声纳距离-角度维的回波信息太少,这样显示出来的图像分辨率很低,声纳系统中相邻多个波束间有一定的覆盖宽度,因此当目标方位对准某一波束时,相邻波束仍有一定的输出。在这种情况下,通过相邻波束的输出幅度可以内插出中间多个波束的输出值,从而使图像变得柔和、清晰,使目标分辨率和定位精度都得到较大的提高。
二次插值就是利用通过三点(x0,y0),(x1,y1),(x2,y2)的抛物线y=p(x)来近似所考察的曲线y=f(x),这类插值亦称为抛物线插值。本文采用每两个波束间内插3个波束。如图3所示,为先在每两个波束之间插3个波束,再进行坐标变换所得到的图像。
图3 生成的声纳图像
三、声纳图像预处理
水声信道和水下环境复杂多变,声波在传播过程中存在衰减、混响、散射的干扰,以及多径现象和旁瓣干扰等,生成的声纳图像分辨率低、干扰严重,如图4所示为声纳的原始图像。该图像对比度差,分辨率低,干扰强,边缘恶化,这将影响声纳图像的分析,故图像预处理显得尤为重要。预处理常采用几种方法的组合,并且往往具有针对性,要找到适合的方法常常需要进行多次实验。本文中采用的预处理方法有:灰度变换,滤波,阈值分割,形态学处理。
图4 声纳的原始图像
⒈ 图像的灰度变换、滤波及阈值分割
灰度变换主要针对独立的像素点进行处理,通过改变原始图像数据占据的灰度范围而使图像在视觉上得到良好的改观。本文根据声纳图像的像素值在0~155之间,采用分段线性变换拉伸灰度区间至0~255。
滤波的目的是为了去除噪声,本文采用3×3中值滤波,它在去除噪声的同时,不让图像边缘模糊。
声纳图像中目标物体的反射强度较背景要高,故可以通过阈值分割将灰度数字图像分割为只用0和1表示的二值图像,0表示背景,1表示目标物,本文采用一种快速二维Otsu自适应阈值分割法对图像进行分割,给定图像的灰度级为[1,2,…,L],fij(x,y)为像素值为i,三邻域平均值为j的分割后的像素值,ts为最优阈值。如图5所示为阈值分割示意图,判别式如下:
图5 阈值分割示意图
⒉ 图像形态学处理
形态学运算以腐蚀和膨胀这两种基本运算为基础。腐蚀的作用是消除物体边界点,使边界点向内部收缩的过程。膨胀的作用与腐蚀正好相反,它是对二值图像边界点进行扩充,将与物体接触的所有背景点合并到该物体中,使边界向外部扩张。二值化后的声纳图像充满空洞和部分噪声干扰,所以需要利用形态学的特殊功能进行处理。本文采用的方法是图像闭运算,它是先膨胀后腐蚀的过程,其功能是用来填充物体内细小空洞,连接邻近物体,平滑边界,同时不明显改变其面积。
四、目标特征提取
⒈ 轮廓跟踪
区域标记算法用于二值图像中标记不同的区域,是轮廓跟踪的关键。本文中,像素0代表目标和像素255代表背景,区域标记算法的思想为:对于一个给定的黑色像素,其八邻域中的黑色像素为同一区域,标记相同的符号。
在区域标记的基础上,本文采用基于八邻域的外边界跟踪算法,它能够通过前一个轮廓像素判断出轮廓方向,并且只需判断5个候选像素就能够找到下一个轮廓像素。通过该方法能够目标物的轮廓及目标物的数量。
⒉ 椭圆特征提取
Hough变换是一种非常有效的从图像中提取特定几何图形(如直线、圆和椭圆等)及其特征的方法,它是通过数据的积累来提取特征的,其主要特点是对局部信息的缺损不敏感和对随机噪声的鲁棒性。根据所得到的目标边缘的特性,本文采用Hough变换的椭圆检测,并提出了一种基于弦中点的改进Hough变换椭圆检测方法提取多目标的特征。椭圆方程为:
其中有5个自由参数,a、b分别为椭圆的长半轴与短半轴,x、y分别为椭圆中心的横坐标值与纵坐标值,θ为长半轴与横坐标的夹角。它的参数空间是5维的,若5个参数一次性求出,计算量很大。故分两步求出。
第一步:任意过椭圆中心的直线交于该椭圆上两点,这两点所连线段的中点就是椭圆中心。据此求出可能的椭圆中心。
第二步:椭圆上两点连线最长的即为长轴,连线最短的即为短轴。据此求出可能的长半轴a、短半轴b和θ。最后判断是否为真实椭圆。具体的实现步骤如下:
①构造边缘点集D,根据边缘点数确定循环次数kmax。
②在边缘点集中随机选取两点d1、d2,若与已随机选取的两点重复时,则重新随机选取两点。
③计算这两点的中点坐标(midpoint_x,midpoint_y),若与已得到的中点坐标不同,则创建一个新的中点点集,保存该中点坐标,并将其count置1,转步骤②,否则转步骤④。
④该中点坐标与已得到的中点坐标相同,则将其count加1,若count>Nt1(阈值,这里取5),则继续,否则转步骤②。
⑤该中点为候选的椭圆圆心,判断该圆心与已得到的椭圆圆心(xc,yc)是否满足|xc﹣midpoint_x|<10&&|yc﹣midpoint_y|<10,若满足,说明该圆心不是真实的椭圆圆心,将其count取﹣1000,转步骤②,否则继续。
⑥遍历所有边缘点,计算相对于该中点对称的边缘点,并计算这两边缘点之间的距离,得到最大距离max_temp以及最大距离的这两点所在直线的斜率,最小距离min_temp以及最小距离的这两点所在的直线的斜率。
⑦求长半轴的倾斜角theta1和短半轴的倾斜角theta2,若||theta1|+|theta2|-PI/2|>10°,则不是椭圆,将其count取﹣1000,转步骤②,否则继续。
⑧分别计算根据长半轴和短半轴的该候选椭圆的所有像素坐标,与原图像上的像素坐标相比,计算重合的点数nCount1和nCount2,若nCount1≥nCount2&&nCount2>Nt2(阈值,根据椭圆的大小自适应地定义),则为真实椭圆,转步骤⑨。若nCount1<nCount2&&nCount1>Nt2,则为真实椭圆,转步骤⑩。否则为虚假椭圆,将其count取﹣1000,转步骤②。
⑨将其count取﹣1000,依据长半轴画出真实的椭圆。
⑩将其count取﹣1000,依据短半轴画出真实的椭圆。
⑪判断循环次数是否已达到kmax,若没有达到,则转步骤②,否则结束程序。
该方法对于不重叠的目标物可以快速较精确地提取出椭圆特征。
五、实验结果及分析
本次实验在船模实验水池中进行,采用的目标物如图6所示。
图6 目标物
上图中从左至右依次为目标1~目标4,图7为船池实验图片
图7 船池实验
基于单波束机械扫描前视声纳Micron DST的特性,对不同形状目标物在不同的距离处进行了大量实验,得到的声纳图像虽不能反映出目标物的形状,但能够明确确定目标物的个数及位置,在此列出图8所示三组图像处理结果。从第一组闭运算处理后的图像中可以看出,中间一个目标物的周围有干扰,通过轮廓跟踪算法可以排除这种干扰,最终确定为三个目标物。
图8 实验处理图像
由大量实验的处理图像可知,声纳图像中的目标物均表现为类似椭圆形状,椭圆的个数即为目标物的个数,椭圆中心即为目标物的中心位置,故椭圆特征能够较好地反映出目标物的特征,从而确定目标物的个数及位置。由这些特征提取结果可知,对于多目标,整套方法能够较好地提取出各个目标的椭圆特征,确定目标物的个数及位置,从而达到多目标的特征提取,为多目标识别与定位提供有用的信息。
六、结束语
通过搭载在ROV(OUTLAND 1000)上的单波束机械扫描前视声纳Micron DST作为水下探测工具对水下多目标进行探测,由声纳获取的二维极坐标形式的图像数据通过波束内插和坐标变换生成图像,对其进行图像预处理,包括灰度变换、滤波和快速二维Otsu自适应阈值分割,再运用轮廓跟踪算法得到声纳图像的目标边缘。针对水下目标的几何特性和声纳特性,对于声纳图像,椭圆特征能够较好地反映目标物的特征,故提出了一种基于弦中点的改进Hough 变换椭圆检测方法对多目标进行椭圆特征提取,椭圆的个数即为目标物的个数,椭圆中心即为目标物的中心位置。通过水池实验及处理结果表明,该方法能够较好地提取出多目标的椭圆特征,确定目标物的个数及位置,从而达到多目标的特征提取,为多目标识别与定位提供有用信息。
■本文作者:吴丽媛 徐国华 余琨,华中科技大学船舶与海洋工程学院。吴丽媛,女,1989出生,硕士研究生,主要从事水下机器人作业控制、图像处理研究;徐国华,男,1965出生,教授,博士生导师,主要从事水下机器人技术、智能控制技术、水下作业技术研究;余琨,女,1987出生,博士生,主要从事水下机器人作业控制、水下拖曳系统研究。本文来源于《计算机工程与应用》,限于文章编辑的方便,对部分内容进行了删节。