查看原文
其他

【连载】openmv之色块追踪算法的改善

杰杰 物联网IoT开发 2021-01-31


推荐一首好歌,杰杰就是听着这首歌更新的

大家晚上好,我是杰杰。

实在不好意思,最近比较忙,之前说的连载现在才更新出来。


从上一篇openmv的学习中,我们可以很简单运用micropython在openmv上做我们想做的事情。

Python这个东西用起来是很简单的,,下面来说说改善色块追踪的算法

先做个改善前的分析吧:

改善前:


API:find_blobs


  • thresholds是颜色的阈值。这个参数是一个列表,可以包含多个颜色。在返回的色块对象blob可以调用code方法,来判断是什么颜色的色块。

  • roi是“感兴趣区”。

  • x_stride 就是查找的色块的x方向上最小宽度的像素,默认为2。

  • y_stride 就是查找的色块的y方向上最小宽度的像素,默认为1。

  • area_threshold 面积阈值,如果色块被框起来的面积小于这个值,会被过滤掉。

  • pixels_threshold 像素个数阈值,如果色块像素数量小于这个值,会被过滤掉

  • merge 合并,如果设置为True,那么合并所有重叠的blob为一个。 注意:这会合并所有的blob,无论是什么颜色的。如果你想混淆多种颜色的blob,只需要分别调用不同颜色阈值的find_blobs。


blobs = img.find_blobs([red])

find_blobs对象返回的是多个blob的列表。

而一个blobs列表里包含很多blob对象,blobs对象就是色块,每个blobs对象包含一个色块的信息。


blob有多个方法:

  • blob.rect() 返回这个色块的外框——矩形元组(x, y, w, h),可以直接在image.draw_rectangle中使用。

  • blob.x() 返回色块的外框的x坐标(int),也可以通过blob[0]来获取。

  • blob.y() 返回色块的外框的y坐标(int),也可以通过blob[1]来获取。

  • blob.w() 返回色块的外框的宽度w(int),也可以通过blob[2]来获取。

  • blob.h() 返回色块的外框的高度h(int),也可以通过blob[3]来获取。

  • blob.pixels() 返回色块的像素数量(int),也可以通过blob[4]来获取。

  • blob.cx() 返回色块的外框的中心x坐标(int),也可以通过blob[5]来获取。

  • blob.cy() 返回色块的外框的中心y坐标(int),也可以通过blob[6]来获取。

  • blob.rotation() 返回色块的旋转角度(单位为弧度)(float)。如果色块类似一个铅笔,那么这个值为0~180°。如果色块是一个圆,那么这个值是无用的。如果色块完全没有对称性,那么你会得到0~360°,也可以通过blob[7]来获取。

  • blob.code() 返回一个16bit数字,每一个bit会对应每一个阈值。

    (上面的知识在openmv的官网上都有说明)

下面是说说调用find_blobs来做色块的追踪的原理

它是全幅图像扫描,它有优点也有缺点

先说说优点吧:信息全面,全幅图像的搜索,把所有色块都搜索进来了

但是缺点也不少:①:运算的速度,是很慢的,有些地方我们根本不需要扫描它。

②:色块的数量,很多时候,会有很多延时差不多的色块过来干扰,导致追踪失败。

源码:


import sensor, image, timered_threshold_01 = (0, 35, 0, 50, -10, 40)
sensor.reset() sensor.set_pixformat(sensor.RGB565)sensor.set_framesize(sensor.QVGA) sensor.skip_frames(10) sensor.set_auto_whitebal(False)


clock = time.clock()
while(True):    clock.tick()    img = sensor.snapshot()    blobs = img.find_blobs([red_threshold_01],
                            area_threshold=150)
   if blobs:    #如果找到了目标颜色        print(blobs)        for b in blobs:        #迭代找到的目标颜色区域            # Draw a rect around the blob.            img.draw_rectangle(b[0:4]) # rect            #用矩形标记出目标颜色区域            img.draw_cross(b[5], b[6]) # cx, cy            #在目标颜色区域的中心画十字形标记    print(clock.fps())





效果图:

运算速度:


从拍摄完到扫描完,每秒只能处理二十多帧图像,而且是简单的处理。

虽然脱机运行速度可以快一倍。但是还是比较慢的。

肯定要改进啊。


以下是改进扫描算法的思想:

①:首先做一次全幅图像的扫描,找到我们需要的色块。

②:我们得到色块的信息:如色块的长、宽、及色块的位置

③:我们只扫描色块周围的区域(ROI)

④:假设在新的ROI找不到我们需要的色块,就重新来。

这个方法类似于飞思卡尔的边缘检测。

其实这个改进是非常简单的。因为我们需要的东西在microPython中全部都有。

只需要拿到find_blobs的返回的东西就好啦。

算法示意图


绿色的是我们追踪的色块,

而红色的框是我们第一次全局扫描得到的东西

那么我们只需在红色的框之外做一次扫描就能得到绿色块啦

实现的源码

import sensor, image, time#red_threshold_01 = (45, 100, -60, 80, 34, 91)red_threshold_01 = (21, 29, -72, 6, -11, 17)sensor.reset() sensor.set_pixformat(sensor.RGB565)sensor.set_framesize(sensor.QVGA) sensor.skip_frames(20) sensor.set_auto_whitebal(False)#关闭白平衡。白平衡是默认开启的,在颜色识别中,需要关闭白平衡clock = time.clock()
img = sensor.snapshot()blobs = img.find_blobs([red_threshold_01],
area_threshold=150)last_blobs = blobs
while(True):    clock.tick()    img = sensor.snapshot()    if last_blobs:         for b in blobs:            x1 = b[0]-7            y1 = b[1]-7            w1 = b[2]+12            h1 = b[3]+12            #print(b.cx(),b.cy())         roi2 = (x1,y1,w1,h1)         print(roi2)         blobs = img.find_blobs([red_threshold_01],
                                   roi = roi2,
                                   area_threshold=1000)
        last_blobs = blobs    else:        blobs = img.find_blobs([red_threshold_01],
                                  area_threshold=1000)
       last_blobs = blobs    if last_blobs:        #如果找到了目标颜色        #  print(blobs)        for b in last_blobs:#迭代找到的目标颜色区域            img.draw_rectangle(b[0:4])            img.draw_cross(b[5], b[6])    print("帧率 : ",clock.fps())

改善后的帧率的确是快了不少的:基本能快一倍以上,当然,物体在图片越大,处理的速度会越慢。

帧率达到了  45  ,并且,对于运动中的物体,也能很好的追踪出来,减少无关物体的干扰。


按照这个思想,我们还能把这个物体分成四条边来扫描:

那么是不是只需要扫描到这个物体的四条边,并且证明四条边的点都有重合,那么,我们就能知道这个物体是一个整体从而得到物体的位置。。。。

当然,这只是想法。对于程序员任何的功能想法的实现都需要代码的实现,这代码我就不实现了,有兴趣的可以试试。。。


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存