查看原文
其他

目标检测 | 基于统计自适应线性回归的目标尺寸预测

Edison_G 计算机视觉研究院 2022-12-03

计算机视觉研究院专栏

作者:Edison_G

YOLOv2和YOLOv3是典型的基于深度学习的目标检测算法,它们使用统计自适应指数回归模型设计了网络的最后一层来预测目标的尺寸大小。


长按扫描二维码关注我们
一、简要

今天分享的是研究者提出了基于统计自适应线性回归的目标尺寸预测方法。YOLOv2和YOLOv3是典型的基于深度学习的对象检测算法,它们使用统计自适应指数回归模型设计了网络的最后一层来预测对象的尺寸大小。

然而,由于指数函数的性质,指数回归模型可以将损失函数的导数传播到网络中的所有参数中。研究者提出了统计自适应线性回归层来缓解指数回归模型的梯度爆炸问题。所提出的统计自适应线性回归模型用于网络的最后一层来预测从训练数据集的统计数据估计目标的尺寸大小。研究者新设计了基于YOLOv3tiny网络,它在UFPR-ALPR数据集上比YOLOv3有更高的性能。

二、背景
主要这个上韩文论文,导致本人阅读过程比较艰难,所以今天就简单介绍些整体框架思想,有兴趣的同学可以进一步阅读论文,深入了解!

今天我们就不介绍传统的检测网络了,因为我们”计算机视觉研究院“之前分享了太多的目标检测类干货及实践,想入门级进一步熟知请查看历史分享。部分分享见下链接:

 往期推荐 

🔗

三、框架分析

上图是YOLOv2 and YOLOv3的后处理过程。


所提的方法使用学习数据集中的可估计统计数据来预测目标的宽度和高度,这与YOLOv2和YOLOv3相同。估计学习数据集统计值的过程如下: 根据学习数据集中存在目标的宽度和高度值,将目标分类为K个簇,然后估计每个簇中目标的宽度和高度值各自的算术均值。 

研究者提出的统计值自适应线性回归模型进一步估计了各簇中目标的宽度和高度值的标准差。然后,设计了通过网络预测的目标的宽度和高度值的均值和标准差遵循学习数据集中存在的目标宽度和高度值的均值和标准差。利用学习数据集中的可估计统计值对预测值的统计值进行约束,可以使网络在学习阶段更加稳定,提高检测性能。

现有的YOLOv2, 随着对YOLOv3中用于目标大小预测的统计值自适应指数回归模型的修改,研究者重新定义了用于学习所提出的目标大小预测的统计值自适应线性回归模型的损失函数,所提出的损失函数如上。

四、实验

UFPR-ALPR dataset

The network architecture of newly designed YOLOv3 tiny for experiments

The comparison on UFPR-ALPR test dataset



© THE END 

转载请联系本公众号获得授权


计算机视觉研究院学习群等你加入!


计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

扫码关注

计算机视觉研究院

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

源码下载| 回复“OSP”获取下载

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存