查看原文
其他

基于深度学习目标检测方法一览

极市平台 2021-09-20

The following article is from 中国图象图形学报 Author 赵永强,饶元

加入极市专业CV交流群,与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度 等名校名企视觉开发者互动交流!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~

就在今晚,极市直播第59期:Circle Loss,从统一视角提升深度特征学习能力。本次直播,我们重磅邀请到Circle Loss论文作者之一:来自北京航空航天大学的张宇涵,为我们深度解读这一工作的思路原理以及实现结果。请大家锁定直播时间(6/11晚20:00)。详情戳这里,在极市平台后台回复“59”,即可获取直播链接。

来源|中国图像图形学报
作者|赵永强、饶元、董世鹏、张君毅

目标检测是计算机视觉和模式识别中备受青睐的热点,近年来大量算法相继提出,尤其是深度学习的广泛应用,更是大大提升了目标检测的精确度和效率。但该领域待解决的问题与面临的挑战也随之出现:

1) 如何实现基于主流目标检测算法的性能改进与优化?

2) 如何实现小目标物体的高精度检测?

3) 如何实现多类别物体检测?

4) 如何满足目标检测算法的轻量化需求?

Faster R-CNN(Ren等,2018)

围绕上述问题与挑战,《中国图象图形学报》2020年第4期论文《深度学习目标检测方法综述》对基于深度学习的目标检测算法的研究进展与现状进行分析和综述,详细介绍目标检测的通用数据集和不同算法在主流数据集上的实验结果,并对目标检测领域未来可能的发展方向进行展望。成果来自西安市社会智能与复杂数据处理实验室饶元副教授团队。


论文信息

标题:深度学习目标检测方法综述

作者:赵永强,饶元,董世鹏,张君毅

关键词:目标检测; 深度学习; 小目标; 多类别; 轻量化

全文链接

http://www.cjig.cn/html/jig/2020/4/20200401.htm

引用格式:赵永强,饶元,董世鹏,张君毅. 2020. 深度学习目标检测方法综述. 中国图象图形学报,25(04):0629-0654 [DOI: 10.11834/jig.190307]

论文看点

  • 从双阶段、单阶段目标检测算法的改进与结合的角度对改进与优化主流目标检测算法的方法进行分析;

  • 从骨干网络、增加视觉感受野、特征融合、级联卷积神经网络和模型的训练方式的角度精解提升小目标检测精度方法;

  • 从训练方式和网络结构的角度介绍用于多类别物体检测的方法;

  • 从网络结构的角度分析用于轻量化检测模型的方法。

RFB(receptive field block) Net(Liu等,2018)

常用数据集


不同算法性能比较


关键技术及未来展望

PASCAL VOC 2012


目前的检测效果与人性化的表现之间仍存在巨大差距,基于深度学习的目标检测关键技术,对下一步待解决的问题与未来研究方向进行展望:

1)如何使模型更适应特定场景下的目标检测需求。真实世界的图像的特定的场景和因素为目标检测算法的实际应用提出新的挑战性,需要通过上下文信息、选择性参数共享、数据增强、互补特征融合等各种方法来不断提高模型的性能以适应特定场景下的目标检测需求。

2)如何在先验知识缺失的条件下实现精确的目标检测。由于目标检测的最终任务是利用计算机从一些复杂场景下,快速准确地识别出数千种甚至更多类别中的目标对象或实例,因此,先验知识的丰富程度以及质量的好坏,将直接影响深度网络模型训练的质量。

3)如何获取高性能的骨干网络。目前骨干网络的选择具有很大的随机性,特别是针对不同任务,骨干网络框架体现的性能也存在显著差异,因此目标检测领域中骨干网络的未来核心工作将围绕以下两点展开:提高骨干网络针对不同任务的专一性;提高骨干网络的处理效率。

4)如何获得更加丰富的图像语义信息。 目前的解决方案大致分为以下两类:(1)利用高清表示,通过不同方法获得具有高清表示信息的特征图来提升特征图空间分辨率,从而提高目标检测的精度;(2)利用图像语义理解,通过像素级对象实例的精确分割,获取更加细粒度的图像实例特征,从而实现对图像语义的更深层次的理解。

5)如何提高深度学习模型的可解释性。 模型究竟从数据中学到了哪些知识,从而做出了最终的决策,因此需要不断提高模型的可解释性。

6)如何自动化生成或设计最优的网络架构。如何利用机器学习的方法来自动化地学习和训练出一个最优的网络架构是目前最新的研究热点方向之一。

作者简介

赵永强,1996年生,硕士研究生,主要研究方向为深度学习、计算机视觉和模式识别。

E-mail: yongqiang1210@stu.xjtu.edu.cn

饶元,通信作者,男,副教授,博士生导师,主要研究方向为深度学习、机器学习、计算机视觉。

E-mail: raoyuan@mail.xjtu.edu.cn

董世鹏,男,硕士研究生,主要研究方向为计算机视觉与模式识别。E-mail: 624566671@qq.com

张君毅,男,博士研究生,主要研究方向为深度学习与图像识别。E-mail: zhangjunyi0806@xjtu.edu.cn


推荐阅读



添加极市小助手微信(ID : cv-mart),备注:研究方向-姓名-学校/公司-城市(如:目标检测-小极-北大-深圳),即可申请加入极市技术交流群,更有每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、行业技术交流一起来让思想之光照的更远吧~


△长按添加极市小助手


△长按关注极市平台,获取最新CV干货


觉得有用麻烦给个在看啦~  

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存