查看原文
其他

【综述专栏】目标检测综述整理

在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说,在广袤的知识森林中,系统梳理脉络,才能更好地把握趋势。为此,我们精选国内外优秀的综述文章,开辟“综述专栏”,敬请关注。

来源:知乎—龟壳

地址:https://zhuanlan.zhihu.com/p/357161337

打包下载:本公众号后台回复【paper74】下载论文


01

综述一
标题:Object Detection in 20 Years: A Survey
文章链接:https://arxiv.org/pdf/1905.05055.pdf
文章介绍:
Abstract:
本文广泛回顾了从20世纪90年代到2019年的400多篇关于目标检测技术发展的论文。许多主题已经在这篇论文中被覆盖,包括历史上的里程碑检测器,检测数据集,度量方法,检测系统的基本构建模块,加速技术,和最新的检测方法。本文还综述了一些重要的检测应用,如行人检测、人脸检测、文本检测等,并对其面临的挑战和近年来的技术改进进行了深入分析。
1. 介绍
本文与其他文章不同之处:
01. 本文广泛回顾了对象检测发展历史的400多篇论文,跨度超过25年。
02. 对关键技术和最新研究进展的深入探索:经过多年的发展,目前最先进的目标检测系统已经集成了“多尺度检测”、“难负例挖掘”、“包围盒回归”等大量技术,本文就读者对上述技术的关注作了深入的分析。
03. 检测加速技术的全面分析:物体检测的加速一直是一个关键但具有挑战性的任务。本文从多个层次全面回顾了近20年来目标检测的加速技术,包括“检测管道”(如级联检测、特征映射共享计算)、“检测骨干”(如网络压缩、轻量级网络设计)和“数值计算”(如积分图像、矢量量化)。
2. 目标检测20年
2.1目标检测路线图
参考:综述:目标检测二十年

目标检测发展路线图

2014年之前->传统的目标检测器:VJ检测器->HOG检测器->DPM
2014年之后->基于深度学习的目标检测器:
双阶段:RCNN->SPPNet->Fast RCNN->Faster RCNN->Feature Pyramid Networks
单阶段:YOLO->SSD->RetinaNet
2.2 目标检测数据集和度量方法
2.2.1 数据集:

1. Pascal VOC:

http://host.robots.ox.ac.uk/pascal/VOC/

2. ILSVRC(The ImageNet Large Scale Visual Recognition Challenge): 

http://image-net.org/challenges/LSVRC/

3. MS-COCO: 
http://cocodataset.org/
4. Open Images: 
https://storage.googleapis.com/openimages/web/index.html
two task: 1)标准对象检测 2)视觉关系检测
2.2.2 度量方法:
目标检测:近年来,最常用的目标检测评价方法是“平均精度(AP)”,最初是在VOC2007中引入的。为了比较所有对象类别的性能,通常使用所有对象类别的平均AP (mAP)作为性能的最终度量标准。
MS-COCO AP不是使用固定的IoU阈值,而是在多个IoU阈值上取0.5(粗定位)到0.95(完美定位)之间的平均值。
3. 检测中的加速技术
在过去的20年里,物体检测领域已经开发出了复杂的加速技术。这些技术大致可以分为三个层次:“检测管道加速”、“检测引擎加速”、“数值计算加速”
4. 目标检测的最新进展

02

综述二
标题:A Survey of Deep Learning-based Object Detection
文章链接:https://arxiv.org/pdf/1907.09408.pdf
文章介绍:
Abstract:
本文首先分析了现有的典型检测模型的方法,并对基准数据集进行了描述。随后,我们系统地全面概述了各种目标检测方法,包括一级和二级检测器。此外,我们列出了传统的和新的应用。分析了目标检测的一些代表性分支。最后,我们讨论了利用这些目标检测方法来构建一个有效和高效的系统的体系结构,并指出了一套发展趋势,以更好地跟随最新的算法和进一步的研究。
1. 介绍:
(1)本文列出了最近提出的非常新颖的解决方案,但忽略了基本的讨论,以便读者更容易看到该领域的前沿。(2)此外,与以往的目标检测研究不同的是,本文系统、全面地回顾了基于深度学习的目标检测方法,最重要的是最新的检测解决方案和一套重要的研究趋势。(3)本次调查的特点是对各个方面进行了深入的分析和讨论,其中许多方面据我们所知是该领域的第一次。
2. 典型基线

(a) 两阶段检测器的基本结构

(b) 单阶段检测器的基本结构
相关双阶段目标检测器和单阶段目标检测器介绍:
https://blog.csdn.net/weixin_43590151/article/details/106948372

03

综述三
标题:Recent Advances in Deep Learning for Object Detection
文章链接:https://arxiv.org/pdf/1908.03673.pdf
文章介绍:
Abstract:
本文对深度学习在视觉目标检测方面的最新进展进行了全面的综述。通过回顾大量最近的相关文献,我们系统地分析了现有的目标检测框架,并将调查分为三个主要部分:(i)检测组件,(ii)学习策略,(iii)应用和基准。
1. 介绍:

(a)“图像分类”只需要为图像指定类别标签;(b)“对象检测”不仅可以预测类别标签,还可以通过边界框对每个对象实例进行定位;(c)“语义分割”旨在预测每个像素的类别标签,而不区分对象实例;(d)“实例分割”是对象检测的一种特殊设置,通过像素级分割掩码来区分不同的对象实例

将基于深度学习的目标检测的各种贡献分为三类:检测组件、学习策略、应用和基准
通用对象检测的两阶段检测框架概述
通用对象检测的单阶段检测框架概述

04

综述四
标题:Imbalance Problems in Object Detection: A Review
文章链接:https://arxiv.org/pdf/1909.00169.pdf
文章介绍:
Abstract:
在本文中,我们提出了一个全面的综述不平衡问题的目标检测。为了系统地分析这些问题,我们引入了两个分类体系;一个用于解决问题,另一个用于提出解决方案。按照问题的分类,我们深入地讨论每个问题,并提出一个统一的但批判性的观点在文献中的解决方案。此外,我们确定了关于现存的不平衡问题的主要未决问题以及以前没有讨论过的不平衡问题。
介绍:
在本文中,我们回顾了深度学习时代的目标检测文献,并识别出8种不同的不平衡问题。我们将这些问题划分为四种主要类型:类失衡、尺度失衡、目标失衡和限制框失衡

05

综述五
标题:Deep Domain Adaptive Object Detection: a Survey(深度域适应目标检测)
作者:Wanyi Li, Peng Wang
单位:中国科学院自动化研究所
链接:https://arxiv.org/abs/2002.06797
本文共梳理了46篇相关文献,由中科院自动化所学者发布。基于深度学习(DL)的目标检测已经取得了很大的进展,这些方法通常假设有大量的带标签的训练数据可用,并且训练和测试数据从相同的分布中提取。然而,这两个假设在实践中并不总是成立的。深域自适应目标检测(DDAOD)作为一种新的学习范式应运而生。本文综述了深域自适应目标检测方法的研究进展。

06

综述六
标题:Foreground-Background Imbalance Problem in Deep Object Detectors: A Review(深度目标检测器中前景-背景不平衡问题综述)
作者:Joya Chen, Tong Xu
单位:中国科学技术大学
链接:https://arxiv.org/abs/2006.09238

本文目的在于学术交流,并不代表本公众号赞同其观点或对其内容真实性负责,版权归原作者所有,如有侵权请告知删除。


“综述专栏”历史文章


更多综述专栏文章,

请点击文章底部“阅读原文”查看



分享、点赞、在看,给个三连击呗!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存