编辑推荐 | 深度学习目标检测方法综述
目标检测是计算机视觉和模式识别中备受青睐的热点,近年来大量算法相继提出,尤其是深度学习的广泛应用,更是大大提升了目标检测的精确度和效率。但该领域待解决的问题与面临的挑战也随之出现:
1) 如何实现基于主流目标检测算法的性能改进与优化?
2) 如何实现小目标物体的高精度检测?
3) 如何实现多类别物体检测?
4) 如何满足目标检测算法的轻量化需求?
Faster R-CNN(Ren等,2018)
围绕上述问题与挑战,《中国图象图形学报》2020年第4期论文《深度学习目标检测方法综述》对基于深度学习的目标检测算法的研究进展与现状进行分析和综述,详细介绍目标检测的通用数据集和不同算法在主流数据集上的实验结果,并对目标检测领域未来可能的发展方向进行展望。成果来自西安市社会智能与复杂数据处理实验室饶元副教授团队。
标题:深度学习目标检测方法综述
作者:赵永强,饶元,董世鹏,张君毅
关键词:目标检测; 深度学习; 小目标; 多类别; 轻量化
全文链接:
http://www.cjig.cn/html/jig/2020/4/20200401.htm
引用格式:赵永强,饶元,董世鹏,张君毅. 2020. 深度学习目标检测方法综述. 中国图象图形学报,25(04):0629-0654 [DOI: 10.11834/jig.190307]
从双阶段、单阶段目标检测算法的改进与结合的角度对改进与优化主流目标检测算法的方法进行分析;
从骨干网络、增加视觉感受野、特征融合、级联卷积神经网络和模型的训练方式的角度精解提升小目标检测精度方法;
从训练方式和网络结构的角度介绍用于多类别物体检测的方法;
从网络结构的角度分析用于轻量化检测模型的方法。
RFB(receptive field block) Net(Liu等,2018b)
点击图片下载CSV源数据
点击图片下载CSV源数据
PASCAL VOC 2012
目前的检测效果与人性化的表现之间仍存在巨大差距,基于深度学习的目标检测关键技术,对下一步待解决的问题与未来研究方向进行展望:
1)如何使模型更适应特定场景下的目标检测需求。真实世界的图像的特定的场景和因素为目标检测算法的实际应用提出新的挑战性,需要通过上下文信息、选择性参数共享、数据增强、互补特征融合等各种方法来不断提高模型的性能以适应特定场景下的目标检测需求。
2)如何在先验知识缺失的条件下实现精确的目标检测。由于目标检测的最终任务是利用计算机从一些复杂场景下,快速准确地识别出数千种甚至更多类别中的目标对象或实例,因此,先验知识的丰富程度以及质量的好坏,将直接影响深度网络模型训练的质量。
3)如何获取高性能的骨干网络。目前骨干网络的选择具有很大的随机性,特别是针对不同任务,骨干网络框架体现的性能也存在显著差异,因此目标检测领域中骨干网络的未来核心工作将围绕以下两点展开:提高骨干网络针对不同任务的专一性;提高骨干网络的处理效率。
4)如何获得更加丰富的图像语义信息。目前的解决方案大致分为以下两类:(1)利用高清表示,通过不同方法获得具有高清表示信息的特征图来提升特征图空间分辨率,从而提高目标检测的精度;(2)利用图像语义理解,通过像素级对象实例的精确分割,获取更加细粒度的图像实例特征,从而实现对图像语义的更深层次的理解。
5)如何提高深度学习模型的可解释性。模型究竟从数据中学到了哪些知识,从而做出了最终的决策,因此需要不断提高模型的可解释性。
6)如何自动化生成或设计最优的网络架构。如何利用机器学习的方法来自动化地学习和训练出一个最优的网络架构是目前最新的研究热点方向之一。
作者简介
赵永强,1996年生,硕士研究生,主要研究方向为深度学习、计算机视觉和模式识别。
E-mail: yongqiang1210@stu.xjtu.edu.cn
饶元,通信作者,男,副教授,博士生导师,主要研究方向为深度学习、机器学习、计算机视觉。
E-mail: raoyuan@mail.xjtu.edu.cn
董世鹏,男,硕士研究生,主要研究方向为计算机视觉与模式识别。E-mail: 624566671@qq.com
张君毅,男,博士研究生,主要研究方向为深度学习与图像识别。E-mail: zhangjunyi0806@xjtu.edu.cn
团队介绍
西安市社会智能与复杂数据处理实验室团队
"图图Seminar" 直播回放
汪荣贵——机器学习基本知识体系与入门方法
知网在线教学服务平台:
http://k.cnki.net/CInfo/Index/5063
陈强——从Cell封面论文谈AI研究中的实验数据问题
知网在线教学服务平台:
http://k.cnki.net/CInfo/Index/4977
石争浩——从先验到深度:低见度图像增强
知网在线教学服务平台:
http://k.cnki.net/CInfo/Index/5531
看完微推意犹未尽?快来加入图图社区,更多资讯等着你
前沿进展 | 多媒体信号处理的数学理论
中国卫星遥感回首与展望
单目深度估计方法:现状与前瞻
目标跟踪40年,什么才是未来?
10篇CV综述速览计算机视觉新进展
算法集锦 | 深度学习在遥感图像处理中的六大应用
封面故事 | 从传统到深度:火灾烟雾识别综述
封面故事 | 光场数据压缩综述
学者观点 | 结合深度学习和半监督学习的遥感影像分类
编辑推荐 | 视频 + 地图!四维信息助力实景中国
深度学习+图像降噪,如何解决“卡脖子”问题?
❂ 专家报告
专家推荐|高维数据表示:由稀疏先验到深度模型
专家报告 | AI与影像“术”——医学影像在新冠肺炎中的应用
专家推荐|真假难辨还是虚幻迷离,参与介质图形绘制让人惊叹!
学者推荐 | 深度学习与高光谱图像分类【内含PPT 福利】
专家报告|深度学习+图像多模态融合
专家报告 | 类脑智能与类脑计算
实战例题!200+PPT带你看懂监督学习
118页PPT!机器学习模型参数与优化那些事儿~
专家开讲 | 机器学习究竟是什么?
❂ 论文写作
羡慕别人中了顶会?做到这些你也可以!
如何阅读一篇文献?
共享 | SAR图像船舶切片数据集
资源分享| 不知道如何获取最新的算法资讯?快来这里看一看
资源分享|热门IT资讯号推荐
❂ 往期目次
《中国图象图形学报》2020年第2期目次
《中国图象图形学报》2020年第1期目次
本文系《中国图象图形学报》独家稿件
内容仅供学习交流
版权属于原作者
欢迎大家关注转发!
编辑:韩小荷
指导:梧桐君
审校:夏薇薇
总编辑:肖 亮
声 明
欢迎转发本号原创内容,任何形式的媒体或机构未经授权,不得转载和摘编。授权请在后台留言“机构名称+文章标题+转载/转发”联系本号。转载需标注原作者和信息来源为《中国图象图形学报》。本号转载信息旨在传播交流,内容为作者观点,不代表本号立场。未经允许,请勿二次转载。如涉及文字、图片等内容、版权和其他问题,请于文章发出20日内联系本号,我们将第一时间处理。《中国图象图形学报》拥有最终解释权。