CVPR 2020 | Open Images冠军方案:商汤TSD目标检测算法解读
该论文名为 Revisiting the Sibling Head in Object Detector,其提出基于任务间空间自适应解耦(task-aware spatial disentanglement,TSD)的检测算法能够有效地减弱通用物体检测中分类任务和回归任务之间的潜在冲突,可以灵活插入大多检测器中,在 COCO 和 OpenImage 上给任意 backbone 提升 3~5% 的 mAP。
该算法也作为核心解决方案(https://arxiv.org/abs/2003.07557)帮助港中文商汤联合实验室取得 OpenImage Object Detection Challenge 2019 冠军。
论文链接:https://arxiv.org/abs/2003.07540
论文引入
通用物体检测算法是许多计算机视觉任务中的重要手段,无论是在工业界还是学术界都是研究的重点。为了能够持续推动检测领域的算法创新,各种通用物体检测算法竞赛每年也会持续召开,如 MSCOCO challenge 以及 OpenImage Object Detection Challenge。
纵观历年来的冠军算法,Anchor-based 的 faster RCNN 检测框架一直作为参赛选手的首选。受 DoubleHead RCNN 和 IoUNet 的启发,本文发现,在 faster RCNN 中,分类任务和回归任务对于输入特征不同位置的敏感性不同,如图 1 所示。
在实验中发现,分类任务更关注语义信息丰富的地方,而回归任务比较关注物体的边界处。在这样的一种潜在的性质下,传统的 faster RCNN 对于分类任务和回归任务共享同一个 proposal 和特征提取器(sibling head)就会出现一些内在的矛盾影响检测器的训练。
本文基于此现象,提出了基于任务间空间自适应解耦(task-aware spatial disentanglement,TSD)的检测算法,对于分类任务和回归任务,分别让其学习各自适应的 proposal 和特征提取器。论文的主要贡献如下:
提出了基于任务间空间自适应解耦(task-aware spatial disentanglement,TSD)的检测算法,对于分类任务和回归任务,分别让其学习各自适应的proposal和特征提取器。
引入 progressive constraint (PC) 损失,来帮助检测器性能大幅度超越传统的检测器头部。
TSD 帮助通用的检测器大幅度提升性能 3%-5%,在 COCO 上,基于 ResNet-101 可以达到 49.4 的 map,在 SENet154 上可以达到 51.2。
检测流程定义
通用的 Faster R-CNN 中,其优化目标为基于 RPN 产生的 proposal P,最小化分类任务损失和定位任务损失,可以表示为:
点击以下标题查看更多往期内容:
#投 稿 通 道#
让你的论文被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得或技术干货。我们的目的只有一个,让知识真正流动起来。
📝 来稿标准:
• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)
• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接
• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志
📬 投稿邮箱:
• 投稿邮箱:hr@paperweekly.site
• 所有文章配图,请单独在附件中发送
• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。