查看原文
其他

重磅!商汤&港中文等将开源ECCV2018MS COCO检测比赛冠军代码库

52CV君 我爱计算机视觉 2019-06-22

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
来自商汤科技、港中文、浙大、悉尼大学、南洋理工大学的研究人员组成的团队MMDet,赢得了ECCV2018 MS COCO检测比赛的冠军。近日,他们将开源在比赛中使用的代码和模型库。

MMDet团队成员:

ECCV2018MS COCO检测比赛结果:

在这个比赛中MMDet团队开发了新的深度学习检测框架,从三个方面区别于以往的框架:一种新的混合级联架构,一种更智能的anchoring机制,一种新的骨干网络FishNet。
(1)使用混合级联架构组织整个流程,不同任务的分支(包括比如包围框回归、掩模预测、语义分割)用交替的方式被组织起来。这种新的架构改进了信息流,以至于不同模块的信息可以更有效的交换。

(2)开发了一种特征引导的anchoring机制,替代传统的密集均匀的anchors。这种机制可以预测任意形状的稀疏anchors,其大幅改进了RPN的性能。(AR上升了大约10%!)

(3)加入了一种新的骨干网(FishNet)到集成模型中,它可以保持并改进不同深度的相同分辨率的特征。

在实验中,使用COCO train2017的标注(bbox, mask,stuff)使用不同的骨干网(分别是SE-ResNeXt-154 (64*4d), ResNeXt-101 (64*4d), ResNeXt-101 (32*8d), DPN-107, and FishNet)训练了5个模型。这些网络预测的结果最后被结合起来,在test-dev上的性能结果是:

(1)单模型(单尺度测试)45.3 mask AP,

(2)单模型(包括图像flip的多尺度测试):47.4 mask AP,

(3)5个模型集成:49.0 mask AP。

目前该工程正在代码整理中,作者称将于9月底正式发布,敬请期待!

Github地址:
https://github.com/open-mmlab/mmdetection
如果你想参加计算机视觉比赛,请看52CV君前几天的文章:

近期计算机视觉机器学习竞赛汇总

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

【本文由“我爱计算机视觉”发布,2018年09月17日】

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存