查看原文
其他

大连理工大学斩获国际竞赛桂冠!

 头条新闻

近日,CVPR(国际计算机视觉与模式识别大会)2018国际大规模精细粒度物种识别竞赛iNaturalist Challenge 2018(iNat-2018)@FGVC5在美国盐湖城举行颁奖仪式和比赛总结。由大连理工大学电子信息与电气工程学部李培华教授指导的参赛团队DLUT_VLG获得了本次竞赛的冠军,在识别率上分别高出第2名Deep Learning Analytics公司和第3名Baidu VIS团队1.1%和1.8%,共有来自多个国家的59支队伍参加了此次竞赛。


iNat-2018是由谷歌公司、加州理工大学和康奈尔大学共同组织,微软公司赞助的竞赛,是今年CVPR大会众多的挑战赛之一。国际计算机视觉与模式识别大会(CVPR)是计算机视觉领域内的顶级会议,根据谷歌学术的H5指数统计,近年来CVPR已经成为该领域内最具影响力的国际会议。会议除了接收最前沿的研究工作之外,还组织具有实际意义和难度的挑战赛,从理论和实践两个方向推动计算机视觉领域的发展。在今年大会的开幕式的特别环节中,四个具有代表性的竞赛组委会被邀请上台进行宣讲,其中就有组织本次比赛的精细粒度workshop FGVC5。



尽管基于深度学习的视觉识别取得了很大进展,大规模物种识别问题仍然是一个巨大的挑战。在微软公司启动的智慧地球项目中,为了有效地保护生物多样性,关键任务之一是能够从数字图像中自动识别自然界中种类繁多的动物、植物和菌类等。谷歌公司与加州理工大学和康奈尔大学合作,提出视觉维基百科项目,致力于精细粒度种类识别问题。正是在这样的背景下,谷歌公司和微软公司联合推出了iNat-2018,旨在解决基于视觉的大规模物种识别这一难题。相对于粗粒度、仅包含1000类、类别样本均衡的ImageNet竞赛,iNat-2018具有显著不同,表现在:属于精细粒度分类问题——类别之间差异细微;类别数规模更大——类别数是ImageNet竞赛的8倍多,超过8000类物种;不同类别样本分布极不均衡,呈现长尾分布——每类最多有1000张样本图像、最少却仅有2张样本图像。正是这些因素,使iNat-2018竞赛更具有挑战性。



本次竞赛冠军大连理工大学DLUT_VLG团队所使用的核心技术方案,是基于该团队所研发的矩阵幂正规化协方差聚合(MPN-COV)卷积网络模型及快速训练算法。MPN-COV模型的新颖之处在于在网络中引入了二阶统计信息作为图像表征,与经典方法在学习过程中仅仅挖掘一阶统计信息具有显著不同,能够学习到分辨能力更强的视觉特征。通过引入全局协方差聚合和矩阵幂正规化技术,MPN-COV模型在性能上显著优于经典的卷积网络,而且收敛速度更快,相关工作发表在ICCV 2017和CVPR 2018上。除了全局协方差聚合之外,该课题组也深入研究了全局高斯聚合卷积网络,解决了高斯流形嵌入和端到端学习问题,研究成果发表于CVPR 2017 (oral)和TPAMI 2017。


内容来源 | 电子信息与电气工程学部

新闻作者 | 张冰冰 谢江涛

通  讯  员 | 李香周 李培华 

责任编辑 | 周学飞

近期精彩内容

最新ESI数据公布,大工3学科进入前1‰,位列内地高校第9

辽宁录取结束!大连理工大学2018年录取结果及分数线公布

恭喜你成为大工人!2018年大工首批本科生录取通知书正在派送中!

@大工2018级新生:援梦专列等你来圆梦!

大工发布新版校园“交规”:内容全面请牢记,违规后果很严重!

 为大工点666个赞!!!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存