查看原文
其他

最关注|计算机视觉界的“奥林匹克”冠军,南信大又一次站在世界舞台的中心

2017-08-11 勤奋好学的 南京信息工程大学

                                  

                                           


如何在最快的时间内把100万张图片分成1000类?

人类可能做不到,

  但是现在的计算机,可以。

而操纵这些计算机背后的英雄,

便有以南信大命名的一群人。



2017年国际计算机视觉与模式识别大会

(IEEE conference on Computer Vision and Pattern)

我校刘青山教授团队在大规模图像识别挑战赛

(Large Scale Visual Recognition Challenge ,简称ImageNet)

和国际人脸配准算法竞赛

(Faces In-The-Wild-Challenge)

两项竞赛中再夺桂冠


(国际计算机视觉与模式识别大会CVPR是计算机视觉与模式识别领域的国际顶级会议,CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写)


此项国际顶级会议,不仅是学术界,也是工业界的盛事,今年的参会人数达5000余人。会议期间,还组织了多项算法竞赛,其中包括有计算机视觉界“奥林匹克”之称的ImageNet竞赛。在高手云集的ImageNet竞赛中,我校又一次取得了世界顶级视觉识别大赛冠军的殊荣。



BDAT团队:计算机视觉界的“奥林匹克”冠军

2017 年 ImageNet 竞赛物体检测项目,最佳平均准确率比去年有了大约 6% 的提升(从 66.3% 到 73.1%)。根据比赛规则,在用提供的训练数据进行物体检测和使用额外训练数据进行物体检测两个任务中,BDAT团队包揽了第一名,紧随其后的是新加坡国立学和奇虎 360 组成的 NUS-Qihoo_DPNs(DET)团队等。


BDAT 团队由 8 名南京信息工程大学的成员和 2 名帝国理工学院的成员组成。以下是此次比赛BDAT团队获得的部分成绩:




任务1a,用提供的训练数据进行物体检测(object detection),由南京信息工程大学和帝国理工学院组成的 BDAT 团队提供的算法,探测物体胜出种类数量为85,平均 AP 为0.731392。



任务1b,使用额外训练数据进行物体探测。BDAT 团队的算法在使用处理过的标签数据(refine part of training data annotation)中,识别物体胜出种类数量 达128 个,平均 AP达 0.731613。




ImageNet竞赛:中国AI领域的崛起

《福布斯》报道称,在今年的ImageNet竞赛中,27支参赛队伍里超过一半都来自中国,企业和高校都有,并且最终结果排名前几的也都是中国团队或华人。这基本是去年赛况的重现:2016年,参与ImageNet竞赛的84支队伍中,华人科学家占了一大半。


ImageNet作为一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库,由美国斯坦福大学的计算机科学家等,模拟人类的识别系统而建立。ImageNet能够从图片识别物体,未来用在机器人身上,就可以直接辨认物品和人了。ImageNet 及其竞赛的重要性已经不言而喻,但实际上,从更长的周期看,ImageNet 系列工作对计算机视觉、机器学习、人工智能乃至人类进步的影响都更为巨大。


或许,证明中国在AI领域崛起的最佳证明之一,便是我们在ImageNet竞赛上取得的成绩。视觉识别已经是AI的重要研究方向,无论是对非法视频识别,还是谷歌这样的搜索引擎,都需要完善的视觉识别系统。自2010 年以来,ImageNet 每年都会举办一次ImageNet大规模视觉识别挑战赛(ILSVRC),参赛程序以最高的正确率对物体和场景进行分类和检测为标准,不仅牵动着产学研三界的心,也是各团队、巨头展示实力的竞技场。



定格冠军:虽是最后一届,仍要不停歇地拼命


我校刘青山教授领衔的团队连续参加了3年的ImageNet竞赛(2015-2017),每年都拿到了冠军。每一年必须有所创新,否则不可能轻易拿到冠军。像谷歌、百度这些大公司不仅在计算资源上有巨大的优势,而且还有很强的人才队伍,因此学术界能拿第一的还是少数,一般都是工业方面的公司获得冠军。



实验室参赛设备


而我校能取得如此优异的成绩,靠的是团队成员拼了命的付出。据参赛人员介绍,在比赛最紧张的时候,团队成员一天就睡两三个小时,困了眯一会,醒了再继续,一直在做。这项比赛的周期很长,持续了将近两个月。这样的“拼命三郎”终于诞生了连续三届的冠军。


从对象识别==》

到人类水平的识别


本届ImageNet竞赛将是大规模视觉识别挑战赛(ILSVRC)的最后一届,以后的比赛将会超越“识别”,往“理解”上发展。我们期待更好更智能的计算机技术,也期待我校继续钻研创新的成果。



最强团队:1+1>2的合力,终没被辜负


此次比赛的带队老师刘青山教授,主要研究方向为图像与视频分析、计算机视觉与机器学习,是教育部新世纪人才,双创团队领军人才及双创个人,获江苏省杰出青年基金资助等一系列殊荣,在国内外学术期刊和国际会议发表论文100余篇。


刘青山教授自2011年加盟我校以来,从零起步组建了江苏省大数据分析技术重点实验室,培养成长了包括2名国家优青、3名江苏省杰青等一批年轻才俊。在这个年轻的团队里,还有一批可爱、好学的学生,老师和学生之间亦师亦友,共同努力奋进。实验室里每个学生的研究任务都不一样,既有从事偏机器学习理论的研究,也有偏应用的研究,相互之间经常交流,相助相长。大家暑假一般都会留校学习,即便回家也会用软件远程控制进行一系列编程等任务。


“有些想法实现起来很简单,但是关键是要有自己的想法。把别人的东西复现很简单,但是要有新想法,才能有新突破。”连续三届参赛的郁振波说道,“自制力很重要,只要有自制力在,真的在哪都一样。”师兄经常对我说的一句话就是“时间不够用,一定要少睡觉”。


☺ 即将研二的郁学长也想对屏幕前的你们说:


要尽量多想问题、多想办法。新手一开始遇到问题都喜欢问,这是高中、大学养成的习惯,但是在自己还没有仔细思考之前,尽量少问。不管哪个学科,刚一入门肯定会有问题,最能提高你的是你理解问题和解决问题的过程,只有自己学会了如何去解决问题的能力,你才能真正得到提高。在科学研究中,很多问题都是未知的,可能没有人能帮你解答,百度、谷歌也都找不到答案,所以一开始一定要学会解决问题。看一些很基础的书,看书的过程比结果更重要,在学习的过程中多想问题、多想办法才是你成长的过程。



往期精彩


暑假秀|滨江学院小分队走进一带一路节点城市开展气象科普

最关注|在四川、新疆的你,请照顾好自己!

人物志|书生气、英雄气、江湖气,做最接地气的“三气”主席


文字:刘倩倩

图片:杨静、部分来源于网络

编辑:吴雨飞

责编:陈宗林

审核:阙华燕、张锦文



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存