影响因子高居榜首!国际挑战赛冠军!大工科研再获重要进展
日前,电信学部信息与通信工程学院李培华教授课题组在深度学习方面取得重要进展。课题组创新性地提出一种深度卷积神经网络模型,在国际标准数据集上取得领先的性能并获得国际大规模自然物种识别挑战赛冠军。
李培华教授课题组所撰写的论文被计算机视觉和人工智能领域国际公认的顶级期刊《IEEE模式分析与机器智能汇刊》(简称IEEE TPAMI)录用并在线发表,论文题目为《Deep CNNs Meet Global Covariance Pooling: Better Representation and Generalization》。IEEE TPAMI的科学引文索引影响因子为17.73,在2019年谷歌所发布的学术影响力排名中,位列所有计算机工程、电子工程及人工智能相关期刊之首。
深度神经网络模型是计算机视觉和人工智能中最为核心的关键技术,在图像和视频识别、场景理解、医疗诊断和机器人感知等领域中起着基础性作用。
正是由于其基础性和核心作用,深度神经网络模型是世界上各大科研机构和高科技公司的重点研发内容。然而已有的工作主要集中在如何设计更宽或更深的神经网络架构,却忽略了对高阶非线性的挖掘,限制了模型性能的进一步提高。对此,课题组创新性地提出一种矩阵幂正规化高阶聚合深度卷积神经网络设计范式,通过学习卷积特征二阶或更高阶信息作为图像表征,极大地增强了模型的非线性建模能力。
在理论层面,论文从概率和统计的角度证明了所提出的模型能够在高维度和小样本条件下稳健地估计卷积特征的高阶统计量,并进一步从信息几何的角度建立了网络模型与黎曼测度之间的密切关联;在应用层面, 所提出的模型在通用物体识别/场景分类/细粒度分类/纹理分类国际标准数据集上取得领先结果,识别性能显著地优于已有模型。
基于所提出的深度卷积神经网络模型,课题组参加了CVPR大规模自然物种识别挑战赛,在来自世界各地的科研院所/高科技公司的59支队伍中取得第一名,获得国内外学者和工业界的广泛关注。
课题组应邀参加国家自然科学基金委主办的“国家自然科学基金杰出科学家浙江行”活动, 论文作者、博士研究生谢江涛在路演中向与会科研人员和企业家对该项研究成果进行了专门宣讲和介绍。作为计算机视觉领域的基础和核心技术,课题组所提出的模型在商品识别、自主/无人驾驶车辆、无人值守超市和基于视觉的智慧城市建设中具有广泛的应用前景。
该论文是在国家自然科学基金61471082和61971086资助下的系列研究成果之一,其总体研究思路和研究内容为李培华教授团队提出并完成。
论文第一作者王旗龙为实验室培养的博士研究生,现任职于天津大学人工智能学院,入选博士后创新人才支持计划(即“博新计划”);
论文第二作者谢江涛为硕博连读研究生,从大二开始进入课题组从事科研工作,目前已在顶级期刊/会议上发表5篇论文;
论文通讯作者为李培华教授,近年来的研究工作主要发表于计算机视觉/人工智能的顶级会议CVPR/ICCV/NeurIPS和顶级期刊IEEE TPAMI/TIP等,主持多项国家级科研项目,并致力于通过与企业合作将研究成果落地到实际产品中。
内容来源 | 电子信息与电气工程学部
编辑排版 | 刘闯宁
责任编辑 | 周学飞
近期精彩内容
感动!大工这位老师日夜创作,绘制333名毕业生与辅导员速写肖像长卷!
为大工点赞(在看)!