CVPR 2020 | 迁移学习、图像匹配 、人脸对齐 、智慧城市,滴滴屡创佳绩
6月14-19日,国际计算机视觉与模式识别顶级会议CVPR 2020正在线上如火如荼地召开。今年,华人整体表现不俗,滴滴也收获颇丰:夺得“迁移学习”和“图像匹配”三项任务第一,“AI City-车辆计数任务”第二和第三,并且论文PropagationNet: Propagate Points to Curve to Learn Structure Information被CVPR 2020 Oral收录。
小样本学习是块硬骨头,
滴滴AI Labs勇夺两项世界第一
小样本学习是当今计算机领域备受关注的一大难点,主要解决在数据收集难、标注难的场景下深度学习所面临的挑战。
图1. CD-FSL挑战赛说明
滴滴AI Labs迁移学习组与北京邮电大学邓伟洪教授课题组参与CVPR 2020 CD-FSL 挑战赛,并获得「两项任务世界第一」的好成绩。该挑战赛由IBM联合加州大学圣地亚哥分校、麻省理工等多所高校发起,是针对跨域小样本学习问题的首个挑战赛。
滴滴&北邮参赛队结合在迁移学习方向已有的技术积累和理论研究,提出Feature Transformation Ensemble Model with Batch Spectral Regularization,FTEM_BSR模型实现任务目标。该方法以减小在不同域上对卷积神经网路进行微调时产生的负迁移为切入点,结合分批谱正则化(Batch Spectral Regularization),使其在使用源域数据进行预训练网络时对每一批次输入数据的特征矩阵进行奇异值分解,对分解得到的包含域信息的奇异值进行正则约束,以此来提高模型对不同域的泛化能力。另外,提出一种基于特征变换的集成模型(Feature Transformation Ensemble Model),使用不同的映射矩阵对特征进行变换得到具有不同视角的模型,然后对这些模型进行集成训练,以进一步提高模型的准确性和鲁棒性。最后,对目标域采用了标签传播算法和数据增广策略优化结果,针对于第二个赛道可以使用目标域一定量无标签数据的情况,同时提出了数据融合(Data Blending)的操作,产生新的混合数据参与网络训练。
挑战赛网址:
https://www.learning-with-limited-labels.com/
滴滴地图以绝对优势
摘得图像匹配世界第一
图像匹配是计算机视觉的基础步骤,在图像检索和三维重建中有着广泛应用。
图2. Image Matching 挑战赛
滴滴地图与公交事业部视觉计算团队(Didi MapVision) 团队在track1 赛道上以绝对优势超越对手获得第一。在比赛中,滴滴 MapVision 团队基于图像匹配上已有的技术积累和前沿理论研究,融合几何和深度学习方法,构建低噪声低冗余的数据集,在卷积描述子生成方法中提出了基于困难样本挖掘的二次合页损失函数改进;另外,在基于深度学习的图像匹配外点剔除算法中改进了匹配信息中局部和全局上下文的流通;结合卷积描述子生成方法和深度学习外点剔除算法,显著地提升了相对位姿估计的准确性,形成一套图像匹配完整方法。该方法有在AR、三维重建、无人驾驶等领域广泛应用的前景。
挑战赛网址:
https://vision.uvic.ca/image-matching-challenge/
CVPR 2020 Oral :
PropagationNet人脸对齐新方法,
“以点带线”稳定地分析人脸结构
人脸对齐任务是人脸识别系统中非常重要的一部分,是解决学多人脸相关问题基础,比如人脸三维重建、人脸认证等。尽管人脸对齐方法的精度目前有了很大的提升,达到了实用的程度,在自然状态下的人脸对齐仍然面临着许多的挑战,如不均匀照明,表情的变化,遮挡等问题使得非受控环境下的人脸对齐非常困难。
图3. PropagationNet 人脸对齐模型结构
滴滴AI Labs 图像技术部和北京邮电大学邓伟洪老师课题组联合提出了一种新的基于热图回归的结构化人脸对齐算法,该算法通过将关键点热图传播成边界热图来提供结构信息,以供进一步生成注意力图。此外,我们提出了可以在自然条件下挖掘和平衡困难样本的焦翼损失。另外,我们从其他领域引入了 CoordConv 和 Anti-aliased CNN 之类的方法来解决CNN 的平移可变性问题。当在不同的基准(即WFLW、300W 和COFW 三个数据集)上进行广泛的实验时,发现本方法在 WFLW 数据集上实现 4.05%的归一化平均误差,在 300W 全集上实现 2.93%的归一化平均误差,在COFW 数据集上实现 3.71%的归一化平均误差。本论文 PropagationNet: Propagate Points to Curve to Learn Structure Information 被CVPR 2020 收录。联系滴滴科技合作小助手,备注“CVPR”可获取论文全文。
此前滴滴安全产品技术部门安全算法组在人脸识别权威评测 FRVT 中也获得了两项全球第一(犯罪嫌疑人识别与跨14年犯罪嫌疑人识别)的优异成绩。
车辆计数,
智能交通视频分析看路口拥堵
由英伟达发起的 AI City Challenge 被称作为“智能交通视频分析界的ImageNet竞赛” ,受 ImageNet 数据集启发,AI City 竞赛旨在创建优质视频数据集,使全球的学术和工业研究团队能够推动各种智能视频分析的最新技术,解决现实世界的问题。AI City 挑战赛由英伟达联合纽约州立大学奥尔巴尼分校、爱荷华州立大学、圣何塞州立大学、华盛顿大学发起,吸引了来自百度、华盛顿大学、UIUC、北京大学、IBM等全球多所高校和机构的参与。
图4. AI City 挑战赛
滴滴参与了任务一“多拍摄角度下,交叉路口的车辆计数”,即在特定交叉路口,对左转、右转、直行的车辆进行计数。该任务有助于理解道路交通运力,可用于交叉路口信号灯控制 ,从而缓解交通拥堵。滴滴获得本次竞赛的第二和第三名的好成绩。
挑战赛链接:
https://www.aicitychallenge.org/
7月4日,将举办CVPR 2020 竞赛经验分享会。
计算机视觉领域的比赛的研究方向或充满挑战性、或具备应用前景,或新奇,或有趣,这些比赛极大地推动了计算机视觉的发展。为促进产学研合作、 推动国内计算机视觉学科发展,滴滴将携手中国计算机学会视觉专委会CCF-CV和中国图象图形学学会视觉大数据专委会CSIG-BDV于 7月4日举办CVPR 2020 竞赛经验分享会。届时CVPR2020挑战赛中的优秀队伍将携各自在 CVPR 2020的竞赛成果与比赛经验,与大家交流分享。此外,竞赛的主办方也将在会上分享他们组织竞赛的初心与思考,分析与探讨领域内的前沿技术和关键方向。本次活动将全程于线上进行,欢迎大家关注。
扫描下方二维码,添加滴滴科技合作小助手,了解更多相关资讯!
推荐阅读