斩获CVPR2019挑战赛奖项 滴滴与学界广泛合作加速自动驾驶研发
桔妹导读:第32届计算机视觉和模式识别大会 CVPR2019 在加州长滩继续举行,滴滴技术团队携手加州大学伯克利分校 DeepDrive 深度学习自动驾驶产业联盟(BDD)举办CVPR 2019 自动驾驶研讨会,详细介绍了滴滴在自动驾驶领域的探索和实践。大会现场,CVPR AI 城市大赛还正式揭晓获奖名单,滴滴技术团队获得了世界第二的好成绩。
滴滴在CVPR2019现场
▍CVPR AI 城市大赛名列前茅
CVPR 是全球人工智能和计算机视觉领域每年一度的顶级学术会议之一,伴随该会议组织的各项挑战赛也备受关注。在AI城市大赛(AI city challenge)中,英伟达基于最新发布的城市规模的交通摄像头数据集“流动之城”(City Flow),提出了跨摄像头多目标车辆跟踪、基于图片的车辆再识别以及交通异常检测三项任务,用来鼓励该领域前沿算法的发明与实现。由于该数据集包含来自 40 个摄像头的视频数据,涵盖十字路口,住宅,高速公路等多种场景,支持跨摄像头汽车跟踪及再识别,同时拥有最大的空间跨度,因此该挑战赛也吸引了全球超过200支顶尖队伍参与。
其中,跨摄像头多目标车辆跟踪任务实际包含图片的再识别、单摄像头内的多目标跟踪以及摄像头之间的时空分析三项内容,最为复杂;同时由于类内部的高变化性(不同视角的车辆变化比人更大)和类之间的高相似性(不同汽车厂商生产的车辆模型很相近),车辆再识别也较行人再识别更具难度。
滴滴车载技术团队现场分享挑战赛中的算法实践
通过在跨摄像头跟踪框架、单摄像头跟踪算法等层面进行创新,滴滴车载技术团队不仅对框架各个模块解耦,能方便各模块独立研究和新模块的引入;还新提出一种新的单摄像头跟踪算法,能创新地利用 CNN 网络和时空信息,解决了车辆跟踪过程中目标丢失的问题,这一表现也优于 Deep SORT、MOANA 和 TC 三种顶级多目标单摄像头跟踪算法。此外,滴滴还提出一种分阶段的聚合策略,能根据不同的时空条件有序地排列聚合策略,并利用超参数自动搜索技术调整系统至全局最佳状态,最终从参赛队伍中脱颖而出,获得世界第二。
▍CVPR AI 城市大赛名列前茅
值得注意的是,在此次 CVPR 上,除有多篇论文入选外,滴滴还参与合作伙伴 BDD 举办的自动驾驶识别研讨会,就自动驾驶展开广泛交流,并向 CVPR 2019 WAD 自动驾驶识别挑战赛获胜队伍颁发奖牌。
此前3月,滴滴联合 BDD 启动了挑战赛,重点参与提出目标检测迁移学习项任务,并提供一个大规模、高质量的真实驾驶场景视频数据集 D²-City,涵盖 12 类行车和道路相关的目标标注,鼓励参赛者利用采集自美国的 BDD100K 数据,训练目标检测模型用于D²- City 数据。与现有的自动驾驶公开数据集相比,D²-City 数据集提供了更多在复杂或有挑战性的天气、交通、采集状况下所收集的真实场景数据,参赛者需要提供在各状况下准确的目标检测结果。最终,旷视科技、电子科大和苏黎世理工、深蓝团队依次获得 D²-City & BDD100K 目标检测迁移学习挑战赛的前三名。
滴滴自动驾驶首席工程师贾兆寅现场展示自动驾驶测试进展
滴滴始终在积极与学术界积极开展技术合作,今年上半年,滴滴还相继牵手 BDD、图灵奖得主 Yoshua Bengio 领衔的蒙特利尔学习算法研究所(Mila)等顶级研究机构不断探索自动驾驶技术边界。研讨会现场,滴滴自动驾驶首席工程师贾兆寅还详细介绍了滴滴近期的自动驾驶测试情况,目前滴滴已拥有超过 100 人的自动驾驶团队,在中国、美国多地开展测试。在积极开展路测的同时,技术团队也在逐步尝试运用丰富而多样的网约车车载数据训练算法模型。
而谈到自动驾驶的落地,贾兆寅认为滴滴短期比较理的想商业化形式可能是“混合派单”,例如在相对简单的路线派出无人车,在复杂路段派单给司机接驾。混合派单模式即可以推动自动驾驶技术更快成熟落地,也可以保证用户日常的出行体验。
推荐阅读
▬
更多推荐
▬
滴滴开源 / Open Source
Mpx | Booster | Chameleon | DDMQ | DroidAssist | Rdebug | Doraemonkit | Kemon | Mand Moblie | virtualApk | 获取更多项目
技术干货 / Recommended article
韦伯-费纳希定律,前景理论及其在数据科学中的应用 | 一个 Golang 项目的测试实践全记录 | 滴滴 NewSQL 演进之 Fusion 实践 | 阅读更多内容