查看原文
其他

SIGSPATIAL 2019 | 滴滴论文解读:计算机视觉在地图领域的探索与应用

马楠Mandy 滴滴科技合作 2021-09-05

点击上方“蓝色字体”,选择“置顶公众号”

精彩内容,即刻送达


SIGSPATIAL 2019

空间信息领域顶级学术会议ACM SIGSPATIAL 2019于11月5日至8日美国芝加哥举行。


在SIGSPATIAL 2019期间,来自全球学术界和产业界的研究人员齐聚一堂,讨论时空信息领域的新技术,包括时空数据挖掘、时空数据模型和算法、位置服务、地图匹配、分布式和并行计算、路径规划、轨迹计算等。


除主会场外,大会还设立了15个专题研讨会,涉及地理知识挖掘、网约车算法与地图技术、聚类和异常检测、基于空间数据的用户隐私、人口流动预测等主题。


今年滴滴共有6篇论文入选SIGSPATIAL 2019,涵盖计算机视觉、路况还原与预测、车辆定位与实时跟踪、轨迹异常挖掘等不同方向。本文将介绍滴滴地图计算机视觉团队被大会三场专题研讨会接收的3篇论文,涉及地图交规更新、交通目标检测和室内语义地图构建等话题。

计算机视觉广泛应用于地图领域。就滴滴而言,计算机视觉技术对网约车地图的更新和用户体验的提升起到至关重要的作用。例如,滴滴地图技术团队通过检测识别现实世界中交通标志牌、车道线、引导箭头、道路属性等,来进行地图中交规、车道信息、停靠属性、主辅路判断等关键要素的更新和处理;借助视觉定位和3D视觉建模的能力,滴滴开启AR实景导航服务,解决大型场站内司乘会面难的痛点,指引乘客轻松找到推荐上车点等。

专题研讨会滴滴论文口头报告


Paper 1

A Traffic Sign Discovery Driven System for Traffic Rule Updating

基于交通标志牌识别的交规更新系统

Tengfei Xing, Yang Gu, Zhichao Song, Zhihui Wang, Yiping Meng, Nan Ma, Pengfei Xu, Runbo Hu, Hua Chai

研讨会:3rd ACM SIGSPATIAL International Workshop on AI for Geographic Knowledge Discovery (GeoAI 2019)

交通规则描述了道路的连接关系,是地图的基础数据,在路径规划、司机导航以及自动驾驶系统中起着重要的作用。由于现实世界中每天都会有交通规则的变更,因此交规更新是地图制图的一个关键能力。之前有大量的工作基于轨迹挖掘进行交规更新,由于异常轨迹的存在,会造成准确率难以提升。


在本文中,我们提出了一个基于街景图像交通标志牌识别的交规更新系统。为了能够发现交通规则的变化,本文设计了一个目标识别框架来识别街景图像中的交通标志牌。并且,为了能够提升系统的灵活性,本文利用模型压缩方法对上述的目标识别框架进行压缩,该模型可部署到行车记录仪中,在车辆行驶过程中,实时进行标志牌识别并回传识别结果。最后,本文提出了一个时空注意力方法对识别结果进行聚类。


论文提出的交通标志牌识别系统框架

(包含移动端和服务器端两部分)


该系统可以支持多种类型的交规更新,比如禁止左转/右转/掉头、禁止停车、限速等,同时具有很好的可扩展性。我们在一个滴滴真实场景的数据集上验证了图像识别算法的性能,图像级的准确率为99.2%,召回率为95.1%,保证了挖掘交规的准确性。


论文地址

长按扫码 获取论文


Paper 2

Small Traffic Sign Detection Through Selective Feature Fusion Based Faster R-CNN With Arc-Softmax Loss

基于选择性特征融合算法Faster R-CNN和损失函数Arc-Softmax的小型交通标志检测

Site Li, Yang Gu, Zhichao Song, Tengfei Xing, Yiping Meng, Pengfei Xu, Runbo Hu, Tiancheng Zhang, Ge Yu, Hua Chai

研讨会: 12th ACM SIGSPATIAL International Workshop on Computational Transportation Science (IWCTS 2019)

交通标志是地图的基本要素和重要组成部分。它们与交通法规有关,极大影响/管理着人类的出行方式和车辆的运行效率。交通标志挖掘技术在传统的地图更新、高精度地图建立、自动驾驶等领域有着广泛的应用。随着计算机视觉技术的飞速发展 ,基于图像的交通标志识别技术备受瞩目,与人工处理方法相比,其成本低,效率高;与传统轨迹挖掘方法相比,基于图像的交通标志识别具有可识别类别多,有真值可评估等特点。


目前,交通标志检测作为目标检测的子课题已成为一项重要的研究方向。然而,许多通用的目标检测方法不能直接应用于这项任务,因为交通标志的尺寸很小,且它们有很大的差异。由于这些特点,很难提取交通标志的特征,也很难区分类别。针对上述问题,本文提出了一种基于选择性特征融合的Faster R-CNN算法,使用Arc-Softmax作为损失函数。该算法从网络结构和损失函数两个方面优化了检测性能。基于Faster R-CNN的每一层只能检测到一定尺寸范围内目标的特点,通过对不同层次的特征图进行仔细的选择和组合,有效地提取出可表征不同尺寸交通标志的特征。然后,Arc-Softmax loss通过惩罚不同交通标志的特征向量与最后全连接层中对应的权重向量之间的角度距离,从而提升特征的类内紧度和类间可分性。通过在具有挑战性的Tsinghua-Tencent 100K基准测试上进行的大量分析和实验,证明了该方法的优越性和易实现性。


基于Arc-Softmax loss学到的特征在MNIST数据集上的可视化结果

论文地址

长按扫码 获取论文


Paper 3


SeMap: Automatic Semantic Mapping for Large-Scale Indoor Spaces

SeMap:大规模室内空间的自动化语义地图构建

Xiaoqiang Teng, Deke Guo, Yulan Guo, Pengfei Xu, Yiping Meng, Runbo Hu, Hua Chai, Zhong Liu

研讨会:3rd ACM SIGSPATIAL International Workshop on Location-Based Recommendations, Geosocial Networks, and Geoadvertising (LocalRec 2019)

随着室内位置服务应用的快速发展,语义地图构建技术逐渐成为一种备受关注的技术。语义地图构建是利用传感器数据来识别语义并在室内地图上标记语义信息的一种技术,已被广泛应用于多个领域,诸如机器人、无人驾驶、AR/VR、室内导航、基于位置的社交和广告投放等。现有的语义地图构建技术或者只能够适用于特定语义信息的标记,或者对室内空间的特征变化较为敏感且计算复杂度较高,导致很难在实际中被广泛应用。


针对于以上问题,本文提出了一种新的语义地图构建框架,即利用众包的运动信号和视觉数据来实现自动化的室内空间的语义信息标记。


论文提出的语义地图构建框架


首先,本文利用图像和地理位置数据来构建场景图。该场景图是后续位置优化和语义标记的基础。其次,由于图像的拍摄位置是由运动数据估计得到的,误差较大,导致语义信息标记误差大。因此,本文采用图像和运动数据通过提出一种最优化算法来减少图像的位置误差。最后,本文利用同一个实体不同视角拍摄得到的图像,通过计算语义信息可能存在的区域在室内地图上估计语义信息的位置。在真实的数据集上验证了本文所提方法是精确的和有效的。


论文地址

长按扫码 获取论文





关于以上论文和滴滴@SIGSPATIAL的更多详情

可联系滴滴科技合作经理 Mandy Ma:mandyma.edu@didiglobal.com。



相关阅读

预告 | 相约芝加哥,Join DiDi @ SIGSPATIAL2019 空间信息国际顶会

详解火了2019 Google开发者大会的滴滴AR黑科技

滴滴出席计算机视觉顶级会议ICCV,分享计算机视觉在出行场景下的探索与实践




编辑 | 贺贺



视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存