ICRA20中的SLAM论文汇总（一）VSLAM

智车科技 2021-09-20

The following article is from 计算机视觉life Author 史雪松

本文是第一部分，包含比较典型的VSLAM工作（包括VIO）。激光SLAM、多传感器融合、多机器人和其它脑洞SLAM留给第二部分。第三部分是深度学习专题。

本文来源：知乎空间智能专栏

趁着 ICRA20 还没结束（在线论文集开放到8月底），我和高仙机器人的赵敏同学人肉扫描了一遍 SLAM 和 Localization 主题下的所有论文，每篇文章写了一点摘要，大致做了归类，希望能帮各位节省一点时间。虽然摘要基本不含主观评价，但摘取的信息必然受个人口味影响，仅供参考。一共84篇，人肉整理，不保证没有遗漏。原文请自行检索，我俩不负责提供pdf。

本文是第一部分，包含比较典型的VSLAM工作（包括VIO）。激光SLAM、多传感器融合、多机器人和其它脑洞SLAM留给第二部分。第三部分是深度学习专题。

（一）视觉SLAM：特征点法，结构特征，特殊特征，直接法，稠密SLAM，理论分析

（二）各种SLAM：激光，多传感器融合，多机器人，全局概率定位，active SLAM

（三）深度学习：CNN提特征，语义SLAM，运动物体，位姿/深度回归，重定位

Taxonomy是很tricky的事情。一项工作可以按问题分类，也可以按方法分类，还可以按传感器分类。我们的总体哲学是看每篇文章本质上在研究什么，其贡献主要可供哪个研究领域的人参考。

例如∇SLAM这个工作，虽然全文都是讲dense SLAM里的算法，但他的思路是把SLAM系统做成可微，从而能在未来实现端到端训练，dense SLAM只是一个例子。所以我们把它归到深度学习大类，尽管文中并没有用到深度学习。

再比如DeepTIO，表面上看做的是热成像和IMU的传感器融合，但他的方法明显是如何训练CNN来回归位姿那一派，跟多传感器融合常用的花式滤波没半毛钱关系。

如果就是关心某类传感器，也没关系，回头我们把xls放出来，里面有标记每篇paper用到的传感器（不一定对），可以自行筛选。

数据集和评测类的工作，跟哪部分相关度最高就放哪里了。比如下面第一篇，主要面向视觉SLAM，所以就放这了。（唉，其实是个广告位，本文题图也来自OpenLORIS，做数据集不易，且用且珍惜

数据集

Are We Ready for Service Robots? The OpenLORIS-Scene Datasets for Lifelong SLAM

OpenLORIS-Scene数据集包含来自5个真实场景的22条轨迹，以轮式机器人采集，包含RGBD/双目鱼眼/IMU/里程计/激光数据，同一场景的所有轨迹提供同一世界坐标系下的真值，用于评估SLAM算法在动态场景中长期工作的能力。

lifelong-robotic-vision.github.io

特征点法

Towards Noise Resilient SLAM

针对ORB-SLAM2框架中depth噪声引起的问题，提出两种应对，一是对每个landmark维护一组3D观测，以其中心作为估计值，以其一致性判断landmark好坏。二是针对depth噪声特点设计自适应的虚拟相机位置来抑制噪声影响。这些方法不仅能提高RGBD/stereo特征点法SLAM的精度，还由于排除了outlier而减少计算量，提高运行速度。

Voxel Map for Visual SLAM

keyframe-based SLAM在tracking时一般用共视keyframe中的关键点与当前帧做匹配，这是一种heuristic，查到的关键点未必符合当前视野，也没考虑遮挡关系。本文提出用voxel hashing来索引特征点，对每个预测视角，用预先采样的点做raycast，在每根ray上查询最近的特征点。

keyframe还是存在的，用于BA。本文的hashing方法与keyframe同步更新，仅用于查找当前视野下的特征点。

Redesigning SLAM for Arbitrary Multi-Camera Systems

为了让SLAM能更好适应任意多相机系统（更少的参数），做了三个改进：

1. 自适应初始化，计算任意两个相机frustum之间的overlap（通过采样）判断是否形成stereo，来决定采用双目初始化还是5点法。

2. 基于熵自动选择keyframe，通过一帧图像带来的信息增量。

3. （见上一篇）把特征点同步存储在voxel map中（用hash table），这样每帧做PnP的时候就可以在voxel map里索引特征点，比在keyframe中索引得全面。

Hybrid Camera Pose Estimation with Online Partitioning for SLAM

对ORB-SLAM的改进，在tracking阶段，使用重叠区域进行Local BA

Estimation with Fast Feature Selection in Robot Visual Navigation

使用随机采样方法选择具有更多信息的特征点，同时保证了特征点的质量和计算复杂度

Practical Persistence Reasoning in Visual SLAM

对半动态环境进行建模,第一次工程化的使用persistence filter，跟踪特征点的去留

结构特征

Linear RGB-D SLAM for Atlanta World

在Atlanta World假设下，设计了一种完全利用平面信息的基于滤波的SLAM算法。

Lidar-Monocular Visual Odometry using Point and Line Features

基于点和线特征的单目SLAM，用LIDAR数据做点/线深度提取和scale矫正。

GPO: Global Plane Optimization for Fast and Accurate Monocular SLAM Initialization

使用平面信息进行初始化。

StructVIO: Visual-Inertial Odometry With Structural Regularity of Man-Made Environments

基于点和线特征，利用了Atlanta World假设的VIO系统设计。

特殊视觉特征

Ultra-High-Accuracy Visual Marker for Indoor Precise Positioning

设计了一种新的视觉marker，做室内定位，精度可以达到10cm

Ground Texture Based Localization Using Compact Binary Descriptors

针对地面纹理，设计一种特征提取和匹配的方式用于定位和全局重定位

VIO

Inertial-Only Optimization for Visual-Inertial Initialization

提出一种成功率更高、scale估计更准的VIO初始化方法。V和I分别优化（VO所给轨迹误差对IMU来说可以忽略），IMU优化过程中考虑了噪声分布，是MAP估计。已开源 ORB_SLAM3

Uncertainty-Based Adaptive Sensor Fusion for Visual-Inertial Odometry under Various Motion Characteristics

针对IMU测量存在退化的场景，设计了一种方法在纯图像模式和两种VIO模式（只用gyro和gyro+accel）之间自适应切换，避免低信噪比的IMU测量影响定位精度。

Hierarchical Quadtree Feature Optical Flow Tracking Based Sparse Pose-Graph Visual-Inertial SLAM

基于VINS-Mono开发了SPVIS，前端提出hierarchical quadtree方法提高optical flow feature tracking的性能，大幅降低需要的feature数量。后端采用固定时长的sliding window做全局优化，窗口之外仅保留pose graph。整个系统效率很高，从而支持长期运行。

Stereo Visual Inertial Odometry with Online Baseline Calibration

在S-MSCKF中加入对stereo baseline的在线估计。

OpenVINS: A Research Platform for Visual-Inertial Estimation

提出了一个VIO的综合性框架，包含了几乎所有的VSLAM的内容，EKF\cali\benchmark\VIO等。

直接法和稠密SLAM

FlowNorm: A Learning-based Method for Increasing Convergence Range of Direct Alignment

直接法优化中，当初始估计不好时很容易陷入局部最优。本文提出一种像素加权优化方法，通过比对每个像素的梯度方向和（CNN估计得到的）光流方向的一致性得到权重。在以DSO和BA-Net为基准的试验中能有效提升效果，可以容许更多的跳帧。

Robust RGB-D Camera Tracking using Optimal Key-frame Selection

基于RGBD的dense SLAM系统设计。前端有一个frame-to-model的tracking线程，自适应融合纹理定位（DVO）和结构定位（ICP）的结果输出初始pose；还有一个frame-to-frame的回环检测线程，用SIFT特征匹配和BOW检索得到当前帧与历史帧的关联输出给后端。后端在所有frame形成的pose graph中寻找一个子集进行优化（先当作set covering问题，找到邻域可以覆盖全部节点的最小节点子集，再用BFS添加节点使子集连通）。在TUM上定位精度不错。

Camera Tracking in Lighting Adaptable Maps of Indoor Environments

构造lighting adaptable map，估计光源的位姿，同时做tracking。

SLAM理论

Analysis of minima for geodesic and chordal cost for a minimal 2D pose-graph SLAM problem

作者发现SE2下，使用角度的残差，会引入周期性的local optim

The Complex-Step Derivative Approximation on Matrix Lie Groups

一种新的李群微分方法

SLAM评测

Closed-Loop Benchmarking of Stereo Visual-Inertial SLAM Systems: Understanding the Impact of Drift and Latency on Tracking Accuracy

在仿真环境中考察基于SLAM位姿估计进行控制的路径跟踪误差，称为闭环评测，其中位姿的精度和latency都会有影响。实验评估了五种算法，ORB等高延迟算法虽在开环评测中位姿精度很高，但闭环评测效果很差，作者先前提出的提升了latency的GF算法表现最稳定。

本文来源：知乎专栏空间智能

本文作者：史雪松

【欢迎大家提供行业新闻热点，商业合作请联系：18562613430】

免责声明：

凡本公众号注明“来源：XXX（非智车科技）”的作品，均转载自其它媒体，转载目的在于传递和分享更多信息，并不代表本平台赞同其观点和对其真实性负责，版权归原作者所有，如有侵权请联系我们删除。　

: ， . Video Mini Program Like ，轻点两下取消赞 Wow ，轻点两下取消在看

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

有些秘密注定只被少数人知道.....2024我们不再错过

豪放女乘客扯掉裤子当场“硬要”，的哥乖乖“束手就擒”……

提个醒：营养是鸡蛋的15倍，是牛奶的8倍，春夏多吃，免疫力明显提高，全家受益！

ICRA20中的SLAM论文汇总（一）VSLAM

数据集

特征点法

结构特征

特殊视觉特征

VIO

直接法和稠密SLAM

SLAM理论

SLAM评测

您可能也对以下帖子感兴趣

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

有些秘密注定只被少数人知道.....2024我们不再错过

豪放女乘客扯掉裤子当场“硬要”，的哥乖乖“束手就擒”……

提个醒：营养是鸡蛋的15倍，是牛奶的8倍，春夏多吃，免疫力明显提高，全家受益！

生成图片，分享到微信朋友圈

ICRA20中的SLAM论文汇总（一）VSLAM

数据集

特征点法

结构特征

特殊视觉特征

VIO

直接法和稠密SLAM

SLAM理论

SLAM评测

您可能也对以下帖子感兴趣