查看原文
其他

【源头活水】车辆意图预测中一种基于因果时间序列的域泛化方法



“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注。

来源:知乎—黄浴

地址:https://zhuanlan.zhihu.com/p/442999425

arXiv上2021年12月3日上传的论文“Causal-based Time Series Domain Generalization for Vehicle Intention Prediction”,作者来自伯克利分校
准确预测交通参与者的行为是自动驾驶车辆的基本能力。由于在动态变化的环境中导航,无论在何处以及遇到何种驾驶环境,都需要进行准确的预测。当自动驾驶车辆部署在现实世界中时,对未知域的泛化能力对预测模型至关重要。本文提出一种基于因果的时间序列域泛化(causal-based time series domain generalization,CTSDG)模型。构建一个车辆意图预测任务的结构化因果模型,学习用于域泛化的输入驾驶数据不变表征。进一步将递归潜变量 (latent variable) 模型集成到结构化因果模型中,更好地从时间序列输入数据中捕获时间潜在依赖性。
该文章被Neurips 2021的workshop on Distribution Shifts接收。
因果关系侧重于表示数据生成过程的结构知识,允许干预和更改,有助于理解和解决当前机器学习方法的一些局限性。事实上,结合或学习环境结构化知识的机器学习模型已被证明更有效,泛化效果更好。对于驾驶员来说,在不同域的交互方式也应该处理一些不变的结构化关系,因为这样可以快速调整驾驶技能以适应新的场景。因此,作者构建了一个用于车辆意图预测任务的结构化因果模型(SCM),以学习输入驾驶数据的不变表征,用于域泛化。
如图是CTSDG的框架图:其中观测量显示为阴影节点;潜量节点是透明的。有向黑边表示因果关系;虚线双向边表示相关性;空心虚线箭头表示包含关系。蓝线表示推理过程,绿线表示生成过程,红线表示递推过程。
域(D)包含地图属性的不同组合,如道路拓扑、速度限制和交通规则;事件(E)表示两个车辆交互事件相关的可观察变量,包括初始交互状态和交互长度等信息;驾驶员(O)表示每个驾驶员的驾驶偏好或驾驶风格相关的不可观察变量,例如攻击性级别和他/她是否遵守交通规则;因果特征(XC)表示驾驶员的个人行为O及其交互状态E中衍生出的高级时间相关因果特征,使用这些特征来标记意图;非因果特征(XNC)表示域相关特征,不仅包含域特定信息D,还包含事件E本身。例如交互事件信息,两辆车开始相互注意时或道路协商开始时,与道路几何和交通规则相关;输入数据(X)是包含序贯多变量数据的车辆交互轨迹,由因果特征XC和非因果XNC特征混合构成;潜变量(Z)表示从时间序列车辆交互数据中提取出与时间相关的潜表示;标签(Y)是车辆意图标签。
采用一个表征函数 q去映射输入空间到一个潜空间,一个假设函数映射潜空间到XC(因果特征)。合在一起,得到期望的意图预测器f,而对应的预测损失写成
XC(因果特征)需要满足一个不变性条件,考虑到驾驶员意图的不可观测性,得到一个预测损失函数如下:
上面匹配函数需要优化,假设XC不同域的相同类输入之间距离是受限的,可定义一个对比表征学习损失函数,最小化不同域的同类输入距离,即
作者把Variational Recurrent Neural Networks (VRNN)集成入CTSDG 模型,这样目标函数变成
最后的总目标函数为
如下是CTSDG的伪代码算法:
实验比较结果如下:
其中基准方法包括
传统域泛化任务的方法7个
  • ERM:Oracle Inequalities in Empirical Risk Minimization and Sparse Recover Problems,2011
  • IRM:Invariant risk minimization, 2019
  • CCSA:Unified deep supervised domain adaptation and generalization,2017
  • Mixup:mixup: Beyond empirical risk minimization,2017
  • DANN:Domain-adversarial training of neural networks. 2016
  • C-DANN:Deep domain generalization via conditional invariant adversarial networks,2018
  • VRADA:Variational recurrent adversarial deep domain adaptation,2017
行为预测任务的方法3个
  • CVAE:Desire: Distant future prediction in dynamic scenes with interacting agents,2017
  • GAN:Social gan Socially acceptable trajectories with generative adversarial networks,2018
  • GNN:Neural relational inference for interacting systems,2018
如下表是其中实验定义的域信息:
具体图示如下:
本文虽然展示了提出的用于车辆意图预测任务的域泛化方法性能,但CTSDG方法也可以直接或间接地用于轨迹预测任务。最直接的方法是将轨迹预测问题作为一组不同轨迹的分类,能够a)确保状态空间的预期覆盖级别,b)消除动态不可行的轨迹,以及c)避免模式崩溃问题。此外,意图分类的准确性在回归任务中起着重要作用。与无条件的预测相比,目标/意图条件轨迹预测可以改进智体联合和单个智体的预测。条件预测也可用于规划任务。因此,拥有一个准确域泛化的意图/目标预测器是开发最优轨迹预测器和运动规划器的前提。

本文目的在于学术交流,并不代表本公众号赞同其观点或对其内容真实性负责,版权归原作者所有,如有侵权请告知删除。


“源头活水”历史文章


更多源头活水专栏文章,

请点击文章底部“阅读原文”查看



分享、在看,给个三连击呗!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存