更精准的时空预测模型:混合时空图卷积网络
导读
时空预测在天气预报、运输规划等领域有着重要的应用价值。交通预测作为一种典型的时空预测问题,具有较高的挑战性。以往的研究中主要利用通行时间作为模型输入,很难预测整体的交通状况,本文提出的混合时空图卷积网络,利用导航数据大大提升了时空预测的效果(本文作者高德机器学习团队,论文已被收录到KDD2020)。
论文下载地址:https://arxiv.org/abs/2006.12715
日常通勤中的规律往往相对容易挖掘,但交通状况还会受很多其他因素影响,之前的研究主要利用通行时间作为特征,少量引入事件,不能很好地预测实际交通流量。
为解决这一问题,本文从高德导航引擎中获取了「计划中交通流量」,并将其扩充到机器学习模型当中。
计划中交通流量来自导航数据,反映了用户出行意图中蕴含的未来交通流量。由于拥有海量用户,高德地图中的导航规划数据能够较为全面地反应正在发生的通行需求,并且信息粒度较事件级别的特征更精细。
具体来说,规划的路线产生了计划中交通流量,而计划中交通流量可以用来指导对未来通行时间的预测。volf代表当前可获取的导航路径在f个时间步后在此路段产生的计划中交通流量。计划中交通流量的迅速飙升意味着即将到来的交通拥堵。
图 1 北京某路段在2019年10月28日早高峰期间通行时间和计划中交通流量
为了将交通流量这一异质信号整合到通行时间预测模型当中,我们创新性地设计出一种域转换器(domain transformer)结构,用于将交通流量信息转化为通行时间信息。
交通流理论中,路段的交通流量和车辆密度呈三角形曲线映射关系,而曲线的参数是因路段而异的。图2展示了现实世界中的例子。为了利用这一转换关系,我们设计了将流量转化为通行时间的转换器,该转换器由两层网络构成,分别用于提取全局共享信息和学习不同路段的精细化信息。
图 2 四个不同路段的流量时间曲线
另一方面,由于交通网络的非欧几里得特性,我们利用图卷积(graph convolution)结构提取空间依赖性特征,并设计了一种新的邻接矩阵用于更好地体现路段间的交通邻近性。
在以往的研究中[6],邻接矩阵的权重只按距离衰减,并没有考虑到路段间固有的交通邻近性(图 3 给出了距离近但交通状态相差较大的例子)。为解决这一问题,我们设计了一种复合邻接矩阵(compound adjacency matrix),在距离衰减的基础上进一步引入了路段通行时间的协方差。
图 3 相邻道路间拥堵不一定会传播
本文提出的混合时空图卷积网络(Hybrid Spatio-Temporal Graph Convolutional Network,H-STGCN)是综合利用上述技术的交通预测框架。
在H-STGCN中,转换器将未来交通流量信号转化为通行时间信号。路段间参数共享的门控卷积用于提取时间依赖信息。
基于复合邻接矩阵的图卷积从合并后的通行时间信号中捕捉空间依赖信息。H-STGCN经由端到端的训练,可具备基于计划中交通流量信息预测未来拥堵的能力。利用真实交通数据集进行实验可验证,H-STGCN的效果显著优于各种前沿模型。
混合时空图卷积网络,独创域转换器和复合邻接矩阵
整体框架
模型输入与数据处理
H-STGCN中,与预测时间窗口相对应的理想未来流量和历史平均流量同时被输入:
其中是路段的索引号。
通行时间 。通行时间通过完成地图匹配的GPS点数据整合计算得到。H-STGCN中,通行时间及其与预测时间窗口相对应的历史均值同时被用于模型的输入:
其中是路段的索引号。
域转换器
域转换器由串联的两层网络组成,即逐路段卷积(segmentwise convolution)和路段间共享卷积(shared convolution),图 4 呈现了这一结构。
共享卷积。路段及时间片间参数共享的卷积层位于域转换器的顶部,该卷积运算阐释如图 6a,旨在捕捉全局的三角形曲线映射关系。记这一层的输入和输出为与,则有:
其中为权重,为偏置项,为ELU(Exponential Linear Unit)激活函数。
逐路段卷积。为保证模型能够充分提取精细到路段级别的特征,路段参数个性化的卷积层位于域转换器的底部(共享卷积前面一层),该卷积运算阐释如图 6b。记这一层的输入和输出为与,则有:
其中,为权重,为偏置项,是ELU激活函数。
基于复合邻接矩阵的图卷积
复合邻接矩阵。以往研究[6,7]中的邻接矩阵假设节点间的接近性简单地依距离衰减:
其中为路段与的最短路距离,控制衰减速率,为控制矩阵稀疏性的截断阈值。我们将称为迪杰斯特拉矩阵(Dijkstra matrix)。在很多场景下,单纯的空间接近程度并不能反映真实的交通邻近性。更具体而言,交通拥堵对交通分流的影响取决于邻近路段的若干种属性,包括道路等级、路况等。可见,拥堵的传播在空间上并不均匀。由此,我们提出了复合邻接矩阵:
图卷积 。我们将交通路网视为一个以路段为节点的图。归一化图拉普拉斯(normalized graph Laplacian)矩阵和缩放变换的图拉普拉斯(scaled graph Laplacian)矩阵分别表示为:
其中为单位阵,为复合邻接矩阵,对角阵为的度矩阵(degree matrix),是的最大特征值。图卷积层通过的切比雪夫多项式(Chebyshev polynomials)参数化。记这一层的输入和输出为
则:
其中,是切比雪夫多项式第阶项,K是卷积核大小,为权重张量,为偏置项,是ELU激活函数。
时域门控卷积
如图 6c 所示,路段间参数共享的一维卷积将输入转化为张量:
其中表示一维卷积运算符。是卷积核,是卷积核的大小,是输入时序长度,是偏置项。和形状相同、通道数均为。我们使用GLU(gated linear unit)进一步引入非线性:
“”表示哈达玛积(Hadamard product)。
与STGCN的关系
时空图卷积网络(Spatio-Temporal Graph Convolutional Network,STGCN)[7]将空域图卷积层和时域门控卷积层交替地进行堆叠以同时捕捉时间和空间的依赖性。将H-STGCN的流量特征分支和邻接矩阵中的协方差项去掉,则H-STGCN退化为只有单个时空卷积块(ST-Conv block)的STGCN模型。
模型训练
数据扩充 。我们将高斯噪音叠加到流量通道中小于的值上,以提升模型的泛化能力。
优化目标 。对于本文中的多时间步预测,我们使用L1损失函数:
其中是模型的输出,为真值。
基于真实路况测试,各项指标均优于传统模型
基于真实路况测试,各项指标均优于传统模型
STGCN (Im):换用复合邻接矩阵的STGCN(用于和原始的迪杰斯特拉矩阵对比。 H-STGCN (1):将流量特征张量V全部设成1。
全测试集(如4.1节中所描述)。 高流量路段的拥堵时期,用C表示。 高流量路段的突发拥堵时期,用尾缀NRC表示。
未来将在主动交通方面发挥重要作用
主要参考文献:
[1] Yaguang Li, Rose Yu, Cyrus Shahabi, and Yan Liu. 2018. Diffusion convolutional recurrent neural network: Data-driven traffic forecasting.
[2] YishengLv, YanjieDuan, WenwenKang, Zhengxi Li, Fei-Yue Wang, etal. 2015. Traffic flow prediction with big data: A deep learning approach. IEEE Trans. Intelligent Transportation Systems 16, 2 (2015), 865–873.
[3] Bing Yu, Haoteng Yin, and Zhanxing Zhu. 2018. Spatio-Temporal Graph Convolutional Neural Network: A Deep Learning Framework for Traffic Forecasting. In Proceedings of the 27th International Joint Conference on Artificial Intelligence (IJCAI).
[4] JingruiHe, WeiShen, Phani Divakaruni, Laura Wynter, and Rick Lawrence. 2013. Improving Traffic Prediction with Tweet Semantics. In Proceedings of the 23rd International Joint Conference on Artificial Intelligence (IJCAI). 1387–1393.
[5] Binbing Liao, Jingqing Zhang, Chao Wu, Douglas McIlwraith, Tong Chen, Shengwen Yang, Yike Guo, and Fei Wu. 2018. Deep Sequence Learning with Auxiliary Information for Traffic Prediction. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. ACM.
[6] Yaguang Li, Rose Yu, Cyrus Shahabi, and Yan Liu. 2018. Diffusion convolutional recurrent neural network: Data-driven traffic forecasting.
[7] Bing Yu, Haoteng Yin, and Zhanxing Zhu. 2018. Spatio-Temporal Graph Convolutional Neural Network: A Deep Learning Framework for Traffic Forecasting. In Proceedings of the 27th International Joint Conference on Artificial Intelligence (IJCAI).
[8] Moshe Ben-Akiva, Michel Bierlaire, Haris Koutsopoulos, and Rabi Mishalani. 1998. DynaMIT: A simulation-based system for traffic prediction. In DACCORD Short Term Forecasting Workshop. Delft, The Netherlands, 1–12.
[9] Wei, H., Zheng, G., Yao, H. and Li, Z., 2018. Intellilight: A reinforcement learning approach for intelligent traffic light control. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining.
[10] https://en.wikipedia.org/wiki/Congestion_pricing