基于隐马尔科夫模型的道路匹配
随着导航定位、移动互联网等技术的快速发展,手机、车载定位装置等设备都可以进行地理空间数据采集。这些不同类型的地理空间数据往往能反映出某种规律。以时空轨迹为例,这些新形式的泛在地理空间数据,能够反映个体行为的时空特征,同时大量同类群体的共同模式也可以反映群体特征。其中,车载定位装置能够实时获取当前车辆的位置信息,成为时空轨迹大数据的重要数据来源。
地图匹配是时空轨迹数据处理分析中的关键技术,能够解决将轨迹数据匹配到道路网络的问题,从而基于轨迹点还原真实轨迹。如何能够快速、有效地实现地图匹配,成为轨迹数据分析的关键问题。为了提高轨迹点道路匹配的准确度,我们引入一个基于概率图的机器学习模型——隐马尔科夫模型。
道路匹配
地图匹配(Map Matching)是将一系列有序的轨迹位置点关联到实际路网的过程,可以看作是轨迹数据处理的一项数据预处理任务,可以服务于后续轨迹线计算与分析工作的开展。
地图匹配示意图
然而由于通信异常、定位误差等原因,很难保证轨迹点与路段完全吻合,如果不进行地图匹配,那么行动轨迹可能偏离路网(例如定位到路边建筑、或者池塘里等)。直接将轨迹点关联到最近路段上的方法,由于匹配逻辑较为简单,往往匹配效果不佳。例如当存在多条邻近道路时,根据最近距离的匹配往往会得到不符合预期的匹配结果路段。
相关研究人员面向该问题进行了多种方法的建模,目前应用较多的就是基于隐马尔科夫模型(HMM)的匹配,其正确率验证在一定条件下都已经能够达到90%以上。
轨迹点关联路段
隐马尔科夫模型
隐马尔科夫模型由状态集、观测集、初始状态转移概率、状态转移概率,以及发射概率确定。
HMM模型
隐马尔科夫模型能做什么呢?
1、概率计算问题,已知模型参数,计算某一特定输出序列的概率;
2、学习问题,使得该模型下观测序列的概率最大;
3、预测问题,求解一条使得该观测序列概率最大的隐状态序列。
而基于隐马尔科夫模型的道路匹配就是结合了2、3问题,即用一种动态规划算法来求解概率最大路径,即计算出概率最大的匹配路线。
基于隐马尔科夫模型的地图匹配
基于隐马尔科夫模型(HMM)的地图匹配,是在给定一定观测前提下,寻找产生这一观测序列的隐藏序列,其中隐藏序列表示持有定位装置的人或物所在的具体位置,观测序列表示定位装置产生的一系列轨迹点坐标。即通过该模型,从轨迹点(即观测序列)推算真实位置(即隐藏序列)。
在基于HMM的地图匹配算法中,对于一个轨迹点在一定距离内会有一个或多个候选路段,轨迹点在这些候选路段上的投影点视为候选点,在马尔科夫链中作为顶点,轨迹点离旁边路段上的位置越近,那么这个点在这个路段上的概率越大。前后两个真实的位置点的距离越近,那么状态转移的概率越大,或者真实路段上的前后两个点的距离与轨迹点观测的前后两个点的距离越接近,状态转移概率越大。
基于隐马尔科夫模型的地图匹配算法原理
我们在SuperMap iDesktopX 10i(2020)中,可以利用轨迹分析相关工具构建完整的地图匹配流程,最终得到匹配路线。
构建地图匹配流程
基于HMM的地图匹配结果
在进行地图匹配计算时,可以通过匹配正确率和错误率来评价匹配效果:
我们也基于开放的ACM国际比赛中的数据进行了指标计算,结果表明基于隐马尔科夫模型的地图匹配精度可以达到97%。
如今,轨迹数据的处理与分析已成为GIS中的常见任务,而地图匹配是其中的一个关键问题,我们可以对原有算法进行升级优化,引入更先进、效果更优的机器学习模型,服务于复杂场景下的匹配。该功能目前在警务、交通等行业项目中已有诸多应用。未来,我们也将继续尝试各种AI模型与GIS空间分析任务的有效结合。
文/大数据与AI研发中心 郑美玲
欢迎转载~