其他
基于Bi-LSTM模型的轨迹异常点检测算法
近年来,大量移动目标的时空轨迹数据呈爆炸式的增长。轨迹数据是由一系列的通过多种定位手段得到的时空数据点(经度、纬度和时间)组成,其中蕴藏着丰富的有价值的目标活动信息。轨迹数据挖掘分析在学术科学领域、商业应用领域和政府管理领域都具有重大现实意义。
然而,由于定位技术的局限和外界干扰因素的影响,轨迹数据在现实环境下从来都不是完全准确的,数据中总是存在与其邻近大部分轨迹点在运动特征上有显著差异的不合理的采样点,这些点称为轨迹异常点,这严重影响了轨迹数据的质量和后续知识发现过程的精度。因此,轨迹异常点检测是轨迹数据挖掘前至关重要的一步。
以实验室现有的船舶轨迹数据为研究对象,中科院电子所黄廷磊研究员团队提出了基于双向长短时记忆网络(Bi-LSTM)的轨迹异常点检测算法。算法将问题转化为有监督的分类问题,首先对每个轨迹点提取运动特征向量,选取一段时间的轨迹数据特征向量作为模型的输入,模型输出为轨迹点的类型结果。实验结果表明,Bi-LSTM能够自动学习异常点和正常点在抽象特征空间上的差异,检测性能显著优于恒定速度阈值法、不考虑数据时序性的经典机器学习分类算法和卷积神经网络模型。
该工作已发表在《雷达学报》2019年第1期“基于Bi-LSTM模型的轨迹异常点检测算法”(韩昭蓉,黄廷磊,任文娟,许光銮)。
图1 Bi-LSTM模型
该文首先描述了轨迹点运动特征的提取,接着说明了Bi-LSTM的原理和具体的模型构建(图1),在实验部分分别介绍了数据集、评价指标和实验参数设置,最后对比了Bi-LSTM模型与传统机器学习分类方法的检测性能。在实际船舶轨迹数据集上,实验验证了该算法的有效性(图2)。
图2 ROC曲线对比图
了解详细内容请点击下面阅读原文。