公交客流预测的主要步骤及相关模型算法
公交客流预测步骤及模型简介
把握公交客流变化规律、开展公交客流预测工作可提高公交调度精准度及乘客满意度,同时提高企业资源利用效率。下面我们简要介绍公交客流预测步骤及目前研究较多的一种模型。
(一)主要步骤
1.
数据获取:
需获取的数据源主要包括:公交乘客支付流水数据、GPS到离站数据、发车间隔等公交内部数据,此外,为了提高预测准确度,还需采集对客流影响较大的外部因素的相关数据,如:天气、温度、是否工作日、节假日等。
2.
客流影响因素分析:
公交内部对客流影响较大的因素主要包括:线路走向、站点覆盖、发车间隔、运营速度、车辆设施、服务态度、运营安全等,这些因素会影响市民对公交这一出行方式的体验感、获得感及忠诚度;从公交系统外部分析来看,天气、温度、日期类型及其他交通方式的便捷度是影响市民出行选择的重要因素,冬季大雪低温天气下的公交客流较平常增多,春节期间客流较平常下降明显。
图1 12月份公交客流变化图(部分日期)
各因素对公交客流影响程度大小的判断可以采用相关系数计算、主成分分析、回归分析、时间序列分析等方法,以确定影响程度较大的内外部因素,这些因素可在建模预测过程中提高模型性能。
3.
模型构建:
以深度学习模型为例,建模过程如下:首先,确定模型输入、输出数据,并对数据预处理,预处理主要包括缺失值、异常值的处理及数据整合、客流影响因素的特征提取等;其次,根据数据复杂度选择合适的模型进行建模;模型建立后,可借助贝叶斯优化、遗传算法等确定模型参数或多次实验手动调参;之后,可借助准确率等指标评估模型性能,当准确率较高时建模完成。高性能模型的建立是不断迭代的过程,需多次调整模型及参数优化。
(二)相关模型算法介绍
根据相关文献统计,目前常用的公交客流预测模型包括:传统统计模型、机器学习模型及深度学习模型,其中传统统计模型基于统计学原理进行预测,主要包括线性回归、逻辑回归、时间序列分析等;机器学习模型利用计算机算法自动学习数据特征、进行模型优化,主要包括决策树、支持向量机等;深度学习模型相对有更好的泛化能力,可以处理较复杂的任务,主要包括卷积神经网络、循环神经网络等。下面简单介绍研究应用较多的深度学习预测模型——长短期记忆网络(LSTM)。
LSTM是一种特殊的循环神经网络,模型的核心结构包括三个门控单元:遗忘门、输入门和输出门,遗忘门控制上一时刻的单元状态需要遗忘多少信息,输入门控制当前时刻的候选状态有多少信息需要保存,输出门控制当前时刻的内部状态有多少信息需要输出给外部。该模型的建模预测流程如下:
图2 LSTM建模预测流程
LSTM模型在时间序列预测、自然语言处理、语音识别及手写识别等领域应用广泛,该模型将时间序列属性纳入其结构中,可以对公交客流量随时间序列的变化进行深层次的训练和特征提取。通过建立高性能模型,其预测结果可为公交企业掌握未来期客流变化特征提供数据支撑,从而指导运营调度工作、提高公交吸引力。
参考文献:
[1]刘妙男,王魏,胡显辉等.基于因果卷积和Informer模型的城市公交客流预测[J/OL].控制工程,1-10[2023-12-21].
[2]严春荣.降雨天气下的城市公交客流预测及调度优化[D].西安建筑科技大学,2023.
END
更多阅读