【精彩论文】基于互补集合经验模态分解和长短期记忆神经网络的短期电力负荷预测

Original 中国电力中国电力 2023-12-18

基于互补集合经验模态分解和长短期记忆神经网络的短期电力负荷预测

赵会茹, 赵一航, 郭森

（华北电力大学经济与管理学院，北京 102206）

摘要：随着电力行业的不断发展，负荷预测的重要性也不断彰显，作为负荷预测的重要组成部分，短期负荷预测对于电力系统的调度运行、市场交易都有着重要的意义，精确的负荷预测有助于提高发电设备的利用率和经济调度的有效性。由于影响负荷数据的随机因素太多且具有较强非线性的特点，提出一种基于互补集合经验模态分解和长短期记忆神经网络的短期电力负荷预测方法。通过对某市负荷数据进行仿真，将仿真结果与其他传统预测方法结果相对比，最终证明长短期记忆神经网络模型的误差更低，具有较高的预测精度。同时将互补集合经验模态分解下的长短期记忆神经网络方法与其他分解方法下的长短期记忆神经网络模型预测结果进行对比，验证互补集合经验模态分解方法对提升预测精度的有效性。

引文信息

赵会茹, 赵一航, 郭森. 基于互补集合经验模态分解和长短期记忆神经网络的短期电力负荷预测[J]. 中国电力, 2020, 53(6): 48-55.

ZHAO Huiru, ZHAO Yihang, GUO Sen. Short-term load forecasting based on complementary ensemble empirical mode decomposition and long short-term memory[J]. Electric Power, 2020, 53(6): 48-55.

引言

电力系统负荷预测是根据电力负荷、经济、社会、气象等的历史数据，探索电力负荷历史数据变化规律对未来负荷的影响，寻求电力负荷与各种相关因素之间的内在联系，从而对未来的电力负荷进行科学的预测^[1]。电力负荷预测根据预测期限的不同，可分为长期、中期、短期以及超短期。目前常用的短期负荷预测方法主要分为两类：统计学模型与机器学习模型。统计学模型包括回归分析法^[2]、时间序列法^[3]以及累计式自回归动平均模型^[4]。由于统计学方法所构建的模型较为简单，对于数据的平稳性要求较高，处理大量非线性数据时精度较低，容易产生较大误差，因此，更多的学者使用机器学习模型进行预测。机器学习模型主要包括人工神经网络^[5]、支持向量机^[6]以及随机森林^[7]等。为解决数据的随机波动性，将数据分解方法加入预测过程中，文献[8]结合经验模态分解和改进的支持向量机模型进行短期负荷预测，文献[9]基于集合经验模态分解和随机森林对月度负荷进行预测，文献[10]针对风速难以准确预测的情况，提出了一种基于互补集合经验模态分解和最小二乘支持向量机的风速预测模型。虽然以上学者将数据分解方法与机器学习方法进行结合，然而由于浅层预测模型的结构相对简单，往往预测精度不高。随着电力行业的发展、电力市场的改革以及电网技术的革新，电力负荷预测的精准度也同步提升，深度学习逐步引入电力负荷预测中，有效解决现有浅层预测模型对大量非线性负荷数据潜在特性的认知能力不足、人为因素干扰等问题。文献[11]将气象因素以及历史负荷作为输入变量，提出一种栈式自编码神经网络深度预测方法。文献[12]基于Nadam动量优化算法训练的深度信念网络，对变电站进行高精度负荷预测。文献[13]基于受限玻尔兹曼机的递归神经网络对电力系统的短期负荷进行预测，并与其他神经网络方法进行对比，通过对比平均百分误差以及均方差证明其方法优越性。文献[14]基于关联模糊神经网络，通过改进的蜂群优化算法对参数优化进行负荷预测。文献[15]应用张量流深度学习框架构建了长短期记忆神经网络模型，对电力负荷时序数据进行回归预测。以上文献却未加入数据分解方法处理数据，导致预测精度仍有待提升。

综合前人相关研究成果，本文提出一种基于互补集合经验模态分解（complementary ensemble empirical mode decomposition，CEEMD）和长短期记忆神经网络（long short-term memory，LSTM）的短期电力负荷预测，一方面采用分解效果较好的CEEMD方法处理数据，另一方面借助LSTM复杂的网络结构进行实证仿真。通过与几种传统方法对比证明本文所提出的方法具有较高精度。

1 互补集合经验模态分解

1.1 经验模态和总体经验模态分解

作为一种自适应正交基的时频信号处理方法，经验模态分解方法（empirical mode decomposition，EMD）针对非线性非平稳时间序列，不需要做预先的分析与研究，可以直接将数据进行分解并重构成多个本征模态函数（intrinsic mode function，IMF）^[16]。在实际信号中一旦出现间歇性信号，采用EMD便会出现模态混叠的现象，具体的表现为一个IMF分量中存在多个尺度成分，或者是一个尺度成分在多个IMF分量中存在，使得各个IMF表征不够清晰，无法判断各个IMF的含义。因此，在EMD的基础上，提出了总体经验模态分解方法（ensemble empirical mode decomposition，EEMD）^[17]，该方法通过在信号中加入白噪声，改变信号极值点的分布，得到符合信号特征的上下包络线，从而消除模态混叠效应。

1.2 CEEMD分解

EEMD可以有效降低模态混叠现象的发生，但也带来了新的问题。引入高斯白噪声，不可避免地会产生一定的冗余噪声，导致EEMD在分解过程中存在一定的重构误差。因此，文献[18]提出了一种互补集合经验模态分解方法，在原有方法EEMD的基础上进行改进，通过在信号当中加入成对符号相反的噪声，有效避免了出现冗余噪声的现象，不但有效减少了剩余噪声的数量，同时也能提高计算精度、节省计算时间。该方法步骤如下。（1）在原始信号中加入 n 组符号相反的噪声信号，可表示为

式中：x(t) 为原始信号；为正噪声；为负噪声。

（2）添加噪声信号的EMD分解产生加入正负噪声后的本征模态函数分量。

（3）CEEMD分解得到的第 j 个IMF分量为

2 长短期记忆神经网络模型构建

2.1 循环神经网络

循环神经网络（recurrent neural network，RNN）是一种对序列数据建模的神经网络，其层内、层与层之间的信息可以双向传递，更高效地传递信息。RNN中的每一个神经元的输出与前面的输出具有一定关系，隐藏层之间的节点具有连接，因此RNN具备了记忆功能。图1为RNN的典型结构。

图1 循环神经网络结构Fig.1 Recurrent neural network structure
RNN的基本结构可以表示为

式中：h_t 为新的目标状态；h_t₋₁为前一状态；x_t 为当前输入向量；f_w 为权重参数函数。目标值的结果与当前的输入、上一时刻的结果呈现一定函数关系。尽管RNN具备一定记忆功能，但其隐含层构造简单，时间跨度较大，很容易产生长期依赖问题^[19]，从而出现生梯度消失或梯度爆炸现象^[20]，因此RNN无法学习过长的信息。2.2 长短期记忆神经网络（LSTM）

LSTM是一种时间循环神经网络，相比于传统的循环神经网络，它可以有效解决梯度爆炸以及梯度消失问题。LSTM由一组称之为记忆块的循环子网构成，每个记忆块由输入门、遗忘门以及输出门组成，图2为LSTM结构。

图2 长短期记忆神经网络结构

Fig.2 Long short-term memory structure

输入门由 t 时刻输入值 x_t 和 t−1 时刻隐藏层输出 h_t₋₁共同决定，由 t 时刻输入值 x_t 和 t−1 时刻隐藏层输出 h_t₋₁ 共同决定。输入门 i_t 和记忆单元的候选状态

计算公式为

式中：w_i 为 t 时刻输入门 i_t 的权值矩阵；w_c 为 t 时刻候选状态的权值矩阵；b_i,b_c 为偏置量；σ 采用Sigmoid激活函数；tanh表示tanh激活函数。

遗忘门由 t 时刻输入值 x_t 和 t−1 时刻隐藏层输出 h_t₋₁ 共同决定。遗忘门 f_t 的表达式为

式中：w_f 为t时刻遗忘门 f_t 的权重矩阵；b_f 为偏置量。

记忆单元通过输入门 i_t 和遗忘门 f_t 对自身状态 c_t₋₁ 和当前候选记忆状态值进行调节来更新记忆单元状态。记忆单元状态值 c_t 的更新计算公式为

输出门由 t 时刻输入值 x_t 和 t−1 时刻隐藏层输出 h_t₋₁ 共同决定。输出门o_t 的计算公式为

式中：w₀ 为 t 时刻输出门 o_t 的权值矩阵；b₀ 为偏置量。

隐藏层输出值由 t 时刻输出值 o_t 和记忆单元状态值 c_t 共同决定。隐藏层输出值 h_t 的计算公式为

可见，LSTM的3种门分别执行不同的功能，从而对历史信息深度学习，并根据历史状态不断更新调节输出。因此在处理时间序列数据方面，LSTM具有较好的效果。

2.3 Adam优化算法

由于LSTM结构的复杂性，导致在处理大量数据时梯度不够精确，从而影响预测的结果，因此采用Adam算法优化权重。Adam算法基于低阶矩的自适应估计，通过计算梯度的一阶、二阶矩估计，从而为梯度设定相应的学习率，使得Adam算法更好地适用于非平稳的目标实现^[21]。Adam算法既提高了运算效率，同时占用的内存较少，同比于随机梯度下降（stochastic gradient descent，SGD）^[22]、自适应梯度算法（adaptive gradient algorithm，AdaGrad）^[23]、均方根支柱（root mean square prop，RMSProp）^[24]等优化算法要略胜一筹，Adam算法也是目前深度学习中最流行的优化方法。

Adam算法流程如下。

（1）设定初始学习率 α 、一阶矩向量 β₁ 、二阶矩向量 β₂ 和最大迭代次数 t_max 。初始化神经网络权重参数 θ₀ 、一阶矩估计 m₀ 和二阶矩估计 v₀ ；

（2）计算目标函数的梯度 g_t 为

（3）计算一阶矩估计 m_t 和二阶矩估计 v_t 为

（4）计算偏差修正后的一阶矩估计和二阶矩估计为

（5）更新学习率 α_t 和参数 θ_t ，重复以上步骤直至达到最大迭代次数t_max 。

3 短期电力负荷预测框架

为了更好满足电力系统的需求，短期电力负荷预测应综合考量历史负荷数据、温度、湿度等气候条件以及日类型。短期负荷预测具有明显的周期性，不同日之间24 h的整体变化规律呈现一定的相似性，不同周同一星期类型日的相似性以及工作日与休息日各自的相似性。图3为本文短期电力负荷预测模型。

图3 短期电力负荷预测模型

Fig.3 Short-term power load forecasting model

如图3所示，将历史负荷按照日类型分为工作日与休息日，并构建两个数据集。将日类型和CEEMD分解后的历史负荷数据进行数据预处理，处理后的数据作为LSTM模型的输入变量，将变量引入通过Adam优化权重后搭建好的LSTM模型中，得到最终的预测结果。将预测结果与实际观测值、其他预测方法得到的预测值进行对比，得出最终结论。

4 数据处理及实证分析

4.1 数据归一化处理

由于LSTM等机器学习方法对数据尺度较为敏感，若数据不经过处理，会对学习的效果产生较大影响，因此采用MinMax法对数据进行归一化处理，将数据值域统一为[0,1]，其计算公式为

式中：x_norm 为归一化处理后的数据；x_min,x_max分别为数据的最小值与最大值。

4.2 数据评价标准

为检验预测精度，需采用一定评价标准。本文采用平均绝对值百分误差（mean absolute percentage error，MAPE）作为数据评价标准。

式中：ε_MAPE为平均值百分误差；

分别为实际值与预测值。

4.3 实证分析

本文电力负荷数据、温度湿度等气象条件数据来源于某市2018–04–01—05–31，以1 h作为时间间隔，共计1 464个数据。将数据按照日类型进行分类，星期一到星期五作为工作日样本集，共1 056个数据。星期六及星期日作为休息日样本集，共408个数据，每个样本集选取前90%的数据作为训练样本，后10%的数据作为检验样本。LSTM模型设置为一层，隐藏神经元数目为200。Adam算法参数设置为最大迭代次数600，初始学习率0.005，在经过125轮训练后通过乘以影响因子0.2来降低学习率，为防止梯度爆炸，设定梯度阈值为1。实证分析所使用的计算机配置为i5-8300H处理器，8 GB的内存，训练环境为GPU，仿真平台为Matlab2018b版本。为了验证本文提出的CEEMD-LSTM方法的优越性，分别从两个维度进行对比验证。首先选取支持向量机（least square support vector machine，LSSVM）、后向传播神经网络（back propagation neural network，BP）、自回归移动平均模型（autoregressive integrated moving average，ARIMA）等方法对工作日样本集和休息日样本集分别进行预测。其中LSSVM和ARIMA以样本集的前90%数据作为训练集，后10%数据作为测试集；BP神经网络以前75%数据作为样本集，15%数据作为检验集（验证模型是否过拟合），后10%数据作为测试集。将这3种模型以及LSTM模型的测试结果与原始负荷相对比，得到每一个模型不同日类型样本集的平均百分误差，并测算全数据平均百分误差。各模型实验误差如表1所示，预测曲线如图4、图5所示。

表1 各模型实验误差

Table 1 Mean absolute percentage error of each model

图4 各模型工作日负荷预测

Fig.4 Working day load forecast for each model

图5 各模型休息日负荷预测

Fig.5 Day-off load forecast for each model

由表1以及图4、图5可以看出，LSSVM模型的测试误差最大，分别为12.25%、15.15%、13.05%；BP神经网络模型的测试误差相较LSSVM一定幅度下降，分别为8.39%、7.90%、8.25%；相比于BP神经网络，ARIMA模型工作日样本集精度较高，约为3.36%，然而在面对较小的样本集“休息日样本集”，随机波动带来的误差更为明显，约为10.61%，但综合两个样本集得到的全数据误差要小于BP神经网络的误差，为5.36%；LSTM模型的精度明显高于以上3种模型，各项误差分别为1.19%、1.41%、1.25%，可见LSTM模型对数据拟合效果以及预测精度要远好于其他几种模型。同时综合两类样本集，除BP神经网络外，其他几种模型对工作日样本集的预测效果皆优于休息日样本集，证明休息日相较于工作日受随机波动的影响更大一些。其次，选取EEMD-LSTM和CEEMD-LSTM与传统的LSTM相对比，对历史负荷进行CEEMD分解，为方便显示，图6仅展示休息日样本集分解重构后的结果。

图6 CEEMD分解结果

Fig.6 CEEMD decomposition results

由图6不难看出，IMF₁~IMF₃数据波动性较大，IMF₄~IMF₅波动较为平缓但周期较长，随机性较低，IMF₆~IMF₉以及残差项r相对较为平滑。CEEMD选用的高斯白噪声的标准差为0.2，添加白噪声的次数为100次，本征模函数的上限值设为9。将分解后的数据重构，得到图7。

图7 重构后结果Fig.7 Recombined results

对比EEMD-LSTM和CEEMD-LSTM与传统的LSTM，模型实验误差如表2所示，预测曲线如图8、图9所示。

表2 各分解方法下的LSTM模型实验误差

Table 2 Mean absolute percentage error of LSTM model decomposed by different methods

图8 各分解方法下的LSTM模型工作日负荷预测

Fig.8 Working day load forecast for LSTM model decomposed by different methods

图9 各分解方法下的LSTM模型休息日负荷预测

Fig.9 Day off load forecast for LSTM model decomposed by different methods

由表2以及图8、图9可以看出，传统的LSTM模型的测试误差最大，分别为1.19%、1.44%、1.26%；EEMD-LSTM模型误差有所下降，分别为0.67%、0.97%、0.75%；CEEMD-LSTM模型的精度明显高于以上2种模型，各项误差分别为0.25%、0.51%、0.32%，可见CEEMD这种分解方法带来的预测精度要高于不使用分解方法的LSTM模型和经过EEMD分解的LSTM模型。

5 结论

本文基于CEEMD-LSTM方法，综合考虑温度湿度等气象条件、日类型以及历史负荷的影响，对短期电力负荷进行预测，结论如下。

凭借LSTM模型独特的网络结构以及记忆存储遗忘功能，对短期电力负荷进行预测。根据实证分析结果可见，同比与其他传统模型，LSTM具有较好的拟合效果，可以有效提高预测精度。

在应用LSTM模型过程中，采用Adam算法优化网络权重参数，大大缩短了预测时间的同时也保证了预测的稳定性，避免出现梯度爆炸或梯度消失现象。

采用CEEMD数据分解方法，同比于其他分解方法，预测精度有明显的提升。

本文所提出的CEEMD-LSTM组合方法在解决短期负荷预测方面具有较高精度，下一步可调整时间尺度至中长期或是超短期负荷预测，也可在点预测基础上进一步拓展至概率密度预测及区间预测。

（责任编辑　杨彪）

作者介绍

赵会茹(1963—)，女，教授，博士生导师，从事电力市场理论及应用技术研究，E-mail: huiruzhao@163.com;

★

赵一航(1997—)，男，硕士研究生，通信作者，从事电力市场理论及应用技术研究，E-mail: 1182206105@ncepu.edu.cn;

★