基于CNN-GRU的光伏电站电压轨迹预测
冯裕祺1 , 李辉1,2 , 李利娟1 , 周彦博1 , 谭貌1 , 彭寒梅1
(1. 湘潭大学 自动化与电子信息学院,湖南 湘潭 411105; 2. 湘潭大学 多能协同控制技术湖南省工程研究中心,湖南 湘潭 411105)
摘要: 光伏电站出力随机性易引发并网点电压大幅度波动,通过趋势预测提前调控是提高电压稳定性的有效途径。为了提升电压趋势预测精度,提出一种基于卷积神经网络(convolutional neural networks,CNN)和门控循环单元(gated recurrent unit,GRU)的电压轨迹预测方法。首先,通过采集单元提取电压数据构建时间序列;然后,计算电压时间序列的自相关系数及其与外部变量间的最大信息系数(maximal information coefficient,MIC),分析电压时间序列与外部变量在时序上的关联性;再通过CNN网络提取输入数据的高层特征;最后输入至GRU网络完成电压轨迹预测。通过某地光伏电站实测数据进行验证,结果表明:本文模型与GRU、长短期记忆网络(long short-term memory,LSTM)、CNN-LSTM、支持向量回归(support vector regression,SVR)等模型相比预测准确度更高。
引文信息
冯裕祺, 李辉, 李利娟, 等. 基于CNN-GRU的光伏电站电压轨迹预测[J]. 中国电力, 2022, 55(7): 163-171.
FENG Yuqi, LI Hui, LI Lijuan, et al. Voltage trajectory prediction of photovoltaic power station based on CNN-GRU[J]. Electric Power, 2022, 55(7): 163-171.
引言
随着光伏等可再生能源并网容量的不断攀升,它对配电网电能质量可能产生的影响也激起了人们的广泛关注。光伏电站由于出力间歇性和随机性,会产生电压波动、闪变等电能质量问题,电压质量作为电能质量指标之一,其好坏会直接影响配电网的安全稳定运行[1-2] 。因此,通过挖掘光伏电站电压质量的历史数据信息提前预测电压变化趋势,为电压质量的治理预留出一定时间,极大降低光伏电站电压波动对配电网产生的影响,成为可再生能源并网可靠运行的关键技术之一[3-4] 。传统预测方法主要是以累积式自回归移动平均模型(autoregressive integrated moving average model,ARIMA)[5] 为代表的时间序列预测法和以支持向量回归(support vector regression,SVR)[6] 为代表的人工智能方法等。文献[7]提出了一种结合线性回归模型、随机时间序列模型和灰色模型的电压质量组合预测模型,采用方差-协方差方法组合3种模型的预测结果。文献[8]利用混沌理论对历史数据进行相空间重构,提出一种基于混沌理论和最小二乘支持向量机的电压偏差预测模型。文献[9]定义了3个不同的标准来评价所有电能质量参数组合的预测模型的性能,并采用随机森林模型进行电压质量预测。但文献[7-8]未对与电压质量变化相关的变量进行分析,电压质量的变化不仅与其自身历史数据相关,还可能与外部环境因素变量相关。文献[9]虽考虑了电压质量与其他变量之间的关系,但未进行特征筛选,特征维数较高导致训练模型复杂度变高且泛化能力较差。文献[10]采用Relief算法进行输入特征的相关性理解及筛选,然后利用灰色关联分析将Elman神经网络、随机森林和RBF-SVM模型组合完成电压偏差预测,结果优于未进行特征相关性理解及筛选的方法。近年来,随着深度学习的快速发展,各种深度神经网络被用于时间序列预测,如卷积神经网络(convolutional neural networks,CNN)[11] 、循环神经网络(recurrent neural network,RNN)[12-13] 、长短期记忆网络(long short-term memory,LSTM)[14-15] 等,并在负荷和功率预测领域取得了不错的效果。文献[16]提出一种以极端梯度提升和LSTM作为基学习器的Stacking集成学习模型用于负荷预测,结果优于传统支持向量机模型。文献[17]提出一种基于CNN-LSTM的短期风电功率预测方法,先利用CNN提取输入数据的高层特征再通过LSTM网络完成预测,相比未经高层特征提取单一LSTM模型误差更小。对于电压质量预测,文献[18]提出一种基于K-means聚类和LSTM的主动配电网电压偏差预测方法,相较于ARIMA和BP模型误差更低。文献[19]提出一种基于动态时间规整算法相关性测度和LSTM的稳态电压质量预测模型,预测精度高于单输入量模型。但LSTM也存在模型参数较多、训练速度较慢的问题[20-21] ,门控循环单元(gated recurrent unit,GRU)作为RNN的一种变体,是LSTM的改进版本,相比LSTM的输入门、输出门、遗忘门3个门结构,GRU只有更新门和重置门,在保证预测精度的同时模型参数更少,训练速度更快,在时效性要求较高的场合更有优势[22] 。文献[23]提出一种基于GRU-NN模型的短期电力负荷预测方法,结果表明,GRU模型相比LSTM模型在预测误差接近的同时训练耗时有明显的降低。综上所述,本文提出一种基于CNN-GRU的电压轨迹预测方法。首先,通过计算自相关系数和最大信息系数(maximal information coefficient,MIC)进行电压相关性理解,确定电压数据在时序上的关联程度及其与外部因素变量的相关性。然后,利用CNN提取输入数据中的高层特征。最后,输入至双层GRU网络完成模型训练。本文所提方法在时效性较高的同时有效解决了海量数据高层特征提取困难及模型学习长期信息易出现梯度消失的问题,具有更高的预测精度,通过某地光伏电站实测数据验证了方法的优越性。
1 电压趋势预测基本原理
电压趋势预测分为电压要素提取、电压趋势理解和电压轨迹预测3个阶段,其架构如图1所示。
图1 电压趋势预测架构
Fig.1 Voltage trend prediction architecture
电压要素提取是指在动态环境中,面向光伏电站端实现状态信息采集,包括实时电压数据、动态环境信息等,以此信息构建时间序列,是实现电压趋势预测的数据基础。
电压趋势理解是指基于计算机系统管理平台,针对电压要素提取所提供的数据信息中隐含的相关性关系、数据特殊性进行深度挖掘,充分理解电压变化规律,是对提取信息的深度理解。
电压轨迹预测是指通过智能算法学习经趋势理解后的数据高层特征,挖掘长时间序列前后关系,实现电压未来变化轨迹预测。
1.1 电压要素提取
通过在光伏电站端安装数据采集模块、传感器单元,构建时刻电压时间序列及太阳辐照度等气象时间序列为
式中:vj 为电压时间序列的第 j 个电压值; rj 为太阳辐照度时间序列的第 j 个太阳辐照度值。基于数据采集模块的采样频率 r ,根据轨迹预测时间尺度,以间隔时间 Δt =300/r 提取序列中的数据作为参考值,以 t i ∼ti +1 (i ⩾0) 时间段为例,有 式中: V 1 为时刻 ti 的电压值; V 2 为时刻 ti +Δt 的电压值; Vm 为时刻 ti +(m −1)Δt 的电压值。1.2 电压趋势理解 1.2.1 电压自相关性理解 电压数据作为一种时序数据,首先需要分析其在时序上的相关性,以提供轨迹预测模型的输入时间步长。自相关系数 C (p ) 可以度量在2个不同时间点的电压时序数据相关程度。 C (p ) 的取值范围为[–1,1],若 C (p )>0 ,则两电压时序数据正相关,反之则负相关; |C (p )| 越大,相关程度越高。其计算公式为 式中: p 为滞后时间点; vt 为时刻 t 的电压值; vt +p 为时刻 t +p 的电压值;为整个电压序列均值; m 为总时刻。 1.2.2 变量相关性理解 光伏电站的电压变化可能与多种影响因素有关,为充分考虑其他变量因素的影响,指导轨迹预测模型输入维度选取,提升预测精度,需进行变量相关性理解。目前多数文献中都是采用Pearson、Spearman等线性相关性理解方法,未考虑变量因素间的非线性关系,可能导致模型输入维度冗余或缺失[24] 。最大互信息系数(maximal information coefficient,MIC)是一种优秀的变量关联性计算方式,用于衡量2个变量之间的线性及非线性关联强度。MIC的基本思想是:如果变量之间存在相关性,可以在2个变量的散点图上画一个网格来划分和封装它们之间的相关性,MIC通过互信息(mutual information,MI)和网格划分方法计算[25] 。给定2个具有离散值的随机变量 x ={xi ,i =1,2,⋯,n } 和 y ={yi ,i =1,2,⋯,n} ,其中 n 是这些变量中元素的数量,互信息 I (x ,y ) 被定义为 式中: p (x ,y ) 为变量 x 和 y 之间的联合概率。 对互信息进行标准化,求出最大信息系数(MIC) C MI (x ,y ) 为 式中: a 、 b 分别为在 x 、 y 轴方向上划分格子的数目; B (n ) 为划分网格数目上限值,一般为数据量 n 的0.6次方左右。C MI 取值区间为[0, 1],其值越大,两变量间的相关性就越强。1.2.3 数据预处理 在通过相关性理解得出数据输入维度之后,由于不同维度数据之间的量纲和数量级不一样,直接将其输入模型会导致某些维度数据在模型训练中贡献度过大,且在训练迭代的过程中可能导致计算溢出[26] ,因此有必要对这些数据进行数据归一化处理,即 式中:v′t 为时刻 t 的归一化数据值; v max 、 v min 分别为各维度数据序列中的最大值和最小值。1.2.4 评价指标选取 本文选取2个预测评价指标评估模型的精度,分别是平均绝对误差(MAE) E MA 和均方根误差(RMSE) E RMS ,计算公式分别为 式中: N 为测试集样本总数;为预测日第 i 个时间点的电压实际值; 为预测日第 i 个时间点的电压预测值。 1.3 电压轨迹预测 1.3.1 CNN模型 CNN对网格数据具有强大的处理能力,广泛应用于图像分析任务中,其主要结构为卷积层和池化层。卷积操作是以指定数量、窗口大小的卷积核沿数据窗口进行逐步滑动做张量积的运算,最大池化操作是从输入数据中提取给定大小的窗口,输出窗口的最大值。CNN通过卷积层和池化层中的特征变换和提取对输入层的数据进行计算,得到输入数据的高层特征,全连接层将经过池化计算的特征进一步整合,并映射到输出层输出信息。CNN基本结构如图2所示。
图2 CNN基本结构
Fig.2 Basic structure of CNN1.3.2 GRU模型
GRU模型是LSTM模型的一种高级变体,LSTM结构包括输入门、输出门和遗忘门,而GRU只有重置门和更新门2个门,它将LSTM的输入门和遗忘门合并到了更新门。因为使用的门结构更少,GRU参数更少,计算过程简化,相比LSTM在模型训练的过程中效率更高。LSTM及GRU单元结构如图3所示,GRU计算过程为
图3 LSTM和GRU单元结构
Fig.3 Unit structures of LSTM and GRU
式中:r t 为重置门; z t 为更新门; x t 为输入信息; h t −1 为前一时刻隐藏层状态; σ 为sigmoid激活函数; f 为 tanh 激活函数; 为输入 xt 和上一隐藏层状态 h t −1 的复合运算得到的候选状态;h t 为隐藏层输出数据; W r 、U r 、W z 、U z 、W h 、U h 为对应门和候选集的权重矩阵; ⊙ 表示点乘运算。 1.3.3 CNN-GRU融合模型 本文所提CNN-GRU融合模型如图4所示,首先通过一维卷积(Conv1 D)和最大池化(MaxPooling1 D)层完成输入数据的高层特征提取,然后输入至GRU网络层完成训练并预测,再通过扁平化层(Flatten)把GRU输出的三维数据压缩成二维数据,最后通过全连接层(Dense)输出预测数据。
图4 CNN-GRU融合模型结构
Fig.4 Structure of CNN-GRU fusion model
2 预测流程
针对光伏电站出力间歇性和不确定性易引发并网点电压大幅波动的问题,考虑将CNN的高层特征提取能力和GRU学习长时序数据前后信息能力结合起来,提出一种CNN-GRU融合模型。模型将高层特征提取和时间序列预测2个任务进行解耦,以期实现对并网点电压大幅波动情形下的高效处理和准确预测,模型在电压趋势预测场景下的预测流程如图5所示。
图5 预测流程
Fig.5 Prediction flowchart
3 算例分析
为验证本文所提方法的有效性,以澳大利亚DKA光伏电站2020年1月1日—6月11日的实测数据进行实验,包括电压、太阳辐照度、温度、相对湿度、有功功率、风速、降雨量等。其中,1月1日—5月11日的38 016条数据用于训练,5月12日—6月11日的8 928条数据用于测试,共46 944条数据,数据间隔时间为5 min,电压时间序列如图6所示。
图6 电压时间序列
Fig.6 Time series of voltage
3.1 实验环境 实验硬件环境为Intel i5-6500处理器,8 GB内存,NVIDIA GTX750 ti显卡。软件环境为Visual Studio Code,采用Python语言编写程序,以Tensorflow为后端的高级API接口Keras搭建神经网络模型。3.2 模型结构参数设计 CNN-GRU模型设计包括CNN层数、卷积核数目和大小、GRU层数、GRU隐藏神经元数目等参数的确定。初始化CNN-GRU模型参数设置为:一层Conv1 D层,卷积核数目为16,大小为2,一层GRU网络,神经元数目为40。实验中先不变动GRU模块的参数进行预测,计算CNN层数、卷积核数目和大小变动后的MAE和RMSE,确定预测误差最低的CNN模块参数;然后CNN模块参数不变动进行预测,计算GRU层数和神经元数目变动后的MAE和RMSE,最后得到最优的CNN-GRU模型结构参数。根据模型训练时的收敛情况确定实验中模型迭代次数epochs均为55次,实验结果如表1、表2所示。
表1 CNN模块参数设计结果对比
Table 1 Design result comparison of CNN module parameters
表2 GRU模块参数设计结果对比
Table 2 Design result comparison of GRU module parameters
由表1、表2可知,最优的CNN-GRU模型结构参数为:CNN为两层Conv1 D层,第一层卷积核数为16,大小为3,第二层卷积核数为32,大小为3,其后连接MaxPooling1 D层;GRU层数为两层,神经元数分别为40、80。3.3 相关性理解结果分析 3.3.1 自相关性理解结果分析 电压数据作为一种时序数据,通过分析其自相关性能够指导模型的最佳输入步长选择,电压自相关系数如图7所示。
图7 电压自相关系数曲线
Fig.7 Curve of voltage autocorrelation coefficient
从图7可以看出,自相关程度高的电压时间序列主要集中在滞后时间较短的区间,且越靠近当前时刻自相关程度越高,因此考虑将当前时刻前几十分钟内的真实电压数据作为输入。通过枚举1~10的值确定模型输入时间步长为6。3.3.2 变量相关性理解结果分析 为分析不同变量因素对电压轨迹预测的影响,本文分别计算太阳辐照度、温度、相对湿度、有功功率、风速和降雨量6种指标与电压的MIC,其结果如表3所示。
表3 电压与其他变量因素间的MIC
Table 3 MIC of voltage relative between other variables
从表3可知,有功功率、太阳辐照度与电压之间相关性最强,C MI 分别为0.721和0.651。因此,为了降低建模复杂度,提高模型泛化能力,本文只考虑有功功率、太阳辐照度对电压轨迹预测的影响,将其作为模型的输入变量。3.4 轨迹预测结果分析 为更好体现本文方法的优越性,将使用了MIC相关性理解的多输入CNN-GRU模型和仅有电压历史数据的单输入模型进行预测结果对比,结果如表4所示。
表4 模型加入MIC前后预测指标对比
Table 4 Prediction index comparison before and after MIC addition into model
由表4可知,经MIC输入特征选择后的CNN-GRU模型相比单输入模型的MAE和RMSE分别下降了27%和23%左右,MIC的加入较大地提升了模型预测精度。图8为加入MIC理解后,分别使用SVR、LSTM、GRU、CNN-LSTM和CNN-GRU模型进行电压预测,随机选取测试集某日的电压真实曲线和预测曲线展示。不同模型的测试集整体预测指标对比如表5所示。
表5 不同模型预测指标对比
Table 5 Prediction index comparison among different models
图8 电压真实值与预测值对比
Fig.8 Comparison of actual voltage with predicted voltage
从图8可以看出,在09:00—16:00时间段,各模型预测偏差波动开始增大,本文所提模型和CNN-LSTM模型在该时间段依然能较好地拟合电压真实值曲线,模型表现更稳定。由表5可知,在提前5 min预测电压时,所提CNN-GRU融合模型相较于CNN-LSTM、GRU、LSTM、SVR等模型,MAE分别下降了23.0%、51.9%、51.5%、66.3%,RMSE分别下降了7.3%、41.4%、44.2%、57.1%,实现了更好的预测效果。在一些时效性要求较高的场合,需要考虑较高预测精度的同时兼顾模型训练耗时,表6为CNN-GRU、CNN-LSTM、GRU、LSTM 4种模型的训练耗时对比。
表6 模型训练时间对比 Table 6 Model training time comparison
由表6可知,CNN-GRU模型相比CNN-LSTM模型,在提前5 min预测电压模型训练时速度提升了27%左右,在提前15 min预测电压模型训练时速度提升了25%左右,模型训练效率更高。
4 结论
本文针对光伏电站出力间歇性和不确定性易引起并网点电压大幅波动的问题,提出了一种基于CNN-GRU的电压轨迹预测方法。通过某地光伏电站的实测数据验证,对比CNN-LSTM、GRU、LSTM、SVR等模型,模型评价指标MAE和RMSE均为最低;对比CNN-LSTM模型,模型训练效率提升在25%以上。本文所提电压轨迹预测方法的特点如下。(1)通过自相关系数和MIC理解电压自身及其与外部变量在时序上的相关性,以此确定模型输入步长及维度,减少了特征冗余,降低了模型训练复杂度。(2)先利用CNN提取输入数据的高层特征,再利用GRU学习长时间序列前后关系,解决了海量电压数据高层特征提取困难及模型学习长时间序列信息易梯度消失的问题,实现了对光伏电站数据的充分挖掘。(3)相比单输入模型和单一模型预测精度更高,同时具有较好的模型训练效率,为光伏电站电压轨迹预测提供了新的思路和方法。本文分别计算了太阳辐照度、温度、相对湿度、有功功率、风速和降雨量6种指标与电压的相关性,未来可以进一步考虑配电网拓扑及负荷对电压的影响。(责任编辑 许晓艳)
作者介绍
冯裕祺(1996—),男,硕士研究生,从事微电网电能质量态势感知研究,E-mail:1252988056@qq.com; ★
李辉(1974—),男,通信作者,博士,硕士生导师,从事并网逆变器控制技术、微电网电能质量态势感知与态势利导研究,E-mail:lihui7402@126.com; ★
李利娟(1980—),女,博士,教授,博士生导师,从事智能电网研究,E-mail:lilijuan204@126.com.