基于门控循环单元与误差修正的短期负荷预测
Short term load forecasting based on gated recurrent unit and error correction
通讯作者:
收稿日期: 2020-08-28
基金资助: |
|
Received: 2020-08-28
Fund supported: | 上海市高峰高原学科资助项目(A1-5701-18-007-03);上海多向模锻工程技术研究中心资助项目(20DZ2253200) |
作者简介 About authors
黄炜(1995—),男,硕士生,从事电力系统检测与控制研究.orcid.org/0000-0001-8575-2989.E-mail:
针对负荷预测模型迭代训练过程中存在误差积累的问题,提出结合叠式双向门控循环单元(SBiGRU)、完整自适应噪声集成经验模态分解(CEEMDAN)和误差修正的组合预测模型. 建立SBiGRU模型学习在气温、日期类型影响下负荷序列的时序特征,误差特征体现在SBiGRU模型预测产生的误差序列中;使用CEEMDAN算法将误差序列分解为数个本征模态函数(IMF)分量与趋势分量,对每项分量再次建立SBiGRU模型进行学习与预测,并对各分量的预测值进行序列重构,得到误差的预测结果;对预测结果进行求和以修正误差. 模型评估结果表明,组合模型的预测准确精度为98.86%,与SBiGRU、BiRNN、支持向量回归等方法相比,该模型具有更好的精度.
关键词:
A combined prediction model combining stacked bidirectional gated recurrent unit (SBiGRU), complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN) and error correction was proposed, aiming at the problem of error accumulation in iterative training process of load forecasting model. The SBiGRU model was established to learn the time series characteristics of load series under the influence of temperature and date type, and the error characteristics were reflected in the error series generated in the prediction process of SBiGRU model. Then CEEMDAN algorithm was used to decompose the error series into several intrinsic mode function (IMF) components and trend components. For each component, SBiGRU model was established again for learning and forecasting, and the predicted values of all components were reconstructed to obtain the error prediction results. Finally, the prediction results were summed to correct the error. Model evaluation results show that the prediction accuracy of the combined model is 98.86%. Compared with SBiGRU, BiRNN, support vector regression, ect., the combined model has better accuracy.
Keywords:
本文引用格式
黄炜, 陈田, 吴入军.
HUANG Wei, CHEN Tian, WU Ru-jun.
短期负荷预测是在考虑气温因素和日期类型影响的前提下,对未来24小时、几天或几周的用电需求进行估算和预测[1].
常见的负荷预测模型包括:极限学习机[2]、支持向量机[3]、卡尔曼滤波[4]和随机森林[5]等. 近年来,随着深度学习的发展,深度学习模型如卷积神经网络[6]、循环神经网络(recurrent neural network,RNN)[7]、深度置信网络[8]等逐渐被应用到电力负荷预测中. 其中,RNN在语音识别、自然语言处理中应用广泛. 该网络通过循环的方式处理数据,可以在进行数据预测时更好地拟合数据在时间序列上的特性[9]. 基于负荷序列的时序特性,RNN被许多学者引入负荷预测中[10]. Tang等[11]使用K-Means将数据集分类至同一个聚类中,再使用EEMD算法将负荷序列分解为较稳定的分量,针对每个分量建立双向循环神经网络(bidirectional recurrent neural network,BiRNN)模型进行预测. 然而RNN在计算距离较远时涉及雅可比矩阵的累乘,易出现梯度膨胀和梯度弥散[12]. 长短时记忆网络(long short-term memory,LSTM)在网络的结构上相比RNN做出了改善,避免了RNN网络中的梯度膨胀和梯度弥散出现. Kong等[13]在公开获取的真实住宅智能电表数据集中对LSTM以及多种同类模型进行测试,最终LSTM在居民家庭短期负荷预测方面优于其他同类模型.
上述方法忽略了模型在迭代训练的过程中产生的误差信息. 本文提出包含误差修正环节的组合预测模型。模型使用叠式双向门控循环单元(stacked bidirectional gated recurrent unit, SBiGRU)学习负荷数据的主要特征,误差信息体现在SBiGRU模型预测产生的误差序列中;使用完整自适应噪声集成经验模态分解(complete ensemble empirical mode decomposition with adaptive noise, CEEMDAN)-SBiGRU模型对误差序列进行拟合;将SBiGRU模型与CEEMDAN-SBiGRU模型相结合得到本文组合预测模型.
1. 相关模型的原理
1.1. 门控循环单元
GRU在设计过程中参考LSTM的网络结构,将LSTM中的遗忘门与输入门集合为更新门,同时融合细胞状态和更新状态. 与LSTM相比,GRU减少了一个门控单元,因此模型参数相对更少,运算效率显著提高. GRU的网络结构如图1所示. GRU通过t时刻的输入
式中:Wz、Wr、W分别为重置门、更新门、隐藏层网络状态的权值矩阵。
图 1
1.2. 叠式双向门控循环单元
双向门控循环单元(bidirectional gated circulation unit,BiGRU)由前向GRU网络与后向GRU网络构成,结构如图2所示. BiGRU神经网络基于整个时间序列进行预测,它将隐藏层划分为前向与后向2个对立的部分,分别读取过去与未来时刻的信息. 第1层前向GRU计算当前时刻序列的顺序信息,第2层后向GRU计算相同时刻序列的逆序信息,最后BiGRU在t时刻的隐藏层状态由前向隐藏层状态和后向隐藏层状态加权得到. 其计算过程如下:
图 2
图 2 双向门控循环单元的网络结构
Fig.2 Network structure of bidirectional gated recurrent unit
式中:
SBiGRU的网络结构是由多个BiGRU堆叠而成的。第n层BiGRU在t时刻的输入为
1.3. 完整自适应噪声集成经验模态分解
CEEMDAN在EEMD分解的过程中添加自适应的白噪声并且计算唯一的余量信号以获取本征模态函数(intrinsic mode function, IMF)分量,可以在较少的实验次数中重构信号序列,消除自适应白噪声在EEMD分解过程中所产生的误差.
定义
2)继续获取第2个IMF分量:
3)重复以上步骤,计算第n个余量信号:
则第n+1个IMF分量为
4)重复步骤3),直到余量信号呈单调趋势,分解停止原始信号
式中:N为最终模态分量的个数,
1.4. 组合模型的计算流程
1)负荷预测. 使用训练集对第1阶段SBiGRU模型进行有监督训练,待模型收敛后预测训练集与测试集,得到训练集预测值
式中:
2)误差预测. 使用CEEMDAN算法将
3)计算组合模型的预测值. 组合模型的预测结果
组合模型的预测流程如图3所示.
图 3
2. 算例分析
2.1. 实验数据的获取
用2016年加拿大阿尔伯塔省电力负荷数据验证组合模型的预测精度. 数据采样周期为1 h,每天包括24个采样点. 同时收集该区域的温度信息.如 图4所示为数据集中部分负荷序列L随时间t的变化曲线. 不同季节所考虑的气象因素应有所差别,本次实验只收集到了负荷数据和温度信息,为了避免这种差别对预测精度的影响,选取2016年7月至10月(夏季)共计2 928个样本作为研究对象.
图 4
由图4可以看出,负荷序列在双休日期间明显低于工作日,这说明日期类型会在一定程度上影响负荷值. 因此,在负荷预测中应考虑日期类型.
2.2. 输入特征的确定
计算日期类型、气温与负荷序列之间的相关性. 日期类型用虚拟编码模式表示,以[0,1]表示[工作日,双休日].
计算得到气温与负荷序列的Pearson相关系数为0.768 2,两者具有较强的正相关性,因此须将气温作为负荷序的影响因素. 同时,计算得到日期类型与负荷序列的Pearson相关系数为0.182 73,两者呈弱相关性,结合图4的分析结果,双休日期间的负荷值明显低于工作日负荷值,因此将日期类型作为负荷序列的影响因素.
2.3. 数据集预处理
使用MaxMin的方法对数据进行归一化处理,将所有数据的值域归一化到[0,1],将归一化的数据传入到模型中,再将模型的输出结果进行反归一化,计算的公式为:
式中:
使用2016年7月至9月共计92天的数据作为训练集,使用10月1~30日的数据作为测试集,以历史24个时刻点的数据预测未来24个时刻点的负荷数据.
将92天的训练集转化为三维矩阵,三维矩阵的维度信息为
式中
同理,测试集的维度信息为
2.4. 模型训练方法
模型的训练过程采用Adam优化算法. Adam结合了RMSprop善于处理非平稳目标与Adagrad善于处理稀疏梯度的优点,其计算公式为
式中:gt为梯度;
2.5. 模型评价指标
模型采用平均绝对百分误差
式中:
2.6. 第1阶段SBiGRU训练与预测
实验在Ubuntu 18.04系统下利用Pytorch1.10完成,实验PC的处理器为Inter Core i5-8300H,内存为16 GB,显卡为NVIDIA GeForce GTX 1050Ti.
表 1 不同SBiGRU结构的性能对比
Tab.1
模型结构 | | T/s |
单层 | 0.020 4 | 13 |
2+1层 | 0.017 4 | 21 |
3+1层 | 0.018 6 | 29 |
4+1层 | 0.019 3 | 38 |
图 5
图 5 第1阶段叠式双向门控循环单元的网络参数
Fig.5 Network parameters of first stage stacked bidirectional gated recurrent unit
图 6
图 6 第1阶段叠式双向门控循环单元的预测结果
Fig.6 Prediction results of first stage stacked bidirectional gated recurrent unit
图 7
图 7 第1阶段叠式双向门控循环单元的误差序列
Fig.7 Error sequence of first stage stacked bidirectional gated recurrent unit
2.7. 第2阶段CEEMDAN-SBiGRU模型的训练过程
观察图8可以发现,IMF1~IMF4分量的频率较高且周期性不明显,可以看作误差序列的高频分量. IMF5~IMF7分量的周期性明显,可以看作误差序列的周期分量. IMF8分量的频率较低且周期性不明显,可以看作误差序列的低频分量. IMF9为误差序列的残余分量.
将CEEMDAN算法分解得到的8个IMF分量与1个残余分量分别建立第2阶段的SBiGRU模型,其结构设计过程与第1阶段的SBiGRU结构类似,通过实验确定网络结构为2+1层,此时的网络的输入为误差分量,其特征维数为1,因此,第2阶段的SBiGRU输入层维度信息为{91,24,1},此时设置各项SBiGRU模型的输入为7月1日至9月29的误差分量,输出为7月2日至9月30日的误差分量,同样以Adam算法对网络参数进行迭代优化.
图 8
2.8. 预测分量重构
将各个IMF分量
2.9. 实验过程及结果分析
实验通过10月1~29日的数据预测10月2~30日的负荷数据.
待第1阶段SBiGRU模型与第2阶段CEEMDAN-SBiGRU模型收敛后,通过第1阶段SBiGRU模型预测得到10月2~30日负荷序列的主要特征
图 9
图 9 5种预测模型的预测结果对比
Fig.9 Comparison of predictive results for five prediction models
如图10所示为5种模型在预测集中的实际值A与预测值P的相关分布图,R为Pearson相关系数,用来评价T与P的相关性. 若图中相关分布点越趋近标准虚线y=x,表示模型预测值越接近真实值,相应的Pearson相关系数也越趋近1. 由图可知,模型对负荷序列的拟合程度最高,与其他模型相比具有最好的预测精度;SBiGRU- SBiGRU模型也取得了不错的预测精度,但整体上还是比本文模型的预测精度低;SBiGRU模型没有进行误差修正,因此预测精度比以上2种组合模型低,因为该模型采用多层的网络结构设计,所以预测精度高于BiRNN模型;机器学习模型SVR既无法深度挖掘负荷序列的特征,也不能提取负荷序列过去、未来时刻的时序信息,在实验结果中表现最差.
图 10
图 10 5种模型的预测值与实际值相关性分析
Fig.10 Correlation of actual values and predicted values for five models
5种模型的预测结果误差对比如表2所示. 由表可知,SVR模型在预测集中表现最差,在测试集中平均准确率为96.90%;BiRNN模型能够学习负荷序列的时序信息,预测精度相对SVR模型得到了改善,为97.90%;SBiGRU模型在预测过程中考虑了过去、未来时刻的数据信息,并且以2+1层的网络结构提升模型的数据挖掘能力,因此预测精度高于BiRNN模型,测试集中平均准确率为98.21%;SBiGRU-SBiGRU模型在第1阶段中使用SBiGRU预测负荷的主要特征,在第2阶段中再次使用SBiGRU作为误差修正模型,提高了预测精度,日均准确率为98.45%;本文模型在第2阶段中使用CEEMDAN算法对误差序列进行分解,可以在不同的时间尺度上对误差序列进行预测,因此日均准确率在5种模型中最高,为98.86%.
表 2 5种模型的预测结果误差对比
Tab.2
模型 | | | |
本文 | 0.011 4 | 0.014 9 | 137.69 |
SBiGRU- SBiGRU | 0.015 5 | 0.026 2 | 178.79 |
SBiGRU | 0.017 9 | 0.030 2 | 201.55 |
BiRNN | 0.021 0 | 0.032 1 | 262.69 |
SVR | 0.031 0 | 0.051 1 | 358.83 |
如图11所示为5种模型的误差直方图,纵坐标为对应误差值的数量N,若Pe越集中于0附近,则代表模型的性能越好. 从图中可以看出,本文模型的误差直方图在0附近最为集中且最高,说明这种组合预测模型的性能在5种模型中表现最优.
如图12所示为5种模型的绝对误差箱线图. 由图可知,本文模型的箱线图的箱体范围最窄且上边缘最低,进一步说明该模型能够将预测误差控制在较小的范围内.
图 11
图 12
3. 结 论
(1)本文模型、SBiGRU- SBiGRU组合模型的评价指标均优于SBiGRU、BiRNN、SVR单一模型,说明组合预测模型相比单一预测模型具有更好的预测精度.
(2)本文模型将误差序列分解为数个更为平稳的分量,并且对各分量建立SBiGRU预测模型,能够很好地拟合误差序列,在5种模型中具有最好的预测精度.
(3)在误差修正阶段,本文模型采用SBiGRU模型拟合每项误差分量. 下一步计划根据各误差分量的特点,采用不同的模型对误差分量进行预测,以提高误差分量的预测精度.
参考文献
基于XGBoost算法的新型短期负荷预测模型研究
[J].
A new short-term load forecasting model based on XGBoost algorithm
[J].
基于SAE-ELM的电动汽车充电站负荷预测模型
[J].DOI:10.3969/j.issn.1007-2322.2019.06.002 [本文引用: 1]
Model of load forecasting of electric vehicle charging station based on SAE-ELM
[J].DOI:10.3969/j.issn.1007-2322.2019.06.002 [本文引用: 1]
基于信息熵和变精度粗糙集优化的支持向量机降温负荷预测方法
[J].
Cooling load forecasting method of based on support vector machine optimized with entropy and variable accuracy roughness set
[J].
基于自适应无迹卡尔曼滤波的电力系统动态状态估计
[J].
Dynamic state estimation for power system based on an adaptive unscented Kalman filter
[J].
EGA-STLF: a hybrid short-term load forecasting model
[J].DOI:10.1109/ACCESS.2020.2973350 [本文引用: 2]
基于CNN-LSTM混合神经网络模型的短期负荷预测方法
[J].DOI:10.7500/AEPS20181012004 [本文引用: 1]
Short-term load forecasting method based on CNN-LSTM hybrid neural network model
[J].DOI:10.7500/AEPS20181012004 [本文引用: 1]
Short-term load forecasting with deep residual networks
[J].DOI:10.1109/TSG.2018.2844307 [本文引用: 1]
A new hybrid model for short-term electricity load forecasting
[J].DOI:10.1109/ACCESS.2019.2937222 [本文引用: 1]
Deep learning for household load forecasting: a novel pooling deep RNN
[J].DOI:10.1109/TSG.2017.2686012 [本文引用: 1]
Deep Learning for load forecasting: sequence to sequence recurrent neural networks with attention
[J].DOI:10.1109/ACCESS.2020.2975738 [本文引用: 1]
Application of bidirectional recurrent neural network combined with deep belief network in short-term load forecasting
[J].DOI:10.1109/ACCESS.2019.2950957 [本文引用: 1]
Short-term non-residential load forecasting based on multiple sequences LSTM recurrent neural network
[J].DOI:10.1109/ACCESS.2018.2873712 [本文引用: 1]
Short-term residential load forecasting based on LSTM recurrent neural network
[J].DOI:10.1109/TSG.2017.2753802 [本文引用: 1]
A novel equivalent model of active distribution networks based on LSTM
[J].DOI:10.1109/TNNLS.2018.2885219 [本文引用: 1]
A hybrid distribution feeder long-term load forecasting method based on sequence prediction
[J].DOI:10.1109/TSG.2019.2924183 [本文引用: 1]
Probabilistic deep neural network price forecasting based on residential load and wind speed predictions
[J].DOI:10.1049/iet-rpg.2018.6257 [本文引用: 1]
Short-term power load forecasting based on multi-layer bidirectional recurrent neural network
[J].DOI:10.1049/iet-gtd.2018.6687 [本文引用: 2]
/
〈 |
|
〉 |
