基于重组二次分解及LSTNet-Atten的短期负荷预测
Short term load forecasting based on recombination quadratic decomposition and LSTNet-Atten
通讯作者:
收稿日期: 2024-05-27
基金资助: |
|
Received: 2024-05-27
Fund supported: | 国家自然科学基金资助项目(62176146);国家社会科学基金西部项目(21XTY012);陕西理工大学研究生创新基金资助项目(SLGYCX2405). |
作者简介 About authors
刘洪伟(1997—),男,硕士生,从事电力系统负荷预测的研究.orcid.org/0009-0007-5096-3293.E-mail:
针对电力负荷数据随机性强、波动性大,预测精度较低的问题,提出基于重组二次分解及LSTNet-Atten的短期负荷预测方法. 在数据预处理阶段,采用自适应白噪声的完全集合经验模态分解对负荷序列进行初步分解,降低原始信号的随机性和波动性. 根据子序列的样本熵值,将相似的子序列重组聚合. 在特征工程阶段,采用变分模态分解对重组得到的复杂度较高的分量进行再次分解,通过皮尔逊、斯皮尔曼、最大信息系数方法评估输入影响因素与负荷数据之间的相关性,利用证据理论优化输入数据的特征维度. 在模型构建阶段,重构LSTNet-Atten预测模型,采用卷积模块挖掘序列的局部依赖关系,通过循环和循环跳过模块提取数据的长短期特征,提高数据本身的可预测性. 利用自回归模块增强神经网络对线性特征的识别能力,提高模型的预测性能. 增加时间注意力赋予重要特征更多的权重,实现全局与局部联系的捕获. 在瓦伦西亚区域级负荷数据集上的实验结果表明,与其他经典的深度学习模型相比,所提方法的序列预测误差最高降低了66.69%,拟合系数提高了5.04%,预测精度和鲁棒性更高.
关键词:
A short-term load forecasting method based on restructured second modal decomposition and LSTNet-Atten was proposed in order to address the issues of high randomness and volatility in power load data, as well as the relatively low prediction accuracy. Complete ensemble empirical mode decomposition with adaptive white noise was employed for the preliminary decomposition of the load sequence during the data preprocessing phase. Then the randomness and volatility of the original signal was reduced. Similar subsequences were reorganized and aggregated based on their sample entropy values. Variational modal decomposition was applied to further decompose the components with higher complexity obtained from the reorganization in the feature engineering phase. The correlation between input influencing factors and load data was evaluated by using Pearson, Spearman, and maximum information coefficient methods, while evidence theory was utilized to optimize the feature dimensions of the input data. The LSTNet-Atten forecasting model was reconstructed in the model construction phase. Convolutional modules were used to mine local dependencies within sequences, while recurrent and skip recurrent modules extract both long-term and short-term features from the data to enhance its predictability. The autoregressive module was used to enhance the ability of the neural network to recognize linear features and improve the predictive performance of the model. More weight was given to important features by increasing temporal attention in order to achieve the capture of global and local connections. Experimental results on a Valencia regional load dataset indicate that the proposed method reduces sequence prediction error by up to 66.69% compared with other classical deep learning models with a 5.04% increase in fitting coefficient, demonstrating higher prediction accuracy and robustness.
Keywords:
本文引用格式
刘洪伟, 王磊, 刘阳, 张鹏超, 乔石.
LIU Hongwei, WANG Lei, LIU Yang, ZHANG Pengchao, QIAO Shi.
常见的负荷预测方法包括多元线性回归[4]、指数平滑[5]、朴素贝叶斯[6]和隐马尔可夫模型[7]等. 近年来,深度学习因其出色的多元映射效应,被国内外学者广泛应用于负荷预测领域[8]. Tang等[9]使用双向循环神经网络(recurrent neural network,RNN)预测短期负荷,精度高,但容易遇到梯度消失和爆炸的问题. 陆继翔等[10]通过卷积神经网络(CNN)提取非线性耦合关系,建立增强型的循环神经网络(CNN-LSTM),避免了梯度消失的问题. 黄炜等[11]通过添加分解层和误差修正层,将采集到的特征输入到叠式双向门控循环单元(SBiGRU)中,减小预测结果中的误差,取得了较好的结果.
在短期负荷预测的实践中,负荷数据的随机性、波动性较大,预测结果不理想. 为了解决该问题,李文武等[12]基于信号分解的组合预测模型. 在负荷预测领域,分解算法主要分为以下2类. 1)分别将分解所得的本征模态函数 (intrinsic mode function,IMF)输入预测模型,将预测模型的结果进行加和,求得最终的负荷预测值[13]. 某些分量的波动性较高,直接进行预测的误差较大,得到的结果可信度不高. 2)利用熵值方式评估各个IMF的复杂性,对每个分量进行分类和重新构建,随后输入适当的模型并将结果整合重构,得到最终的预测值[14]. 熵值计算常用的方法有排列熵、近似熵和样本熵. 常雨芳等[15]结合自适应噪声的完全集合经验模态分解(complete ensemble empirical mode decompositions with adaptive noise,CEEMDAN)和排列熵来评估IMF的复杂水平,使用小波包分解进一步分割和预测复杂信号,显著增强了预测准确性. 双重分解产生了大量分量,增加了计算负担与计算时间,降低了训练效率. 陈锦鹏等[16]结合CEEMDAN与近似熵,判断平稳与非平稳分量,将非平稳分量通过变分模态分解(variational mode decomposition,VMD)进一步分解,使用主成分分析降维后,输入不同模型进行预测,减少了计算量,但近似熵依赖于数据的长度,当数据的长度超过某个阈值时,容易导致模型的预测性能下降.
综上分析,本文提出基于重组二次分解及LSTNet-Atten的短期负荷预测方法. 基于CEEMDAN、SE以及VMD的自适应二次分解框架,将原始负荷自适应地分解-重组-分解,降低原始数据的波动性和随机性. 通过皮尔逊、斯皮尔曼、最大信息系数方法,评估输入影响因素与负荷数据之间的相关性. 采用证据优化组合理论计算相关系数,优化输入数据的特征维度. 将高相关性特征与IMF分量构成特征矩阵,输入重新设计的LSTNet预测模型中,通过重构得到最终的预测结果. 采用西班牙瓦伦西亚区域数据集进行实例验证,通过对比实验表明,利用该模型可以有效地提高负荷序列的预测精度. 通过消融模型研究,证明了各模块的必要性和有效性.
1. 相关技术与原理
1.1. 自适应白噪声完整经验模态分解CEEMDAN
CEEMDAN可以将复杂的原始负荷数据分解成不同频率的本征模态函数(IMF),IMF根据频率的不同表示不同尺度的特征,利用该方法可以有效地降低预测的难度. CEEMDAN分解过程如图1所示. 图中,
图 1
图 1 CEEMDAN 的分解过程
Fig.1 Decomposition process of complete ensemble empirical mode decomposition with adaptive noise
CEEMDAN在EMD的基础上进行改进,结合EEMD算法,通过添加多组符号相反的白噪声,解决了模态混叠、重构误差大的问题.
1.2. 变分模态分解
VMD是自适应、非递归的模态分解方法,在求解过程中寻找模态分量的集合及各自的中心频率,每个模态在解调成基带之后是平滑的. 对于采样和噪声,该方法更具有鲁棒性.
VMD的分解过程可以理解为对变分问题的构造和求解的过程,相应转化为变分问题的构造和求解. 假设
式中:
1.3. 敏感特征筛选与D-S优化组合算法
D-S理论的核心思想为辨识框架和信任函数. D-S理论的目标是通过融合多种评价指标,对历史负荷数据与天气、日期等多重因素之间的相关性进行综合评估,可以显著减少不同评价体系带来的不确定性,而不是单单以某一种评价指标作为筛选特征的方法.
皮尔逊相关性指数反映了变量间的线性相关程度. 斯皮尔曼相关性指数是非参数的度量,用于评估2个变量之间的单调相关性. 最大信息系数用来探索变量之间的间接、非线性的内部深层联系. 3种评价指标都能够衡量负荷数据与影响特征的相关性,但是每一种相关性评价指标的侧重点不同,使用单一特征筛选方法可能会忽略关键信息,容易造成选取误差,所以采用D-S证据理论对不同的评价指标进行双重组合. 具体步骤如下.
1) 为了消除量纲不同带来的影响,需要将特征数据与负荷进行归一化处理,归一化公式为
式中:
2) 计算不同评价体系下每一个影响因素与负荷序列的关联程度.
3) 选择并删除每一种评价指标下关联程度最低的特征,避免无关特征对模型预测精度的影响.
4) 将3)删除后留下的特征确定为模型输入特征,计算剩余输入特征在每一种评价指标系数中所占的比重,计算公式为
式中:
5) 根据式(3)得到的权重占比进行双重指标的优化组合,得到最终的组合信任度
6) 引入累计贡献率
2. 研究方法
2.1. 数据处理和特征提取
本研究方法初期旨在处理和提取负荷数据特征,具体过程见图2.
图 2
该阶段的主要任务如下.
1) 通过计算机进行数据的初步清理,为后面特征的选择奠定基础. 具体措施包括缺失值的填充、重复值的删除和异常值的替换等,以减小数据噪声,提升数据可靠性.
2) 数据的分析描述:相关性分析、平稳性分析. 使用ACF函数(autocorrelation function) 检验负荷时间序列是否具有短期和长期重复模式,对于时间序列预测的研究,这种重复特性是必须考虑的. 使用ADF检验(augmented dickey-fuller test)、DF-GLS检验(Dickey-Fuller Test with GLS Detrending)和KPSS检验(Kwiatkowski-Phillips-Schmidt-Shin test)进行平稳性检验. 在预测过程中,时间序列的波动性越低,预测结果越有效可靠.
3) 特征工程. 在数据集中,负荷时间序列及其相关影响因素构成了特征. 面对多种特征,通过多种分析方法分别计算特征与负荷时间序列的相关性,采用D-S证据优化组合理论选取特征数据,使用
2.2. LSTNet-Atten模型的结构
提出LSTNet-Atten预测模型,通过卷积层、循环层和循环跳过层构成的非线性部分提取数据中的短期和长期依赖关系. 利用时间模式注意力机制重点关注关键序列,剔除干扰因素. 由自回归模型提取序列线性特征,将非线性部分与线性部分的结果进行叠加得到预测结果,结构如图3所示.
图 3
图 3 LSTNet-Atten 结构
Fig.3 Structure of long and short-term temporal network with attention
2.2.1. Convolution模块
该模块为不包含池化层的卷积神经网络(convolutional neural network, CNN),作用是提取预处理后的时序数据的短期局部特性和变量间的依赖关系,传入循环和循环跳过模块. 第
式中:
2.2.2. Recurrent和Recurrent-skip模块
卷积模块输出的特征向量将同时输入循环模块和循环跳跃模块. BiGRU模型由2层输出相同但信息传递方向相反的GRU组成,在任何时刻都可以接收来自正向和反向2个方向的信息,克服了传统GRU单向信息传递的不足,能够充分挖掘负荷数据的时序特征,提高数据利用率和模型预测精度. 选择BiGRU组成循环模块和循环跳过模块. BiGRU模型的基本结构如图4所示.
图 4
在时刻
式中:
通过BiGRU的双向循环结构,可以捕捉数据间的长期时序关系. 对于超长期的依赖关系,BiGRU无法提取到有效特征. 为了解决该问题,引入循环跳过模块. 循环跳过模块的计算过程如下:
式中:
在
Dense层的计算公式为
式中:
2.2.3. 时间模式注意力机制层
为了避免忽略时间序列中重要维度信息的特征,注意力机制被提出并被广泛应用于模型预测过程中. 经典的注意力机制是基于单个时间步骤的关联度计算,很难识别跨越多个时间步长的时间周期信息. 时间模式注意力机制(temporal pattern attention, TPA)通过一维卷积神经网络从隐层状态矩阵抽取特征,实现了时间序列与不同特征之间内在联系的提取. TPA算法的结构如图5所示.
图 5
采用BiGRU对输入序列进行处理,得到时间序列的隐藏特征
式中:
2.2.4. Autoregressive模块
由于卷积模块和循环模块的非线性特性,会影响预测模型对以非周期方式不断变化的输入数据的预测准确性,采用自回归(autoregressive,AR)模型作为负荷序列中线性数据的预测模型. 预测结果为
式中:
最终的预测结果由线性部分输出结果
式中:
3. 预测模型
3.1. 基于重组二次模态分解的短期负荷预测模型
由于受到天气、季节、用户行为及社会事件等多重因素的影响,负荷时间序列常常伴随着显著非线性和波动性,模型预测精度会受到影响. 为了克服这一难题,采用信号分解的方式降低序列中的波动性与复杂度,采集序列的变化规律,可以有效提升模型的预测性能.
采用CEEMADN方法对经过预处理的负荷序列进行初步分解,以简化负荷时序数据的复杂性. 为了减少后续模型训练时的计算量,使用样本熵方法评估分解后得到的各CIMF复杂程度,对具有相似复杂程度的分量组合重构. 为了进一步降低高频分量中的残留噪声,提高分解效果,采用VMD方法对重构后的高频分量Re-IMF1进行二次分解,得到最终的IMF集合. 使用D-S优化组合算法选取对模态分量贡献度高的特征,采用LSTNet-Atten模型预测分解后得到的各个分量,将IMF预测结果叠加,得到最终的预测结果. 预测的整体框架如图6所示.
图 6
图 6 重组二次模态分解及DS-LSTNet-Atten的短期负荷预测框架
Fig.6 Short-term load forecasting framework combining reconstructing secondary decomposition and DS-LSTNet-Atten
3.2. 预测网络的参数设置
采用Jupyter 集成开发环境,使用Pytorch和TensorFlow深度学习框架. 计算机系统为Win11,CPU为Intel Core i9-
对LSTNet-Atten预测模型的超参数采取遍历搜索最佳参数组合,使得模型的性能达到最佳. 最终的模型预测参数如表1所示.
表 1 LSTNet-Atten 模型的参数设定
Tab.1
参数 | 数值 |
输出通道 | 100 |
卷积核高度 | 7 |
输出通道 | 64 |
时间窗口宽度 | 7 |
跳过步数 | 4 |
扩张系数 | 1/2/4 |
窗口尺寸 | 7 |
学习率 | 0.001 |
Dropout率 | 0.2 |
优化算法 | RAdam |
3.3. 评价指标
为了全面、客观地展示不同模型的预测结果,采用以下评价指标:平均绝对误差(mean absolute error, MAE)、平均绝对百分比误差(mean absolute percentage error, MAPE)、均方根误差(root mean square error, RMSE)及拟合系数R2. 计算公式如下.
式中:
4. 实例分析
4.1. 数据描述及数据预处理
本文的实验数据来自于西班牙瓦伦西亚区域的负荷及气象数据,其中电力负荷数据来自于公共服务运营商(public service operators,PSO)的监督控制和数据采集系统(SCADA)中收集的公共用电数据. 天气数据来自于Kaggle开源数据,在瓦伦西亚开放气象API中获取. 实验数据的时间跨度为2016年1月1日到2016年12月31日,以8︰1︰1的比例划分为训练集、验证集和测试集. 时间分辨率为1 h. 预测方式为单步预测.
图 7
图 8
从图7可知,某一时刻的负荷不仅与相近时间步的负荷有关,而且与前一天甚至几天同一时刻的负荷有关,这表明研究对象具有长短期重复模式.
从图8可知,负荷序列存在以星期为周期的超长期重复模式,因此将输入和输出的序列长度分别设定为 168 和 1,输入为预测时刻前一周的负荷数据. 将前一周的数据用于学习超长期特征,前一天的数据用于学习长期特征.
表 2 ADF、DF-GLS和 KPSS 单位根检验
Tab.2
单位根检验方式 | H0假设 | Test statistic | P | 临界值 | ||
1% | 5% | 10% | ||||
ADF单位根检验 | 不能拒绝 | − | − | − | − | |
单位根检验方式 | H0假设 | Test statistic | P | 临界值 | ||
1% | 5% | 10% | ||||
DF-GLS单位根检验 | 不能拒绝 | − | − | − | − | |
单位根检验方式 | H0假设 | Test statistic | P | 临界值 | ||
1% | 5% | 10% | ||||
KPSS单位根检验 | 不能拒绝 |
4.2. 特征工程
采集到的原始数据中共有8个特征因素,考虑到时间戳中隐藏的日期和时段因素的不同对电力负荷的需求有所不同,将这些隐藏的时间因素加入特征因素中,以便进行更准确地预测. 具体情况如表3所示.
表 3 影响负荷数据的特征
Tab.3
类别 | 名称 | 描述 |
气候 | 温度 | 每小时平均温度 |
湿度 | 每小时平均湿度 | |
风速 | 每小时平均风速 | |
风向 | 每小时平均风向 | |
气压 | 每小时平均气压 | |
降雨量 | 每小时平均降雨量 | |
日期 | 季节 | 春夏秋冬:1、2、3、4 |
月度 | 1 月—12 月:1~12 | |
节假日 | 工作日:1;节假日:0 | |
周 | 周一—周日:1~7 | |
小时 | 0时—23时:1~24 | |
其他 | 电价 | 每小时平均电价 |
云层指标 | 每小时平均云层厚度 |
由于原始负荷序列分解后的IMF分量中含有不同的信息量,各分量与影响因素之间的相关性会改变,使用D-S证据理论方法对分量与影响因素进行特征筛选,以提高信息可靠性. 选取结果如图9所示. 图中,Re-IMF2和Re-IMF3表示原始序列通过CEEMDAN+SE方法重组后的模态分量,VIMF1~VIMF6表示Re-IMF1通过VMD方法再次分解后的各个IMF分量.
图 9
从图9可以看出,在影响模态分量的特征数据中,电价和温度、湿度等气候特征占有较大的权重,日期特征(小时和节假日)起到了一定的作用.
图 10
为了验证D-S优化组合算法和异常值处理对特征筛选处理的有效性,采用LSTNet-Atten预测模型,将其与D-S优化组合算法、皮尔逊相关系数、斯皮尔曼相关系数、最大信息系数和未处理的特征集进行对比. 此时,不同特征筛选方法的输入特征个数不同,继续使用拟合系数R2会降低预测结果的可信性,因此采用根据特征个数调整后的拟合系数
式中:
表 4 不同特征筛选方法的结果对比
Tab.4
特征筛选方法 | MAPE/% | MAE/MW | RMSE/MW | |
D-S优化组合- 异常值处理 | ||||
D-S优化组合 | ||||
皮尔逊相关系数 | ||||
斯皮尔曼相关系数 | ||||
最大信息系数 | ||||
未处理特征 |
4.3. 基于样本熵的二次模态分解及分析
如图11所示为10组本征模态函数(IMF)的分解结果. 可以看出,时间序列数据的频率随分解过程由高到低变化,使得整体的负荷变化趋势更加清晰.
图 11
表 5 各分量的样本熵
Tab.5
分量 | 分量 | |||
CIMF1 | CIMF6 | |||
CIMF2 | CIMF7 | |||
CIMF3 | CIMF8 | |||
CIMF4 | CIMF9 | |||
CIMF5 | CIMF10 |
式中:
经过样本熵重构所得的负荷强非平稳分量Re-IMF1包含较多的残留噪声,会使预测误差增大. 由于EMD、EEMD、CEEMD和CEEMDAN等经验模态分解都是基于EMD的改进,用它们继续分解高频序列Re-IMF1不能得到很好的结果. VMD可以通过迭代搜索变分模型的最优解来确定每个IMF的频率中心和带宽,从而自适应地实现信号和IMF的频域分割. 对重组分量Re-IMF1使用VMD方法进一步分解,以提高预测精度.
表 6 不同分解模态数对应的分量中心频率
Tab.6
K | |||||||
3 | — | — | — | — | |||
4 | — | — | — | ||||
5 | — | — | |||||
6 | — | ||||||
7 |
4.4. 不同预测模型对比研究分析
表 7 提出模型与单一模型的预测结果对比
Tab.7
预测方法 | R2 | MAPE/% | MAE/MW | RMSE/MW |
本文模型 | ||||
LSTM | ||||
GRU | ||||
CNN | ||||
TCN | ||||
BPNN | ||||
XGBoost | ||||
SVM |
本文模型和LSTGru-Atten模型相比,MAE提升了12.54%,MAPE提升了12.65%,RMSE提升了11.60%,这是得益于双向GRU利用了电力负荷的时间相关性.
对比本文模型和LSTNet-Attention模型可知,与传统注意力机制相结合的LSTNet模型性能比本文模型差. 其中,MAPE指标提升了约15.31%;从R2指标来看,本文的预测结果能够达到99.41%的拟合效果,这表明TPA机制使得模型能够更好地捕捉时间序列数据的动态特性和长期依赖关系,提升了模型在时间序列任务中的性能.
表 8 提出模型与混合模型的预测结果对比
Tab.8
预测方法 | R2 | MAPE/% | MAE/MW | RMSE/MW |
本文模型 | ||||
LSTGru-Atten | ||||
LSTNet-Attention | ||||
CNN-LSTM | ||||
CNN-GRU | ||||
TCN-LSTM | ||||
TCN-GRU |
为了进一步验证本文方法的预测效果及泛化能力,在不同季节的数据上进行预测对比实验. 模型预测效果的对比如表9所示. 表中,tp为预测步长. 对比4个季节的预测结果可知,各种方法在春季的各项评价指标上表现最好,在秋季的预测效果较差,这可能与瓦伦西亚春季气候较平稳而秋季气候波动性较大有关. 与其他4种方法相比,本文方法在4个季节均有最优的预测效果,且随着步长的增加,本文模型的MAPE变化范围不大,这体现了该模型在预测尺度变化方面具有一定的鲁棒性,能够合理地预测短期变化趋势.
表 9 不同季节的性能比较
Tab.9
季节 | tp | LSTM | GRU | CNN-LSTM | 本文模型 | |||||||
MAPE/% | RMSE/MW | MAPE/% | RMSE/MW | MAPE/% | RMSE/MW | MAPE/% | RMSE/MW | |||||
春季 | 3 | |||||||||||
春季 | 6 | |||||||||||
春季 | 12 | |||||||||||
夏季 | 3 | |||||||||||
夏季 | 6 | |||||||||||
夏季 | 12 | |||||||||||
秋季 | 3 | |||||||||||
秋季 | 6 | |||||||||||
秋季 | 12 | |||||||||||
冬季 | 3 | |||||||||||
冬季 | 6 | |||||||||||
冬季 | 12 |
4.5. 不同负荷分解方法的对比研究分析
为了验证本文所提模态分解方法的优势,以不进行分解、EMD分解、EEMD分解、CEEMDAN分解、CEEMDAN+SE分解与本文所提出的分解方式作为对比负荷分解方法. 不同模态分解方法与提出模型的预测结果对比如表10所示.
表 10 提出模型与其他分解方法的预测结果对比
Tab.10
预测模型 | R2 | MAPE/% | MAE/MW | RMSE/MW |
不分解 | 0.989 5 | 1.204 9 | 371.268 9 | 456.948 1 |
EMD分解 | 0.982 7 | 1.388 1 | 440.149 2 | 586.933 6 |
EEMD分解 | 0.990 1 | 1.187 5 | 368.648 7 | 443.853 4 |
CEEMDAN分解 | 0.990 2 | 1.150 3 | 356.471 4 | 439.469 8 |
CEEMDAN+SE分解 | 0.990 8 | 1.114 9 | 347.066 7 | 426.516 9 |
本文方法 | 0.994 1 | 0.935 2 | 288.261 4 | 344.441 6 |
利用EMD方法分解,会导致不同模态之间的混叠现象,负荷变化特征的提取效果受到限制. 利用EEMD方法分解,存在重构误差大的问题,影响了预测的精度. 从表10可以看出,EMD方法在负荷预测中的评价指标均比不进行负荷分解和使用EEMD方法差.
在EMD方法的基础上,结合EEMD方法,通过引入自适应噪声控制和多次迭代的方式,避免了EMD方法中的模态混叠和EEMD方法中的重构误差大的问题. 与不进行分解相比,CEEMDAN方法对应的预测性能更好. CEEMDAN和SE相结合,使得模型性能有所提升,说明SE方法促进了信号特征的提取,降低了数据波动性. 以评价指标MAPE和RMSE为例,与不进行模态分解、EMD分解、EEMD分解、CEEMDAN分解和CEEMDAN+SE分解相比,本文方法的MAPE分别降低了22.38%、32.63%、21.25%、18.69%、16.12%,RMSE分别降低了24.62%、41.32%、22.40%、21.62%、19.24%,表明基于CEEMDAN+SE+VMD分解算法的LSTNet-Atten预测模型性能最优,验证了所提负荷分解方法的有效性.
4.6. 消融研究分析
为了验证所提出LSTNet-Atten预测模型中各个模块对模型结构的影响,采用经过相同预处理的输入数据进行精细化的消融研究,即通过逐步移除预测模型的各个模块,评估它们对预测性能的具体贡献. 消融实验的设置分别如下:原模型(Origin)、去掉卷积模块(De-CNN)、去掉循环跳过模块(De-Skip)、去掉注意力模块(De-Attn)、去掉自回归模块(De-AR). 此外,保持模型相同部分的参数不变,以消除参数引起的性能影响.
各模型的预测结果如表11所示,可得如下结论.
表 11 消融研究的误差对比
Tab.11
预测模型 | R2 | MAPE/% | MAE/MW | RMSE/MW |
Origin | 0.994 1 | 0.935 2 | 288.261 4 | 344.441 6 |
De-CNN | 0.991 7 | 1.063 3 | 312.362 2 | 395.231 4 |
De-Skip | 0.990 1 | 1.194 4 | 371.136 5 | 445.511 2 |
De-Attn | 0.990 4 | 1.165 8 | 351.236 4 | 433.875 2 |
De-AR | 0.984 5 | 1.360 1 | 426.362 3 | 553.012 2 |
1)预测效果最好的模型是包含全部模块的LSTNet-Atten模型,该模型的各项指标都优于其他模型.
2)分别消除卷积模块、循环跳过模块及注意力机制模块后,模型误差都有所增大.
3)消除AR模块后,预测模型的预测精度明显下降,这说明在捕捉数据线性特征方面,AR模型起着重要的作用,有效降低了预测的误差.
经过消融实验证明,LSTNet-Atten预测模型中的每个模块都展现出了独特的优势,这使得该模型展现了优越的性能.
5. 结 论
(1)本文针对短期负荷预测中负荷数据复杂度高、具有周期性和波动性的问题,使用CEEMDAN+SE方法进行数据重组,削减分量噪声并显著增强负荷序列的可分析性. 对重组产生的高频强非平稳IMF分量进行VMD分解,可以获得更加稳定的子序列,从而提高预测的准确性.
(2)通过将LSTNet-Atten预测模型分为线性和非线性两部分,考虑了负荷数据所具有的长期和超长期重复模式,与传统的短期负荷预测模型相比,本文方法具有更强的鲁棒性和更高的预测精度.
(3)通过采用D-S证据理论对不同评价指标的特征选取差异进行优化组合,与不进行或使用单一特征筛选方法相比,预测的结果更好. 通过消融实验,证明了本文模型中各模块的必要性与有效性,提升了负荷预测的精度.
(4)在未来的负荷预测研究中,可以在本文的基础上考虑母线节点、微电网、单一用户、用户集群等不同场景对模型的不同要求,提升模型预测的泛化能力,增强负荷预测的现实作用.
参考文献
基于模态分解及注意力机制长短时间网络的短期负荷预测
[J].
Short-term load forecasting by long-and short-term temporal networks with attention based on modal decomposition
[J].
Industrial artificial intelligence based energy management system: Integrated framework for electricity load forecasting and fault prediction
[J].
基于人工智能技术的新型电力系统负荷预测研究综述
[J].
Review on artificial intelligence based load forecasting research for the new-type power system
[J].
Short-term combined forecasting method of park load based on CEEMD-MLR-LSSVR-SBO
[J].DOI:10.3390/en15082767 [本文引用: 1]
A hybrid residual dilated LSTM and exponential smoothing model for midterm electric load forecasting
[J].
Applications of random forest in multivariable response surface for short-term load forecasting
[J].
Probabilistic load forecasting based on adaptive online learning
[J].DOI:10.1109/TPWRS.2021.3050837 [本文引用: 1]
Data-driven load forecasting using machine learning and meteorological data
[J].DOI:10.32604/csse.2023.024633 [本文引用: 1]
Application of bidirectional recurrent neural network combined with deep belief network in short-term load forecasting
[J].
基于CNN-LSTM混合神经网络模型的短期负荷预测方法
[J].
Short-term load forecasting method based on CNN-LSTM hybrid neural network model
[J].
基于门控循环单元与误差修正的短期负荷预测
[J].
Short-term load forecasting based on gated cycle unit with error correction
[J].
基于聚合混合模态分解和时序卷积神经网络的综合能源系统负荷修正预测
[J].
Correction prediction of integrated energy system load based on aggregated mixed mode decomposition and TCN
[J].
A data-driven strategy for short-term electric load forecasting using dynamic mode decomposition model
[J].
基于多尺度分量特征学习的用户级超短期负荷预测
[J].
User-level ultra-short-term load forecasting based on multi-scale component feature learning
[J].
基于CEEMDAN-PE-WPD和多目标优化的超短期风电功率预测方法
[J].
Ultra-short-term wind power prediction method based on CEEMDAN-PE-WPD and multi-objective optimization
[J].
二次模态分解组合DBiLSTM-MLR的综合能源系统负荷预测
[J].
Integrated energy system load forecasting by combined DBiLSTM-MLR with quadratic modal decomposition
[J].
Multi-step wind speed prediction by combining a WRF simulation and an error correction strategy
[J].
基于深度混合储备池计算模型的短期电力负荷预测
[J].
Short-term electrical load prediction based on deep hybrid reservoir calculation model
[J].
基于QMD-HBiGRU的短期光伏功率预测方法
[J].
Short-term PV power prediction method based on QMD-HBiGRU
[J].
基于FPA-VMD和BiLSTM神经网络的新型两阶段短期电力负荷预测
[J].
A novel two-stage model based on FPA-VMD and BiLSTM neural network for short-term power load forecasting
[J].
Self-attention-based short-term load forecasting considering demand-side management
[J].DOI:10.3390/en15124198 [本文引用: 1]
A load forecasting framework considering hybrid ensemble deep learning with two-stage load decomposition
[J].DOI:10.1109/TIA.2024.3354222 [本文引用: 1]
/
〈 |
|
〉 |
