浙江大学学报(工学版), 2026, 60(5): 998-1005 doi: 10.3785/j.issn.1008-973X.2026.05.009

能源与动力工程

基于改进LSTM的商业建筑冷负荷预测模型

董芳楠,, 武强, 刘佳瑶, 于军琪

1. 陕西工业职业技术大学 数智城市学院,咸阳市建筑健康监测与绿色加固重点实验室,陕西 咸阳 712000

2. 西安建筑科技大学 信息与控制工程学院,陕西 西安 710311

Cooling load prediction model for commercial buildings based on improved LSTM

DONG Fangnan,, WU Qiang, LIU Jiayao, YU Junqi

1. College of Digital Intelligence City, Xianyang Key Laboratory of Building Health Monitoring and Green Reinforcement, Shaanxi Polytechnic University, Xianyang 712000, China

2. College of Information and Control Engineering, Xi'an University of Architecture and Technology, Xi'an 710311, China

收稿日期: 2025-06-10  

基金资助: 陕西工业职业技术大学科研计划项目(2024YKYB-021);国家重点研发计划项目(2022YFC3802700).

Received: 2025-06-10  

Fund supported: 陕西工业职业技术大学科研计划项目(2024YKYB-021);国家重点研发计划项目(2022YFC3802700).

作者简介 About authors

董芳楠(1997—),女,助教,博士生,从事建筑节能与优化研究.orcid.org/0009-0000-7178-8390.E-mail:dfangnan@xauat.edu.cn , E-mail:dfangnan@xauat.edu.cn

摘要

传统冷负荷预测多未考虑时间因素,导致预测效果差和泛化能力低,为此提出基于权重衰减适应性矩估计优化算法的长短期记忆(LSTM)神经网络预测模型(WAdam-LSTM),用于建筑的高精度冷负荷预测. 采用交叉相关函数得到变量最佳特征作为输入变量,更新LSTM变量参数时引入权重衰减项,构建WAdam-LSTM. 以2个典型大型商业建筑逐时冷负荷数据为样本开展模型预测性能对比实验. 结果表明:解耦权重衰减项的引入提高了优化算法的稳定性和收敛性,适用于LSTM网络的参数优化;WAdam-LSTM比SVR、SCOA-LSTM和Adam-LSTM的预测效果更准确,均方误差分别下降了83%、66%和30%;WAdam-LSTM具有比单一模型(LSTM、SVR和BPNN)和混合预测模型(SCOA-LSTM和Adam-LSTM)更强的泛化能力,能对不同商业建筑不同月份的冷负荷进行精确预测.

关键词: 商业建筑 ; 冷负荷 ; 长短期记忆(LSTM) ; Adam算法 ; 预测性能

Abstract

Traditional cooling load prediction methods often neglect temporal factors, leading to poor prediction performance and low generalization ability. To address these issues, a long short-term memory (LSTM) neural network prediction model optimized by the weight decay adaptive moment estimation algorithm (WAdam-LSTM) was proposed for high-precision building cooling load prediction. The cross-correlation function was employed to identify optimal feature variables as model inputs. WAdam-LSTM was constructed by introducing a weight decay term during the update of LSTM variable parameters. Hourly cooling load data from two representative large commercial buildings were used to evaluate and compare model prediction performance. Results show that the incorporation of the decoupled weight decay term enhances the stability and convergence of the optimization algorithm, making it suitable for LSTM network parameter optimization. WAdam-LSTM demonstrates superior prediction accuracy compared to SVR, SCOA-LSTM, and Adam-LSTM, with mean square error reductions of 83%, 66%, and 30%, respectively. WAdam-LSTM exhibits stronger generalization ability than single models (LSTM, SVR, and BPNN) and hybrid prediction models (SCOA-LSTM and Adam-LSTM), enabling precise cooling load predictions for different commercial buildings across varying months.

Keywords: commercial buildings ; cooling load ; long short-term memory(LSTM) ; Adam algorithm ; predictive performance

PDF (892KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

董芳楠, 武强, 刘佳瑶, 于军琪. 基于改进LSTM的商业建筑冷负荷预测模型. 浙江大学学报(工学版)[J], 2026, 60(5): 998-1005 doi:10.3785/j.issn.1008-973X.2026.05.009

DONG Fangnan, WU Qiang, LIU Jiayao, YU Junqi. Cooling load prediction model for commercial buildings based on improved LSTM. Journal of Zhejiang University(Engineering Science)[J], 2026, 60(5): 998-1005 doi:10.3785/j.issn.1008-973X.2026.05.009

商业建筑由于面积大、人流量多、作业时间长,对照明、空调需求高,能耗占比高达40%[1]. 中央空调系统是建筑中最大的单体能耗系统,冷负荷预测是提高能源利用效率,为供需匹配提供参考的有力依据. 建筑负荷预测的方法主要分为3类:机理模型、统计模型和数据驱动模型[2]. 其中数据驱动模型以普适性和高精度的优点被广泛采用.

人工神经网络(artificial neural network, ANN)通过训练数据来学习内部规律,从而进行逐日能耗预测. Kim等[3]通过预测韩国首尔某机构大楼峰值负荷,证明ANN模型具有良好的预测精度. Hou等[4]结合粗糙集理论和ANN来预测冷负荷. Wang等[5]采用改进的牧象优化(improved elephant herding optimization, IEHO)对反向传播神经网络(back propagation neural network, BPNN)进行优化,实验表明此模型相比粒子群优化-反向传播(particle swarm optimization-back propagation, PSO-BP)和牧象优化-反向传播(elephant herding optimization-back propagation, EHO-BP)模型在冷热负荷预测中更准确,振荡更小. 贾鹏等[6]构建基于支持向量回归(support vector regression, SVR)理论的短期电网负荷预测模型. Mohandes[7]对比了支持向量机与自动回归模型在短期电力负荷预测中的应用性能. 时间序列预测模型也被用于短期电力负荷预测,这些模型可以利用负荷数据本身的时空动态特征来建立数学表达式,描述负荷与时间之间的依赖关系,但在处理数据平稳性、季节性和周期性方面存在困难[8]. 具备时序记忆功能的长短期记忆(long short-term memory, LSTM)可进一步挖掘数据中的时间序列信息[9-12]. 不同网络模型在建筑冷负荷预测方面存在以下问题:1)没有兼顾建筑负荷数据时序性和非线性的特点,当负荷变化剧烈时,预测模型的跟随性和精确性表现很差;2)混合模型仅为执行特定的任务而设计,不具备普遍适用性.

本研究提出基于权重衰减适应性矩估计优化算法的LSTM神经网络预测模型(weight decay adaptive moment estimation - LSTM, WAdam-LSTM),用于商业建筑冷负荷的短期预测. 1)采用交叉相关函数表示输入变量的非线性特征,筛选输入变量,避免相关性低的输入变量影响预测精度. 2)采用WAdam,在更新LSTM变量参数时引入权重衰减项,进一步提高模型的预测精度和稳定性. 3)以某市2个大型商业建筑夏季空调冷负荷数据为样本,将WAdam-LSTM与3种单一模型和2种混合模型进行对比,证实WAdam-LSTM在商业建筑冷负荷预测方面的精度、稳定性和泛化能力.

1. 模型理论

1.1. LSTM神经网络

LSTM由1个或者多个记忆细胞的记忆块组成,在处理连续值时具有很好的泛化性,在具有较大滞后的时间序列中表现良好[13-14],适用于建筑冷负荷这类连续且周期性变化数据的预测. LSTM包含遗忘门、输入门和输出门,通过调节阀门开关获得模型的记忆功能,选择性地保留和遗忘之前的数据,保留早期序列对最终结果的影响. 1)遗忘门单元引入“记忆”与“忘记”机制,决定前一时间步的信息忘记多少,计算式为

$ {\boldsymbol{f}}_{t}=\text{sigmoid}\;({\boldsymbol{W}}_{\text{f}}[{\boldsymbol{x}}_{t},{\boldsymbol{h}}_{t\mathbf-\text{1}}]+{\boldsymbol{b}}_{\text{f}}). $

式中:$ {\boldsymbol{f}}_{t} $为遗忘门,$ {\boldsymbol{W}}_{\text{f}} $为遗忘门权重,$ {\boldsymbol{x}}_{t} $为输入值,$ {\boldsymbol{h}}_{t-1} $t-1时刻输出值,$ {\boldsymbol{b}}_{\text{f}} $为遗忘门偏置向量,sigmoid为激活函数. 2)输入门对输入信息进行写入和更新,决定哪些数据将要存储到存储单元:

$ {\boldsymbol{i}}_{t}=\text{sigmoid}\;({\boldsymbol{W}}_{{\mathrm{i}}}[{\boldsymbol{x}}_{t},{\boldsymbol{h}}_{t-1}]+{\boldsymbol{b}}_{\mathrm{i}}), $

$ {\mathbf{\tilde{\boldsymbol{C}}}}_{t}=\tanh\; ({\boldsymbol{W}}_{\text{C}}[{\boldsymbol{x}}_{t},{\boldsymbol{h}}_{t-1}]+{\boldsymbol{b}}_{\text{C}}). $

式中:$ {\boldsymbol{i}}_{t} $为输入门,$ {\boldsymbol{W}}_{\mathrm{i}} $为输入门权重,$ {\boldsymbol{W}}_{\text{C}} $为细胞状态权重,$ {\boldsymbol{b}}_{\mathrm{i}} $$ {\boldsymbol{b}}_{\text{C}} $为输入门和细胞状态偏置向量,$ {\mathbf{\tilde{\boldsymbol{C}}}}_{t} $细胞状态更新值,$ \tanh $为激活函数. 3)完成以上操作后,一些信息被忘记或被添加,须将先前的状态值更新至细胞状态$ {\boldsymbol{C}}_{t} $

$ {\boldsymbol{C}}_{t}={\boldsymbol{f}}_{t}\cdot {\boldsymbol{C}}_{t-1}+{\boldsymbol{i}}_{t}\cdot {\mathbf{\tilde{\boldsymbol{C}}}}_{t}. $

式中:$ {\boldsymbol{C}}_{t} $$ {\boldsymbol{C}}_{t-1} $分别为tt−1时刻细胞状态. 4)在输出门中,LSTM输出结果. 输入值通过sigmoid激活函数处理得到$ {\boldsymbol{o}}_{t} $,$ {\boldsymbol{C}}_{t} $$ \tanh $函数处理后与$ {\boldsymbol{o}}_{t} $相乘得到最终输出结果$ {\boldsymbol{h}}_{t} $

$ {\boldsymbol{o}}_{t}=\text{sigmoid}\;({\boldsymbol{W}}_{\text{o}}[{\boldsymbol{x}}_{t},{\boldsymbol{h}}_{t-1}]+{\boldsymbol{b}}_{\text{o}}), $

$ {\boldsymbol{h}}_{t}={\boldsymbol{o}}_{t}\cdot \tanh\; ({\boldsymbol{C}}_{t}). $

式中:$ {\boldsymbol{W}}_{\text{o}} $为输出门权重,$ {\boldsymbol{b}}_{\text{o}} $为输出门偏置向量,$ {\boldsymbol{o}}_{t} $为输出门,$ {\boldsymbol{h}}_{t} $为输出.

1.2. 适应性矩估计优化算法

机器学习的首要任务是找到最优的参数值以及最小化损失函数. Adam作为基于一阶梯度的随机目标函数优化算法,用来更新和计算模型的网络参数,使模型向最优逼近或达到最优[15-16]. 引入梯度的一阶矩向量与二阶矩向量,使得梯度的伸缩不影响参数的更新,得到的超参数可解释性好,初始学习率被控制在某个范围内,学习率可在确定范围内自动调整[17]

$ {\boldsymbol{g}}_{t}={\nabla }_{\theta }J({\boldsymbol{\theta }}_{t-1}), $

$ {\boldsymbol{m}}_{t}={\beta }_{1}{\boldsymbol{m}}_{t-1}+(1-{\beta }_{1}){\boldsymbol{g}}_{t},$

$ {\boldsymbol{v}}_{t}={\beta }_{2}{\boldsymbol{v}}_{t-1}+(1-{\beta }_{2})\boldsymbol{g}_{t}^{2}, $

$ {\boldsymbol{\theta }}_{t}={\boldsymbol{\theta }}_{t-1}-\frac{\eta }{\sqrt{{{\hat{\boldsymbol{v}}}}_{t}}+\varepsilon }\cdot {\boldsymbol{m}}_{t}. $

式中:$ {\boldsymbol{g}}_{t} $$ {t} $时间步的梯度;$ {\boldsymbol{m}}_{t} $为第一矩向量;$ {\beta }_{1} $为第一次估计的指数衰减率,用来控制动量与此刻时间$ {\beta }_{2} $步梯度的权重分配;$ {\boldsymbol{v}}_{t} $为第二矩向量,初始值$ {v}_{0} $=0;$ {\beta }_{2} $为第二次估计的指数衰减率,用来控制此刻梯度平方的占比;$ {\boldsymbol{\theta }}_{t} $为更新后的参数向量;$ \eta $为学习率,$ \eta $=0.001;$ \varepsilon $为避免除数为零的极小值,$ \varepsilon $=1.0×10−8. $ {m}_{0} $初值为零,导致初始阶段接近于0,同理,须对$ {\boldsymbol{m}}_{t} $$ {\boldsymbol{v}}_{t} $进行偏差修正,减少初期由偏差引起的寻优速率降低:

$ {{\hat{\boldsymbol{m}}}}_{t}=\frac{{\boldsymbol{m}}_{t}}{1-\beta _{1}^{t}}, $

$ {{\hat{\boldsymbol{v}}}}_{t}=\frac{{\boldsymbol{v}}_{t}}{1-\beta _{2}^{t}}. $

式中:$ \beta _{1}^{t} $$ \beta _{2}^{t} $分别为$ {\beta }_{1} $$ {\beta }_{2} $${t} $次幂,$ {{\hat{\boldsymbol{m}}}}_{t} $$ {\boldsymbol{m}}_{t} $的偏差修正,$ {{\hat{\boldsymbol{v}}}}_{t} $$ {\boldsymbol{v}}_{t} $的偏差修正.

1.3. 改进的Adam优化器

传统的Adam优化器对梯度的一阶和二阶矩向量进行估计,经偏差修正后,计算不同参数的个体自适应学习率,并找到参数的最优值. 大量学者研究发现,某些任务中由于权重衰减,Adam的稳定性及泛化能力不足. 本研究结合传统Adam在梯度矩估计后,经过偏差修正,在参数更新时引入权重衰减项,得到基于权重衰减的随机梯度优化器WAdam. WAdam在每次更新梯度时进行衰减,避免产生的参数过大,将个体自适应学习率的更新与权重衰减解耦,实现超参数的独立优化,减少各参数同时优化过程中的相互影响:

$ {\boldsymbol{\theta }}_{t}={\boldsymbol{\theta }}_{t-1}-\frac{\eta }{\sqrt{{{\hat{\boldsymbol{v}}}}_{t}}+\varepsilon }\cdot {\boldsymbol{m}}_{t}-\eta {\omega }_{t-1}{\boldsymbol{\theta }}_{t-1}, $

$ \boldsymbol{\theta }=[\boldsymbol{W},\boldsymbol{b}]. $

式中:$ \boldsymbol{W} $包含$ {\boldsymbol{W}}_{\text{f}} $$ {\boldsymbol{W}}_{\mathrm{i}} $$ {\boldsymbol{W}}_{\text{C}} $$ {\boldsymbol{W}}_{\text{o}} $$ \boldsymbol{b} $包含$ {\boldsymbol{b}}_{\text{f}} $$ {\boldsymbol{b}}_{\mathrm{i}} $$ {\boldsymbol{b}}_{\text{C}} $$ {\boldsymbol{b}}_{\text{o}} $$ \omega $为权重衰减率,$ {\boldsymbol{\theta }}_{t-1} $为更新前的参数向量.

2. 冷负荷预测模型建立

2.1. 预测模型架构

图1所示,冷负荷预测模型由4层结构组成,包括数据采集层、数据预处理层、数据分析层和数据应用层. 数据采集层采用自动化设备(如高精度的传感器、控制器)采集、汇总与存储影响建筑负荷的温湿度、太阳辐射和风速等数据. 数据预处理层对采集的原始数据中的异常值进行剔除,通过插值法和平均滤波器处理缺失数据[18-19],相关分析法确定冷负荷与各影响因素之间的相关性并进行适当筛选. 数据须进行最小-最大归一化处理,解决因数据量纲不同引起学习模型格式不兼容的问题. 在数据处理中引入交叉验证,将数据划分为训练集和测试集. 数据分析层利用WAdam对LSTM网络进行优化,得到参数的最优值,使用训练集训练模型. 数据应用层根据测试集输入,计算大型商业建筑指定时间的负荷预测值,与真实负荷值对比计算模型性能.

图 1

图 1   冷负荷预测模型架构图

Fig.1   Architecture diagram of cooling load prediction model


2.2. 预测模型建立

搭建WAdam-LSTM的步骤如下. 1)数据预处理:数据集使用某市2个大型商业建筑内采集的真实冷负荷数据和气象数据,将数据集划分为训练集与测试集,利用训练集建模. 2)提取特征变量:充分考虑时间因素,采用交叉相关函数研究冷负荷与各影响因素在不同滞后周期的相关性. 3)优化LSTM结构:采用网格搜索方法确定LSTM批次、隐藏层个数和隐藏单元数;利用WAdam优化LSTM中的参数$ {\boldsymbol{W}}_{\text{f}} $$ {\boldsymbol{W}}_{\text{i}} $$ {\boldsymbol{W}}_{\text{C}} $$ {\boldsymbol{W}}_{\text{o}} $$ {\boldsymbol{b}}_{\text{f}} $$ {\boldsymbol{b}}_{\text{i}} $$ {\boldsymbol{b}}_{\text{C}} $$ {\boldsymbol{b}}_{\text{o}} $,找到使损失函数最小的一组参数,得到最优LSTM预测模型. 4)短期冷负荷预测:使用测试集对步骤3)得到的最优预测模型进行测试,得到短期冷负荷预测值. 根据测试集中真实冷负荷值,使用均方误差MSE、均方根误差变异系数CV-RMSE、平均绝对百分比误差MAPE评估预测模型的准确性[20- 21].

3. 案例研究

3.1. 实验描述

建筑1高度约为40.6 m,建筑面积约为2.5×105 m2;建筑2高度约为16 m,建筑面积约为2.1×104 m2. 考虑到商业建筑的工作特点,建筑1和2每天营业时间分别为8:00—22:00和8:00—21:00,空调系统采用间歇式运行模式. 负荷预测的目的是为设备侧的优化调度提供决策,因此预测建模中数据集包含温度、湿度、太阳辐射、风速和空调负荷等实际数据,每小时记录一次,其中空调负荷数据通过空调能效比和实际耗电量计算得到. 建筑对象特征信息如表1所示,其中SHLT分别为建筑面积、高度、层高和建筑物体型参数,rww为窗墙比,建筑物冷负荷样本NS数据统计如表2所示. 实验数据的主要采集设备包括温湿度传感器、太阳辐射传感器、微型风速传感器、智能电表、智能网关、DDC控制器、数据集中器、空气开关和24V开关电源,设备参数如表3所示. 所提预测模型在运行Windows 10操作系统的AMD R7处理器@ 3.30 GHz系统上使用Python 3.8搭建. 仿真实验在Python中基于TensorFlow的Keras深度学习库中实现. 采集设备遭遇极端天气会影响测量精度,数据传输过程中也会出现坏值或者数据缺失的情况,因此利用SPSS软件,使用插值法对缺失和异常数据进行检查和处理,采用最小-最大归一化处理样本数据,避免预测精度下降:

表 1   研究对象特征信息

Tab.1  Characteristic information of study objects

研究对象S/(104 m2H/mL/mTrww
建筑125.040.650.110.65(南),0.45(东),
0.44(西),0.50(北)
建筑22.116.040.130.55(南),0.49(东),
0.34(西),0.49(北)

新窗口打开| 下载CSV


表 2   建筑物冷负荷样本数据统计

Tab.2  Statistics of building cooling load samples

研究
对象
建筑营业时间时间范围NS
总数训练集测试集
建筑18:00—22:002023年6月2日—
8月12日
108097995
2023年6月43538445
2023年7月46541445
2023年8月18012945
建筑28:00—21:002023年6月1日—
8月31日
12881162135
2023年6月420
37836
2023年7月434
39236
2023年8月43439236

新窗口打开| 下载CSV


表 3   冷负荷数据采集设备参数信息

Tab.3  Parameters of cooling load data acquisition equipment

设备名称设备品牌精度测量范围
温湿度传感器建大仁科±0.3 ℃,
±2% RH
−40 ~ 80 ℃,
0% ~ 100% RH
太阳辐射传感器普锐森社1 W·m−20 ~ 1800 W·m−2
微型风速传感器YGC-FS0.1 m·s−10 ~ 70 m·s−1
智能电表威胜-DTZ3410.2 s

新窗口打开| 下载CSV


$ {x}^{\prime}=\frac{x-{x}_{\min }}{{x}_{\max }-{x}_{\min }}. $

式中:$ x $为样本,$ {x}_{\min } $$ {x}_{\max } $分别为样本最小值和最大值.

通过观察每组数据的内部规律,采用交叉相关函数研究冷负荷与各影响因素之间的相关性,筛选出相关性高的因素. 如图2所示为负荷与其他影响因素在滞后周期$|\tau| $=6 h的相关性,C为置信度. 可以看出,负荷与温度、湿度、太阳辐射和前一时刻负荷之间的相关性均超出置信度上限或下限,负荷与风速的相关性最低,因此剔除风速变量.

图 2

图 2   建筑物冷负荷影响因素相关性分析图$(|\tau| \leqslant 6 \;\text{h})$

Fig.2   Correlation analysis of building cooling load influencing factors ($|\tau| \leqslant 6 \;\text{h} $)


对WAdam-LSTM实验参数进行多轮调试,并参考相关文献得到建筑冷负荷预测的参数设置如表4所示. 使用MAPE、MSE和CV-RMSE为预测模型性能的评估指标,计算式分别为

表 4   模型预测性能对比实验的参数设置

Tab.4  Parameter settings for model prediction performance comparison experiments

参数数值参数数值
学习率η0.001迭代次数e100
衰减率β1, β20.9, 0.999隐藏层数h1
权重衰减率ω0.99隐藏单元数u13
极小值ε1.0×10−8批次c15

新窗口打开| 下载CSV


$ \text{MAPE}=\frac{1}{{N}}\sum\limits_{{i}=1}^{{N}}{\left(\frac{{\hat{y}}_{{i}}-{y}_{{i}}}{{y}_{{i}}}\right)}^{2},$

$ \text{MSE}=\frac{1}{{N}}\sum\limits_{i\text{=1}}^{{N}}{({{\hat{y}}_{{i}}}-{{y}_{{i}}})}^{2}, $

$ \text{CV-RMSE}=\frac{\sqrt{\dfrac{1}{{N}}\displaystyle\sum\limits_{{i=1}}^{{N}}{({{\hat{y}}_{{i}}}-{{y}_{{i}}})}^{2}}}{\dfrac{1}{{N}}\displaystyle\sum\limits_{{i=1}}^{{N}}{\hat{y}}_{{i}}}. $

式中:$ {N} $为测试集样本数,$ {y}_{{i}} $为第i个预测点的实际值,$ {\hat{y}}_{{i}} $为相应的预测值.

3.2. 结果与讨论

3.2.1. LSTM参数优化结果与分析

LSTM预测模型中的参数包括隐藏层数、隐藏单元数、批次、权重及偏置. 通过网格搜索算法优化LSTM模型的参数,得到预测模型的最佳批次为15,最优隐藏单元为13,隐藏层个数为3. 实验以平均绝对误差作为损失,验证不同隐藏层在最优隐藏单元和批次条件下损失值l的大小,如图3所示. 可以看出:2个隐藏层的损失略高于其他2个,其中3个隐藏层的损失最小. 如图4所示,使用部分测试集验证在最佳批次和隐藏单元下损失值变化,当隐藏层数为3时出现过拟合现象,因此最佳隐藏层个数为1.

图 3

图 3   不同隐藏层数对应损失值随迭代次数的变化

Fig.3   Analysis of loss variation with iteration epochs for different numbers of hidden layers


图 4

图 4   不同数据集上的隐藏层数对应损失值对比

Fig.4   Comparison of loss values for different hidden layers numbers across data sets


3.2.2. 预测结果分析

为了验证WAdam-LSTM的预测精度,将WAdam-LSTM与SVR、BPNN、LSTM、SCOA-LSTM、Adam-LSTM等经典算法进行比较. 所有算法均基于相同的数据集和最优参数进行预测,如图5所示为建筑1随时间t变化的冷负荷QC预测误差对比结果,结果表明SVR在周内的误差明显高于LSTM网络. 分析发现,外界环境因素对空调系统能耗的影响较大,波动性较强,如温度和太阳辐射的输入参数也是导致SVR性能下降的原因. 模型输入和输出变量之间的相关性较差,是BPNN预测精度较低的主要原因. LSTM是递归神经网络,既保留了SVR神经网络的非线性映射能力,又适合处理趋势数据.

图 5

图 5   不同模型的逐时空调能耗预测结果绝对误差

Fig.5   Absolute error of hourly air-conditioning energy consumption predictions for different models


对比单数据驱动模型与混合模型的性能,计算最佳架构下不同预测模型的性能指标如表5所示. 在建筑1中LSTM的3个性能指标与BPNN相比降低了19%~46%不等,与SVR相比降低了14%~30%不等,由此可见,单数据驱动模型LSTM的预测精度高于SVR和BPNN. 应用不同优化算法优化LSTM后,预测效果有显著提升,对照图5发现,SCOA-LSTM的绝对误差较大、稳定性较差,WAdam-LSTM误差表现更为稳定,冷负荷预测值与实际值的误差波动范围均不超过15%. 综合对比可知,WAdam-LSTM相比对比模型在各种性能评价指标上均有显著提升.

表 5   不同冷负荷预测模型的性能指标对比

Tab.5  Comparison of performance metrics for different cooling load prediction models

建筑物预测模型CV-RMSEMAPEMSE
建筑1LSTM0.15313.100.272
Adam-LSTM0.1075.700.083
SVR0.16316.200.354
BPNN0.19017.030.504
SCOA-LSTM0.12111.600.173
WAdam-LSTM0.0632.700.058
建筑2LSTM0.15319.400.269
Adam-LSTM0.07910.900.146
SVR0.17315.700.312
BPNN0.15718.140.474
SCOA-LSTM0.11210.900.146
WAdam-LSTM0.0725.200.059

新窗口打开| 下载CSV


对比分析2个建筑在考虑人员密度与忽略内扰影响时的预测性能差异,得出以下结论:当引入人员密度作为输入变量时,模型计算的3个关键性能指标与基准模型的偏差为3%~7%,该差异在工程应用范围内可忽略. 原因是1)内扰中用户行为与历史负荷数据、气象参数之间存在显著的耦合关系,模型通过数据驱动的方式自动学习了内扰与外扰的内在关联. 2)基于6—8月空调使用高峰期采集的1 000余个监测点位数据,涵盖工作日与周末、不同时间段以及极端天气条件的各种运行工况,这种高密度多场景的数据采集方式确保了模型能够通过负荷特征变化学习到内扰的影响规律,降低对人员密度参数的依赖.

3.2.3. 模型性能验证

为了进一步验证WAdam对LSTM的优化能力,针对建筑1的6月份冷负荷数据采用SCOA、Adam和WAdam对LSTM的参数进行优化,收敛曲线如图6所示. 可以看出,3种算法的适应度值收敛曲线均呈下降趋势,但WAdam收敛时间最短,对应的收敛曲线也比SCOA和Adam更稳定. 该结果表明,与SCOA和Adam相比,WAdam的收敛性和稳定性更好,适用于LSTM的参数优化.

图 6

图 6   LSTM优化算法的收敛特性曲线对比

Fig.6   Convergence curve comparison of optimization algorithms for LSTM training


为了证明WAdam-LSTM的泛化能力,使用2个建筑对夏季不同月份进行样本划分,得到的预测结果如表6所示. 可以发现,BPNN对2个建筑的预测精度整体较差,SVR在2个建筑上的预测结果相比其他模型误差较大,其他对比模型的预测精度和误差有一定程度的提升,WAdam-LSTM在不同月份对2个建筑的预测精度整体较高且误差范围较小. 当只有少量样本时,WAdam-LSTM比其他单一或混合预测模型具有更强的泛化能力.

表 6   不同模型对不同月份建筑物冷负荷预测准确性的对比

Tab.6  Comparison of monthly building cooling load prediction accuracy across different models

建筑月份模型CV-RMSE建筑月份模型CV-RMSE
建筑16月LSTM1.387建筑26月LSTM1.197
SVR2.659SVR2.114
BPNN3.019BPNN2.546
Adam-LSTM1.113Adam-LSTM1.000
SCOA-LSTM0.641SCOA-LSTM0.641
WAdam-LSTM0.761WAdam-LSTM0.833
7月LSTM1.8127月LSTM1.806
SVR2.422SVR2.359
BPNN2.767BPNN2.871
Adam-LSTM1.066Adam-LSTM1.057
SCOA-LSTM0.867SCOA-LSTM0.812
WAdam-LSTM0.653WAdam-LSTM0.487
8月LSTM1.8038月LSTM1.707
SVR2.387SVR2.308
BPNN2.281BPNN2.436
Adam-LSTM1.141Adam-LSTM1.108
SCOA-LSTM1.478SCOA-LSTM1.337
WAdam-LSTM0.592WAdam-LSTM0.595

新窗口打开| 下载CSV


以模型运行时间t和运行时的内存占比R为评价指标,对比5种模型的计算复杂度,所有实验均在相同运行环境下完成,结果如图7所示. LSTM、SVR、BPNN、Adam-LSTM、SCOA-LSTM和WAdam-LSTM的运行时间分别为43.9、32.8、24.4、32.1、37.6和30.2 s,内存占比分别为38.6%、28.4%、26.4%、23.5%、27.7%和23.1%. 在运行时间方面,单一模型中LSTM的运行时间最长,原因是LSTM处理非线性问题时其结构比SVR与BPNN更加复杂,借助智能优化算法可降低预测模型的训练时长,Adam-LSTM和SCOA-LSTM这2种改进后的LSTM模型训练时长更短. 相比Adam-LSTM和SCOA-LSTM,WAdam-LSTM训练时长最短,改进后Adam个体自适应学习率的更新与权重衰减解耦,更适应于模型的各耦合参数输入. 在内存占用方面,LSTM比SVR大,在测试集相同情况下网络结构更为复杂,经过智能算法优化改进后的LSTM模型的内存占用更少,综合考虑WAdam-LSTM在预测效果方面的优越性更高,计算复杂度更低,更适合于实际应用.

图 7

图 7   预测模型的计算复杂度对比

Fig.7   Computational complexity comparison of prediction models


WAdam-LSTM在空调冷负荷预测中的应用虽然具有显著优势,但存在一些固有的技术局限性. 这些局限性主要体现在模型基于循环神经网络的核心架构. LSTM逐步处理时序数据的特性限制了并行化计算能力,使得它在处理大规模数据集时的效率明显低于CNN或Transformer架构. 在北方地区空调冷负荷预测这一特定应用场景中,这个局限性不会对实际工程应用造成实质性影响. 北方地区空调负荷具有典型的季节性特征,全年有效数据集中在6—9月约120 d内,即使按30 min采样频率计算,年度总样本量为5856条,远低于模型处理能力上限. 更重要的是,北方地区的空调负荷变化主要受短期气候因素主导,包括温度波动和湿度变化的滞后效应,这些短周期特性使得模型4~6步的记忆窗口完全能够满足预测需求. 如果将该模型应用于热带地区需要全年使用空调的场景,由于数据量会增加3~5倍,且需要处理跨季节的长期气候依赖关系(如季风影响),这时所提模型的性能可能会显著下降,在这种情况下,须改用具有并行计算优势的架构,引入注意力机制增强的模型.

4. 结 语

以提高大型商业建筑冷负荷预测精度和泛化能力为目标,引入时间序列预测思想,结合WAdam优化算法建立WAdam-LSTM,采用2个实际大型商业建筑夏季冷负荷数据作为短期预测研究案例,对WAdam-LSTM预测效果进行验证,从预测性能的角度将该方法与主流的模型进行比较得出以下结论. 1) WAdam-LSTM比SVR网络模型更能充分有效记忆历史数据,较Adam-LSTM的稳定性能更强,预测精度更高. 以建筑1为例,与SVR和LSTM相比逐时冷负荷预测的MSE分别降低了83%和78%,与SCOA-LSTM和Adam-LSTM相比MSE分别降低了66%和30%,与BPNN相比MSE降低了88%,因此,WAdam-LSTM预测精度更高,稳定性更好,更适应于商业建筑短期能耗预测. 2) 从SCOA、Adam和WAdam对LSTM的参数优化收敛曲线可知,WAdam收敛更快且更平坦,WAdam具有较好的稳定性和收敛性,可应用于LSTM参数优化. 3) 由预测结果可知,在少量样本情况下,WAdam-LSTM比参与对比的单一或混合预测模型的预测结果更准确,泛化能力更强. 现有的研究仅适用于商用建筑的冷负荷预测,在未来的工作中,将进一步研究不同建筑负荷特点,将WAdam-LSTM应用在住宅或写字楼建筑中以提高模型的普适性.

参考文献

GAO L, LIU T, CAO T, et al

Comparing deep learning models for multi energy vectors prediction on multiple types of building

[J]. Applied Energy, 2021, 301: 117486

DOI:10.1016/j.apenergy.2021.117486      [本文引用: 1]

SOMU N, RAMAN G M R, RAMAMRITHAM K

A hybrid model for building energy consumption forecasting using long short term memory networks

[J]. Applied Energy, 2020, 261: 114131

DOI:10.1016/j.apenergy.2019.114131      [本文引用: 1]

KIM Y, SON H G, KIM S

Short term electricity load forecasting for institutional buildings

[J]. Energy Reports, 2019, 5: 1270- 1280

DOI:10.1016/j.egyr.2019.08.086      [本文引用: 1]

HOU Z, LIAN Z, YAO Y, et al

Cooling-load prediction by the combination of rough set theory and an artificial neural-network based on data-fusion technique

[J]. Applied Energy, 2006, 83 (9): 1033- 1046

DOI:10.1016/j.apenergy.2005.08.006      [本文引用: 1]

WANG H J, JIN T, WANG H, et al

Application of IEHO–BP neural network in forecasting building cooling and heating load

[J]. Energy Reports, 2022, 8: 455- 465

DOI:10.1016/j.egyr.2022.01.216      [本文引用: 1]

贾鹏, 杨炼鑫, 唐一鸣, 等

基于SVM算法在电力负荷预测中的研究

[J]. 科技视界, 2020, 10 (31): 14- 16

DOI:10.19694/j.cnki.issn2095-2457.2020.31.05      [本文引用: 1]

JIA Peng, YANG Lianxin, TANG Yiming, et al

Research on power load forecasting based on SVM algorithm

[J]. Science and Technology Vision, 2020, 10 (31): 14- 16

DOI:10.19694/j.cnki.issn2095-2457.2020.31.05      [本文引用: 1]

MOHANDES M

Support vector machines for short-term electrical load forecasting

[J]. International Journal of Energy Research, 2002, 26 (4): 335- 345

DOI:10.1002/er.787      [本文引用: 1]

DE OLIVEIRA E M, CYRINO OLIVEIRA F L

Forecasting mid-long term electric energy consumption through bagging ARIMA and exponential smoothing methods

[J]. Energy, 2018, 144: 776- 788

DOI:10.1016/j.energy.2017.12.049      [本文引用: 1]

ZHOU C, FANG Z, XU X, et al

Using long short-term memory networks to predict energy consumption of air-conditioning systems

[J]. Sustainable Cities and Society, 2020, 55: 102000

DOI:10.1016/j.scs.2019.102000      [本文引用: 1]

WANG Z, HONG T, PIETTE M A

Data fusion in predicting internal heat gains for office buildings through a deep learning approach

[J]. Applied Energy, 2019, 240: 386- 398

DOI:10.1016/j.apenergy.2019.02.066     

ZHAO L, MO C, MA J, et al

LSTM-MFCN: a time series classifier based on multi-scale spatial-temporal features

[J]. Computer Communications, 2022, 182: 52- 59

DOI:10.1016/j.comcom.2021.10.036     

于军琪, 杨思远, 赵安军, 等

基于神经网络的建筑能耗混合预测模型

[J]. 浙江大学学报: 工学版, 2022, 56 (6): 1220- 1231

[本文引用: 1]

YU Junqi, YANG Siyuan, ZHAO Anjun, et al

Hybrid prediction model of building energy consumption based on neural network

[J]. Journal of Zhejiang University: Engineering Science, 2022, 56 (6): 1220- 1231

[本文引用: 1]

姜春晓, 张正贺, 段华

基于改进的LSTM模型的建筑能耗预测

[J]. 数学建模及其应用, 2023, 12 (1): 16- 24

[本文引用: 1]

JIANG Chunxiao, ZHANG Zhenghe, DUAN Hua

Prediction of building energy consumption based on improved LSTM model

[J]. Mathematical Modeling and Its Applications, 2023, 12 (1): 16- 24

[本文引用: 1]

董彦军, 王晓甜, 马红明, 等

基于随机森林与长短期记忆网络的电力负荷预测方法

[J]. 全球能源互联网, 2022, 5 (2): 147- 156

[本文引用: 1]

DONG Yanjun, WANG Xiaotian, MA Hongming, et al

Power load forecasting method based on random forest and long short-term memory

[J]. Journal of Global Energy Interconnection, 2022, 5 (2): 147- 156

[本文引用: 1]

KINGMA D P, BA J. Adam: a method for stochastic optimization [EB/OL]. (2017−01−30)[2025−06−02]. https://arxiv.org/pdf/1412.6980.

[本文引用: 1]

CHANG Z, ZHANG Y, CHEN W

Electricity price prediction based on hybrid model of Adam optimized LSTM neural network and wavelet transform

[J]. Energy, 2019, 187: 115804

DOI:10.1016/j.energy.2019.07.134      [本文引用: 1]

马杰. 基于季节指数与Adam优化的LSTM短期电力负荷预测研究 [D]. 北京: 北京工业大学, 2020.

[本文引用: 1]

MA Jie. Study on short-term power load forecasting of LSTM based on seasonal index and Adam optimization [D]. Beijing: Beijing University of technology, 2020.

[本文引用: 1]

SRIVASTAVA S, LESSMANN S

A comparative study of LSTM neural networks in forecasting day-ahead global horizontal irradiance with satellite data

[J]. Solar Energy, 2018, 162: 232- 247

DOI:10.1016/j.solener.2018.01.005      [本文引用: 1]

RUIZ L G B, RUEDA R, CUÉLLAR M P, et al

Energy consumption forecasting based on Elman neural networks with evolutive optimization

[J]. Expert Systems with Applications, 2018, 92: 380- 389

DOI:10.1016/j.eswa.2017.09.059      [本文引用: 1]

GAO Y, RUAN Y

Interpretable deep learning model for building energy consumption prediction based on attention mechanism

[J]. Energy and Buildings, 2021, 252: 111379

DOI:10.1016/j.enbuild.2021.111379      [本文引用: 1]

DAI Y, ZHAO P

A hybrid load forecasting model based on support vector machine with intelligent methods for feature selection and parameter optimization

[J]. Applied Energy, 2020, 279: 115332

DOI:10.1016/j.apenergy.2020.115332      [本文引用: 1]

/