基于改进LSTM的商业建筑冷负荷预测模型
Cooling load prediction model for commercial buildings based on improved LSTM
收稿日期: 2025-06-10
| 基金资助: |
|
Received: 2025-06-10
| Fund supported: | 陕西工业职业技术大学科研计划项目(2024YKYB-021);国家重点研发计划项目(2022YFC3802700). |
作者简介 About authors
董芳楠(1997—),女,助教,博士生,从事建筑节能与优化研究.orcid.org/0009-0000-7178-8390.E-mail:
传统冷负荷预测多未考虑时间因素,导致预测效果差和泛化能力低,为此提出基于权重衰减适应性矩估计优化算法的长短期记忆(LSTM)神经网络预测模型(WAdam-LSTM),用于建筑的高精度冷负荷预测. 采用交叉相关函数得到变量最佳特征作为输入变量,更新LSTM变量参数时引入权重衰减项,构建WAdam-LSTM. 以2个典型大型商业建筑逐时冷负荷数据为样本开展模型预测性能对比实验. 结果表明:解耦权重衰减项的引入提高了优化算法的稳定性和收敛性,适用于LSTM网络的参数优化;WAdam-LSTM比SVR、SCOA-LSTM和Adam-LSTM的预测效果更准确,均方误差分别下降了83%、66%和30%;WAdam-LSTM具有比单一模型(LSTM、SVR和BPNN)和混合预测模型(SCOA-LSTM和Adam-LSTM)更强的泛化能力,能对不同商业建筑不同月份的冷负荷进行精确预测.
关键词:
Traditional cooling load prediction methods often neglect temporal factors, leading to poor prediction performance and low generalization ability. To address these issues, a long short-term memory (LSTM) neural network prediction model optimized by the weight decay adaptive moment estimation algorithm (WAdam-LSTM) was proposed for high-precision building cooling load prediction. The cross-correlation function was employed to identify optimal feature variables as model inputs. WAdam-LSTM was constructed by introducing a weight decay term during the update of LSTM variable parameters. Hourly cooling load data from two representative large commercial buildings were used to evaluate and compare model prediction performance. Results show that the incorporation of the decoupled weight decay term enhances the stability and convergence of the optimization algorithm, making it suitable for LSTM network parameter optimization. WAdam-LSTM demonstrates superior prediction accuracy compared to SVR, SCOA-LSTM, and Adam-LSTM, with mean square error reductions of 83%, 66%, and 30%, respectively. WAdam-LSTM exhibits stronger generalization ability than single models (LSTM, SVR, and BPNN) and hybrid prediction models (SCOA-LSTM and Adam-LSTM), enabling precise cooling load predictions for different commercial buildings across varying months.
Keywords:
本文引用格式
董芳楠, 武强, 刘佳瑶, 于军琪.
DONG Fangnan, WU Qiang, LIU Jiayao, YU Junqi.
人工神经网络(artificial neural network, ANN)通过训练数据来学习内部规律,从而进行逐日能耗预测. Kim等[3]通过预测韩国首尔某机构大楼峰值负荷,证明ANN模型具有良好的预测精度. Hou等[4]结合粗糙集理论和ANN来预测冷负荷. Wang等[5]采用改进的牧象优化(improved elephant herding optimization, IEHO)对反向传播神经网络(back propagation neural network, BPNN)进行优化,实验表明此模型相比粒子群优化-反向传播(particle swarm optimization-back propagation, PSO-BP)和牧象优化-反向传播(elephant herding optimization-back propagation, EHO-BP)模型在冷热负荷预测中更准确,振荡更小. 贾鹏等[6]构建基于支持向量回归(support vector regression, SVR)理论的短期电网负荷预测模型. Mohandes[7]对比了支持向量机与自动回归模型在短期电力负荷预测中的应用性能. 时间序列预测模型也被用于短期电力负荷预测,这些模型可以利用负荷数据本身的时空动态特征来建立数学表达式,描述负荷与时间之间的依赖关系,但在处理数据平稳性、季节性和周期性方面存在困难[8]. 具备时序记忆功能的长短期记忆(long short-term memory, LSTM)可进一步挖掘数据中的时间序列信息[9-12]. 不同网络模型在建筑冷负荷预测方面存在以下问题:1)没有兼顾建筑负荷数据时序性和非线性的特点,当负荷变化剧烈时,预测模型的跟随性和精确性表现很差;2)混合模型仅为执行特定的任务而设计,不具备普遍适用性.
本研究提出基于权重衰减适应性矩估计优化算法的LSTM神经网络预测模型(weight decay adaptive moment estimation - LSTM, WAdam-LSTM),用于商业建筑冷负荷的短期预测. 1)采用交叉相关函数表示输入变量的非线性特征,筛选输入变量,避免相关性低的输入变量影响预测精度. 2)采用WAdam,在更新LSTM变量参数时引入权重衰减项,进一步提高模型的预测精度和稳定性. 3)以某市2个大型商业建筑夏季空调冷负荷数据为样本,将WAdam-LSTM与3种单一模型和2种混合模型进行对比,证实WAdam-LSTM在商业建筑冷负荷预测方面的精度、稳定性和泛化能力.
1. 模型理论
1.1. LSTM神经网络
式中:
式中:
式中:
式中:
1.2. 适应性矩估计优化算法
式中:
式中:
1.3. 改进的Adam优化器
传统的Adam优化器对梯度的一阶和二阶矩向量进行估计,经偏差修正后,计算不同参数的个体自适应学习率,并找到参数的最优值. 大量学者研究发现,某些任务中由于权重衰减,Adam的稳定性及泛化能力不足. 本研究结合传统Adam在梯度矩估计后,经过偏差修正,在参数更新时引入权重衰减项,得到基于权重衰减的随机梯度优化器WAdam. WAdam在每次更新梯度时进行衰减,避免产生的参数过大,将个体自适应学习率的更新与权重衰减解耦,实现超参数的独立优化,减少各参数同时优化过程中的相互影响:
式中:
2. 冷负荷预测模型建立
2.1. 预测模型架构
如图1所示,冷负荷预测模型由4层结构组成,包括数据采集层、数据预处理层、数据分析层和数据应用层. 数据采集层采用自动化设备(如高精度的传感器、控制器)采集、汇总与存储影响建筑负荷的温湿度、太阳辐射和风速等数据. 数据预处理层对采集的原始数据中的异常值进行剔除,通过插值法和平均滤波器处理缺失数据[18-19],相关分析法确定冷负荷与各影响因素之间的相关性并进行适当筛选. 数据须进行最小-最大归一化处理,解决因数据量纲不同引起学习模型格式不兼容的问题. 在数据处理中引入交叉验证,将数据划分为训练集和测试集. 数据分析层利用WAdam对LSTM网络进行优化,得到参数的最优值,使用训练集训练模型. 数据应用层根据测试集输入,计算大型商业建筑指定时间的负荷预测值,与真实负荷值对比计算模型性能.
图 1
2.2. 预测模型建立
搭建WAdam-LSTM的步骤如下. 1)数据预处理:数据集使用某市2个大型商业建筑内采集的真实冷负荷数据和气象数据,将数据集划分为训练集与测试集,利用训练集建模. 2)提取特征变量:充分考虑时间因素,采用交叉相关函数研究冷负荷与各影响因素在不同滞后周期的相关性. 3)优化LSTM结构:采用网格搜索方法确定LSTM批次、隐藏层个数和隐藏单元数;利用WAdam优化LSTM中的参数
3. 案例研究
3.1. 实验描述
建筑1高度约为40.6 m,建筑面积约为2.5×105 m2;建筑2高度约为16 m,建筑面积约为2.1×104 m2. 考虑到商业建筑的工作特点,建筑1和2每天营业时间分别为8:00—22:00和8:00—21:00,空调系统采用间歇式运行模式. 负荷预测的目的是为设备侧的优化调度提供决策,因此预测建模中数据集包含温度、湿度、太阳辐射、风速和空调负荷等实际数据,每小时记录一次,其中空调负荷数据通过空调能效比和实际耗电量计算得到. 建筑对象特征信息如表1所示,其中S、H、L和T分别为建筑面积、高度、层高和建筑物体型参数,rww为窗墙比,建筑物冷负荷样本NS数据统计如表2所示. 实验数据的主要采集设备包括温湿度传感器、太阳辐射传感器、微型风速传感器、智能电表、智能网关、DDC控制器、数据集中器、空气开关和24V开关电源,设备参数如表3所示. 所提预测模型在运行Windows 10操作系统的AMD R7处理器@ 3.30 GHz系统上使用Python 3.8搭建. 仿真实验在Python中基于TensorFlow的Keras深度学习库中实现. 采集设备遭遇极端天气会影响测量精度,数据传输过程中也会出现坏值或者数据缺失的情况,因此利用SPSS软件,使用插值法对缺失和异常数据进行检查和处理,采用最小-最大归一化处理样本数据,避免预测精度下降:
表 1 研究对象特征信息
Tab.1
| 研究对象 | S/(104 m2) | H/m | L/m | T | rww |
| 建筑1 | 25.0 | 40.6 | 5 | 0.11 | 0.65(南),0.45(东), 0.44(西),0.50(北) |
| 建筑2 | 2.1 | 16.0 | 4 | 0.13 | 0.55(南),0.49(东), 0.34(西),0.49(北) |
表 2 建筑物冷负荷样本数据统计
Tab.2
| 研究 对象 | 建筑营业时间 | 时间范围 | NS | ||
| 总数 | 训练集 | 测试集 | |||
| 建筑1 | 8:00—22:00 | 2023年6月2日— 8月12日 | 979 | 95 | |
| 2023年6月 | 435 | 384 | 45 | ||
| 2023年7月 | 465 | 414 | 45 | ||
| 2023年8月 | 180 | 129 | 45 | ||
| 建筑2 | 8:00—21:00 | 2023年6月1日— 8月31日 | 135 | ||
| 2023年6月 | 420 | 378 | 36 | ||
| 2023年7月 | 434 | 392 | 36 | ||
| 2023年8月 | 434 | 392 | 36 | ||
表 3 冷负荷数据采集设备参数信息
Tab.3
| 设备名称 | 设备品牌 | 精度 | 测量范围 |
| 温湿度传感器 | 建大仁科 | ±0.3 ℃, ±2% RH | −40 ~ 80 ℃, 0% ~ 100% RH |
| 太阳辐射传感器 | 普锐森社 | 1 W·m−2 | 0 ~ |
| 微型风速传感器 | YGC-FS | 0.1 m·s−1 | 0 ~ 70 m·s−1 |
| 智能电表 | 威胜-DTZ341 | 0.2 s | — |
式中:
通过观察每组数据的内部规律,采用交叉相关函数研究冷负荷与各影响因素之间的相关性,筛选出相关性高的因素. 如图2所示为负荷与其他影响因素在滞后周期
图 2
图 2
建筑物冷负荷影响因素相关性分析图
Fig.2
Correlation analysis of building cooling load influencing factors (
对WAdam-LSTM实验参数进行多轮调试,并参考相关文献得到建筑冷负荷预测的参数设置如表4所示. 使用MAPE、MSE和CV-RMSE为预测模型性能的评估指标,计算式分别为
表 4 模型预测性能对比实验的参数设置
Tab.4
| 参数 | 数值 | 参数 | 数值 | |
| 学习率η | 0.001 | 迭代次数e | 100 | |
| 衰减率β1, β2 | 0.9, 0.999 | 隐藏层数h | 1 | |
| 权重衰减率ω | 0.99 | 隐藏单元数u | 13 | |
| 极小值ε | 1.0×10−8 | 批次c | 15 |
式中:
3.2. 结果与讨论
3.2.1. LSTM参数优化结果与分析
图 3
图 3 不同隐藏层数对应损失值随迭代次数的变化
Fig.3 Analysis of loss variation with iteration epochs for different numbers of hidden layers
图 4
图 4 不同数据集上的隐藏层数对应损失值对比
Fig.4 Comparison of loss values for different hidden layers numbers across data sets
3.2.2. 预测结果分析
为了验证WAdam-LSTM的预测精度,将WAdam-LSTM与SVR、BPNN、LSTM、SCOA-LSTM、Adam-LSTM等经典算法进行比较. 所有算法均基于相同的数据集和最优参数进行预测,如图5所示为建筑1随时间t变化的冷负荷QC预测误差对比结果,结果表明SVR在周内的误差明显高于LSTM网络. 分析发现,外界环境因素对空调系统能耗的影响较大,波动性较强,如温度和太阳辐射的输入参数也是导致SVR性能下降的原因. 模型输入和输出变量之间的相关性较差,是BPNN预测精度较低的主要原因. LSTM是递归神经网络,既保留了SVR神经网络的非线性映射能力,又适合处理趋势数据.
图 5
图 5 不同模型的逐时空调能耗预测结果绝对误差
Fig.5 Absolute error of hourly air-conditioning energy consumption predictions for different models
表 5 不同冷负荷预测模型的性能指标对比
Tab.5
| 建筑物 | 预测模型 | CV-RMSE | MAPE | MSE |
| 建筑1 | LSTM | 0.153 | 13.10 | 0.272 |
| Adam-LSTM | 0.107 | 5.70 | 0.083 | |
| SVR | 0.163 | 16.20 | 0.354 | |
| BPNN | 0.190 | 17.03 | 0.504 | |
| SCOA-LSTM | 0.121 | 11.60 | 0.173 | |
| WAdam-LSTM | 0.063 | 2.70 | 0.058 | |
| 建筑2 | LSTM | 0.153 | 19.40 | 0.269 |
| Adam-LSTM | 0.079 | 10.90 | 0.146 | |
| SVR | 0.173 | 15.70 | 0.312 | |
| BPNN | 0.157 | 18.14 | 0.474 | |
| SCOA-LSTM | 0.112 | 10.90 | 0.146 | |
| WAdam-LSTM | 0.072 | 5.20 | 0.059 |
对比分析2个建筑在考虑人员密度与忽略内扰影响时的预测性能差异,得出以下结论:当引入人员密度作为输入变量时,模型计算的3个关键性能指标与基准模型的偏差为3%~7%,该差异在工程应用范围内可忽略. 原因是1)内扰中用户行为与历史负荷数据、气象参数之间存在显著的耦合关系,模型通过数据驱动的方式自动学习了内扰与外扰的内在关联. 2)基于6—8月空调使用高峰期采集的1 000余个监测点位数据,涵盖工作日与周末、不同时间段以及极端天气条件的各种运行工况,这种高密度多场景的数据采集方式确保了模型能够通过负荷特征变化学习到内扰的影响规律,降低对人员密度参数的依赖.
3.2.3. 模型性能验证
为了进一步验证WAdam对LSTM的优化能力,针对建筑1的6月份冷负荷数据采用SCOA、Adam和WAdam对LSTM的参数进行优化,收敛曲线如图6所示. 可以看出,3种算法的适应度值收敛曲线均呈下降趋势,但WAdam收敛时间最短,对应的收敛曲线也比SCOA和Adam更稳定. 该结果表明,与SCOA和Adam相比,WAdam的收敛性和稳定性更好,适用于LSTM的参数优化.
图 6
图 6 LSTM优化算法的收敛特性曲线对比
Fig.6 Convergence curve comparison of optimization algorithms for LSTM training
为了证明WAdam-LSTM的泛化能力,使用2个建筑对夏季不同月份进行样本划分,得到的预测结果如表6所示. 可以发现,BPNN对2个建筑的预测精度整体较差,SVR在2个建筑上的预测结果相比其他模型误差较大,其他对比模型的预测精度和误差有一定程度的提升,WAdam-LSTM在不同月份对2个建筑的预测精度整体较高且误差范围较小. 当只有少量样本时,WAdam-LSTM比其他单一或混合预测模型具有更强的泛化能力.
表 6 不同模型对不同月份建筑物冷负荷预测准确性的对比
Tab.6
| 建筑 | 月份 | 模型 | CV-RMSE | 建筑 | 月份 | 模型 | CV-RMSE | |
| 建筑1 | 6月 | LSTM | 1.387 | 建筑2 | 6月 | LSTM | 1.197 | |
| SVR | 2.659 | SVR | 2.114 | |||||
| BPNN | 3.019 | BPNN | 2.546 | |||||
| Adam-LSTM | 1.113 | Adam-LSTM | 1.000 | |||||
| SCOA-LSTM | 0.641 | SCOA-LSTM | 0.641 | |||||
| WAdam-LSTM | 0.761 | WAdam-LSTM | 0.833 | |||||
| 7月 | LSTM | 1.812 | 7月 | LSTM | 1.806 | |||
| SVR | 2.422 | SVR | 2.359 | |||||
| BPNN | 2.767 | BPNN | 2.871 | |||||
| Adam-LSTM | 1.066 | Adam-LSTM | 1.057 | |||||
| SCOA-LSTM | 0.867 | SCOA-LSTM | 0.812 | |||||
| WAdam-LSTM | 0.653 | WAdam-LSTM | 0.487 | |||||
| 8月 | LSTM | 1.803 | 8月 | LSTM | 1.707 | |||
| SVR | 2.387 | SVR | 2.308 | |||||
| BPNN | 2.281 | BPNN | 2.436 | |||||
| Adam-LSTM | 1.141 | Adam-LSTM | 1.108 | |||||
| SCOA-LSTM | 1.478 | SCOA-LSTM | 1.337 | |||||
| WAdam-LSTM | 0.592 | WAdam-LSTM | 0.595 |
以模型运行时间t和运行时的内存占比R为评价指标,对比5种模型的计算复杂度,所有实验均在相同运行环境下完成,结果如图7所示. LSTM、SVR、BPNN、Adam-LSTM、SCOA-LSTM和WAdam-LSTM的运行时间分别为43.9、32.8、24.4、32.1、37.6和30.2 s,内存占比分别为38.6%、28.4%、26.4%、23.5%、27.7%和23.1%. 在运行时间方面,单一模型中LSTM的运行时间最长,原因是LSTM处理非线性问题时其结构比SVR与BPNN更加复杂,借助智能优化算法可降低预测模型的训练时长,Adam-LSTM和SCOA-LSTM这2种改进后的LSTM模型训练时长更短. 相比Adam-LSTM和SCOA-LSTM,WAdam-LSTM训练时长最短,改进后Adam个体自适应学习率的更新与权重衰减解耦,更适应于模型的各耦合参数输入. 在内存占用方面,LSTM比SVR大,在测试集相同情况下网络结构更为复杂,经过智能算法优化改进后的LSTM模型的内存占用更少,综合考虑WAdam-LSTM在预测效果方面的优越性更高,计算复杂度更低,更适合于实际应用.
图 7
图 7 预测模型的计算复杂度对比
Fig.7 Computational complexity comparison of prediction models
WAdam-LSTM在空调冷负荷预测中的应用虽然具有显著优势,但存在一些固有的技术局限性. 这些局限性主要体现在模型基于循环神经网络的核心架构. LSTM逐步处理时序数据的特性限制了并行化计算能力,使得它在处理大规模数据集时的效率明显低于CNN或Transformer架构. 在北方地区空调冷负荷预测这一特定应用场景中,这个局限性不会对实际工程应用造成实质性影响. 北方地区空调负荷具有典型的季节性特征,全年有效数据集中在6—9月约120 d内,即使按30 min采样频率计算,年度总样本量为
4. 结 语
以提高大型商业建筑冷负荷预测精度和泛化能力为目标,引入时间序列预测思想,结合WAdam优化算法建立WAdam-LSTM,采用2个实际大型商业建筑夏季冷负荷数据作为短期预测研究案例,对WAdam-LSTM预测效果进行验证,从预测性能的角度将该方法与主流的模型进行比较得出以下结论. 1) WAdam-LSTM比SVR网络模型更能充分有效记忆历史数据,较Adam-LSTM的稳定性能更强,预测精度更高. 以建筑1为例,与SVR和LSTM相比逐时冷负荷预测的MSE分别降低了83%和78%,与SCOA-LSTM和Adam-LSTM相比MSE分别降低了66%和30%,与BPNN相比MSE降低了88%,因此,WAdam-LSTM预测精度更高,稳定性更好,更适应于商业建筑短期能耗预测. 2) 从SCOA、Adam和WAdam对LSTM的参数优化收敛曲线可知,WAdam收敛更快且更平坦,WAdam具有较好的稳定性和收敛性,可应用于LSTM参数优化. 3) 由预测结果可知,在少量样本情况下,WAdam-LSTM比参与对比的单一或混合预测模型的预测结果更准确,泛化能力更强. 现有的研究仅适用于商用建筑的冷负荷预测,在未来的工作中,将进一步研究不同建筑负荷特点,将WAdam-LSTM应用在住宅或写字楼建筑中以提高模型的普适性.
参考文献
Comparing deep learning models for multi energy vectors prediction on multiple types of building
[J].DOI:10.1016/j.apenergy.2021.117486 [本文引用: 1]
A hybrid model for building energy consumption forecasting using long short term memory networks
[J].DOI:10.1016/j.apenergy.2019.114131 [本文引用: 1]
Short term electricity load forecasting for institutional buildings
[J].DOI:10.1016/j.egyr.2019.08.086 [本文引用: 1]
Cooling-load prediction by the combination of rough set theory and an artificial neural-network based on data-fusion technique
[J].DOI:10.1016/j.apenergy.2005.08.006 [本文引用: 1]
Application of IEHO–BP neural network in forecasting building cooling and heating load
[J].DOI:10.1016/j.egyr.2022.01.216 [本文引用: 1]
基于SVM算法在电力负荷预测中的研究
[J].DOI:10.19694/j.cnki.issn2095-2457.2020.31.05 [本文引用: 1]
Research on power load forecasting based on SVM algorithm
[J].DOI:10.19694/j.cnki.issn2095-2457.2020.31.05 [本文引用: 1]
Support vector machines for short-term electrical load forecasting
[J].
Forecasting mid-long term electric energy consumption through bagging ARIMA and exponential smoothing methods
[J].DOI:10.1016/j.energy.2017.12.049 [本文引用: 1]
Using long short-term memory networks to predict energy consumption of air-conditioning systems
[J].DOI:10.1016/j.scs.2019.102000 [本文引用: 1]
Data fusion in predicting internal heat gains for office buildings through a deep learning approach
[J].DOI:10.1016/j.apenergy.2019.02.066
LSTM-MFCN: a time series classifier based on multi-scale spatial-temporal features
[J].DOI:10.1016/j.comcom.2021.10.036
基于神经网络的建筑能耗混合预测模型
[J].
Hybrid prediction model of building energy consumption based on neural network
[J].
基于改进的LSTM模型的建筑能耗预测
[J].
Prediction of building energy consumption based on improved LSTM model
[J].
基于随机森林与长短期记忆网络的电力负荷预测方法
[J].
Power load forecasting method based on random forest and long short-term memory
[J].
Electricity price prediction based on hybrid model of Adam optimized LSTM neural network and wavelet transform
[J].DOI:10.1016/j.energy.2019.07.134 [本文引用: 1]
A comparative study of LSTM neural networks in forecasting day-ahead global horizontal irradiance with satellite data
[J].DOI:10.1016/j.solener.2018.01.005 [本文引用: 1]
Energy consumption forecasting based on Elman neural networks with evolutive optimization
[J].DOI:10.1016/j.eswa.2017.09.059 [本文引用: 1]
Interpretable deep learning model for building energy consumption prediction based on attention mechanism
[J].DOI:10.1016/j.enbuild.2021.111379 [本文引用: 1]
A hybrid load forecasting model based on support vector machine with intelligent methods for feature selection and parameter optimization
[J].DOI:10.1016/j.apenergy.2020.115332 [本文引用: 1]
/
| 〈 |
|
〉 |

