<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 冷负荷预测模型架构图

Fig.1 Architecture diagram of cooling load prediction model

2.2. 预测模型建立

搭建WAdam-LSTM的步骤如下. 1）数据预处理：数据集使用某市2个大型商业建筑内采集的真实冷负荷数据和气象数据，将数据集划分为训练集与测试集，利用训练集建模. 2）提取特征变量：充分考虑时间因素，采用交叉相关函数研究冷负荷与各影响因素在不同滞后周期的相关性. 3）优化LSTM结构：采用网格搜索方法确定LSTM批次、隐藏层个数和隐藏单元数；利用WAdam优化LSTM中的参数$ {\boldsymbol{W}}_{\text{f}} $、$ {\boldsymbol{W}}_{\text{i}} $、$ {\boldsymbol{W}}_{\text{C}} $、$ {\boldsymbol{W}}_{\text{o}} $、$ {\boldsymbol{b}}_{\text{f}} $、$ {\boldsymbol{b}}_{\text{i}} $、$ {\boldsymbol{b}}_{\text{C}} $和$ {\boldsymbol{b}}_{\text{o}} $，找到使损失函数最小的一组参数，得到最优LSTM预测模型. 4）短期冷负荷预测：使用测试集对步骤3）得到的最优预测模型进行测试，得到短期冷负荷预测值. 根据测试集中真实冷负荷值，使用均方误差MSE、均方根误差变异系数CV-RMSE、平均绝对百分比误差MAPE评估预测模型的准确性^{[20- 21]}.

3. 案例研究

3.1. 实验描述

建筑1高度约为40.6 m，建筑面积约为2.5×10⁵ m²；建筑2高度约为16 m，建筑面积约为2.1×10⁴ m². 考虑到商业建筑的工作特点，建筑1和2每天营业时间分别为8:00—22:00和8:00—21:00，空调系统采用间歇式运行模式. 负荷预测的目的是为设备侧的优化调度提供决策，因此预测建模中数据集包含温度、湿度、太阳辐射、风速和空调负荷等实际数据，每小时记录一次，其中空调负荷数据通过空调能效比和实际耗电量计算得到. 建筑对象特征信息如表1所示，其中S、H、L和T分别为建筑面积、高度、层高和建筑物体型参数，r_ww为窗墙比，建筑物冷负荷样本N_S数据统计如表2所示. 实验数据的主要采集设备包括温湿度传感器、太阳辐射传感器、微型风速传感器、智能电表、智能网关、DDC控制器、数据集中器、空气开关和24V开关电源，设备参数如表3所示. 所提预测模型在运行Windows 10操作系统的AMD R7处理器@ 3.30 GHz系统上使用Python 3.8搭建. 仿真实验在Python中基于TensorFlow的Keras深度学习库中实现. 采集设备遭遇极端天气会影响测量精度，数据传输过程中也会出现坏值或者数据缺失的情况，因此利用SPSS软件，使用插值法对缺失和异常数据进行检查和处理，采用最小-最大归一化处理样本数据，避免预测精度下降：

表 1 研究对象特征信息

Tab.1 Characteristic information of study objects

研究对象	S/（10⁴ m²）	H/m	L/m	T	r_ww
建筑1	25.0	40.6	5	0.11	0.65（南），0.45（东）， 0.44（西），0.50（北）
建筑2	2.1	16.0	4	0.13	0.55（南），0.49（东）， 0.34（西），0.49（北）

表 2 建筑物冷负荷样本数据统计

Tab.2 Statistics of building cooling load samples

研究对象	建筑营业时间	时间范围	N_S
研究对象	建筑营业时间	时间范围	总数	训练集	测试集
建筑1	8:00—22:00	2023年6月2日— 8月12日	1080	979	95
		2023年6月	435	384	45
		2023年7月	465	414	45
		2023年8月	180	129	45
建筑2	8:00—21:00	2023年6月1日— 8月31日	1288	1162	135
		2023年6月	420	378	36
		2023年7月	434	392	36
		2023年8月	434	392	36

表 3 冷负荷数据采集设备参数信息

Tab.3 Parameters of cooling load data acquisition equipment

设备名称	设备品牌	精度	测量范围
温湿度传感器	建大仁科	±0.3 ℃, ±2% RH	−40 ~ 80 ℃， 0% ~ 100% RH
太阳辐射传感器	普锐森社	1 W·m⁻²	0 ~ 1800 W·m⁻²
微型风速传感器	YGC-FS	0.1 m·s⁻¹	0 ~ 70 m·s⁻¹
智能电表	威胜-DTZ341	0.2 s	—

(15)$ {x}^{\prime}=\frac{x-{x}_{\min }}{{x}_{\max }-{x}_{\min }}. $

式中：$ x $为样本，$ {x}_{\min } $和$ {x}_{\max } $分别为样本最小值和最大值.

通过观察每组数据的内部规律，采用交叉相关函数研究冷负荷与各影响因素之间的相关性，筛选出相关性高的因素. 如图2所示为负荷与其他影响因素在滞后周期$|\tau| $=6 h的相关性，C为置信度. 可以看出，负荷与温度、湿度、太阳辐射和前一时刻负荷之间的相关性均超出置信度上限或下限，负荷与风速的相关性最低，因此剔除风速变量.

图 2

图 2 建筑物冷负荷影响因素相关性分析图$(|\tau| \leqslant 6 \;\text{h})$

Fig.2 Correlation analysis of building cooling load influencing factors ($|\tau| \leqslant 6 \;\text{h} $)

对WAdam-LSTM实验参数进行多轮调试，并参考相关文献得到建筑冷负荷预测的参数设置如表4所示. 使用MAPE、MSE和CV-RMSE为预测模型性能的评估指标，计算式分别为

表 4 模型预测性能对比实验的参数设置

Tab.4 Parameter settings for model prediction performance comparison experiments

参数	数值	参数	数值
学习率η	0.001	迭代次数e	100
衰减率β₁, β₂	0.9, 0.999	隐藏层数h	1
权重衰减率ω	0.99	隐藏单元数u	13
极小值ε	1.0×10⁻⁸	批次c	15

(16)$ \text{MAPE}=\frac{1}{{N}}\sum\limits_{{i}=1}^{{N}}{\left(\frac{{\hat{y}}_{{i}}-{y}_{{i}}}{{y}_{{i}}}\right)}^{2},$

(17)$ \text{MSE}=\frac{1}{{N}}\sum\limits_{i\text{=1}}^{{N}}{({{\hat{y}}_{{i}}}-{{y}_{{i}}})}^{2}, $

(18)$ \text{CV-RMSE}=\frac{\sqrt{\dfrac{1}{{N}}\displaystyle\sum\limits_{{i=1}}^{{N}}{({{\hat{y}}_{{i}}}-{{y}_{{i}}})}^{2}}}{\dfrac{1}{{N}}\displaystyle\sum\limits_{{i=1}}^{{N}}{\hat{y}}_{{i}}}. $

式中：$ {N} $为测试集样本数，$ {y}_{{i}} $为第i个预测点的实际值，$ {\hat{y}}_{{i}} $为相应的预测值.

3.2. 结果与讨论

3.2.1. LSTM参数优化结果与分析

LSTM预测模型中的参数包括隐藏层数、隐藏单元数、批次、权重及偏置. 通过网格搜索算法优化LSTM模型的参数，得到预测模型的最佳批次为15，最优隐藏单元为13，隐藏层个数为3. 实验以平均绝对误差作为损失，验证不同隐藏层在最优隐藏单元和批次条件下损失值l的大小，如图3所示. 可以看出：2个隐藏层的损失略高于其他2个，其中3个隐藏层的损失最小. 如图4所示，使用部分测试集验证在最佳批次和隐藏单元下损失值变化，当隐藏层数为3时出现过拟合现象，因此最佳隐藏层个数为1.

图 3

图 3 不同隐藏层数对应损失值随迭代次数的变化

Fig.3 Analysis of loss variation with iteration epochs for different numbers of hidden layers

图 4

图 4 不同数据集上的隐藏层数对应损失值对比

Fig.4 Comparison of loss values for different hidden layers numbers across data sets

3.2.2. 预测结果分析

为了验证WAdam-LSTM的预测精度，将WAdam-LSTM与SVR、BPNN、LSTM、SCOA-LSTM、Adam-LSTM等经典算法进行比较. 所有算法均基于相同的数据集和最优参数进行预测，如图5所示为建筑1随时间t变化的冷负荷Q_C预测误差对比结果，结果表明SVR在周内的误差明显高于LSTM网络. 分析发现，外界环境因素对空调系统能耗的影响较大，波动性较强，如温度和太阳辐射的输入参数也是导致SVR性能下降的原因. 模型输入和输出变量之间的相关性较差，是BPNN预测精度较低的主要原因. LSTM是递归神经网络，既保留了SVR神经网络的非线性映射能力，又适合处理趋势数据.

图 5

图 5 不同模型的逐时空调能耗预测结果绝对误差

Fig.5 Absolute error of hourly air-conditioning energy consumption predictions for different models

对比单数据驱动模型与混合模型的性能，计算最佳架构下不同预测模型的性能指标如表5所示. 在建筑1中LSTM的3个性能指标与BPNN相比降低了19%~46%不等，与SVR相比降低了14%~30%不等，由此可见，单数据驱动模型LSTM的预测精度高于SVR和BPNN. 应用不同优化算法优化LSTM后，预测效果有显著提升，对照图5发现，SCOA-LSTM的绝对误差较大、稳定性较差，WAdam-LSTM误差表现更为稳定，冷负荷预测值与实际值的误差波动范围均不超过15%. 综合对比可知，WAdam-LSTM相比对比模型在各种性能评价指标上均有显著提升.

表 5 不同冷负荷预测模型的性能指标对比

Tab.5 Comparison of performance metrics for different cooling load prediction models

建筑物	预测模型	CV-RMSE	MAPE	MSE
建筑1	LSTM	0.153	13.10	0.272
	Adam-LSTM	0.107	5.70	0.083
	SVR	0.163	16.20	0.354
	BPNN	0.190	17.03	0.504
	SCOA-LSTM	0.121	11.60	0.173
	WAdam-LSTM	0.063	2.70	0.058
建筑2	LSTM	0.153	19.40	0.269
	Adam-LSTM	0.079	10.90	0.146
	SVR	0.173	15.70	0.312
	BPNN	0.157	18.14	0.474
	SCOA-LSTM	0.112	10.90	0.146
	WAdam-LSTM	0.072	5.20	0.059

对比分析2个建筑在考虑人员密度与忽略内扰影响时的预测性能差异，得出以下结论：当引入人员密度作为输入变量时，模型计算的3个关键性能指标与基准模型的偏差为3%~7%，该差异在工程应用范围内可忽略. 原因是1）内扰中用户行为与历史负荷数据、气象参数之间存在显著的耦合关系，模型通过数据驱动的方式自动学习了内扰与外扰的内在关联. 2）基于6—8月空调使用高峰期采集的1 000余个监测点位数据，涵盖工作日与周末、不同时间段以及极端天气条件的各种运行工况，这种高密度多场景的数据采集方式确保了模型能够通过负荷特征变化学习到内扰的影响规律，降低对人员密度参数的依赖.

3.2.3. 模型性能验证

为了进一步验证WAdam对LSTM的优化能力，针对建筑1的6月份冷负荷数据采用SCOA、Adam和WAdam对LSTM的参数进行优化，收敛曲线如图6所示. 可以看出，3种算法的适应度值收敛曲线均呈下降趋势，但WAdam收敛时间最短，对应的收敛曲线也比SCOA和Adam更稳定. 该结果表明，与SCOA和Adam相比，WAdam的收敛性和稳定性更好，适用于LSTM的参数优化.

图 6

图 6 LSTM优化算法的收敛特性曲线对比

Fig.6 Convergence curve comparison of optimization algorithms for LSTM training

为了证明WAdam-LSTM的泛化能力，使用2个建筑对夏季不同月份进行样本划分，得到的预测结果如表6所示. 可以发现，BPNN对2个建筑的预测精度整体较差，SVR在2个建筑上的预测结果相比其他模型误差较大，其他对比模型的预测精度和误差有一定程度的提升，WAdam-LSTM在不同月份对2个建筑的预测精度整体较高且误差范围较小. 当只有少量样本时，WAdam-LSTM比其他单一或混合预测模型具有更强的泛化能力.

表 6 不同模型对不同月份建筑物冷负荷预测准确性的对比

Tab.6 Comparison of monthly building cooling load prediction accuracy across different models

建筑	月份	模型	CV-RMSE	建筑	月份	模型	CV-RMSE
建筑1	6月	LSTM	1.387	建筑2	6月	LSTM	1.197
		SVR	2.659			SVR	2.114
		BPNN	3.019			BPNN	2.546
		Adam-LSTM	1.113			Adam-LSTM	1.000
		SCOA-LSTM	0.641			SCOA-LSTM	0.641
		WAdam-LSTM	0.761			WAdam-LSTM	0.833
	7月	LSTM	1.812		7月	LSTM	1.806
		SVR	2.422			SVR	2.359
		BPNN	2.767			BPNN	2.871
		Adam-LSTM	1.066			Adam-LSTM	1.057
		SCOA-LSTM	0.867			SCOA-LSTM	0.812
		WAdam-LSTM	0.653			WAdam-LSTM	0.487
	8月	LSTM	1.803		8月	LSTM	1.707
		SVR	2.387			SVR	2.308
		BPNN	2.281			BPNN	2.436
		Adam-LSTM	1.141			Adam-LSTM	1.108
		SCOA-LSTM	1.478			SCOA-LSTM	1.337
		WAdam-LSTM	0.592			WAdam-LSTM	0.595

以模型运行时间t和运行时的内存占比R为评价指标，对比5种模型的计算复杂度，所有实验均在相同运行环境下完成，结果如图7所示. LSTM、SVR、BPNN、Adam-LSTM、SCOA-LSTM和WAdam-LSTM的运行时间分别为43.9、32.8、24.4、32.1、37.6和30.2 s，内存占比分别为38.6%、28.4%、26.4%、23.5%、27.7%和23.1%. 在运行时间方面，单一模型中LSTM的运行时间最长，原因是LSTM处理非线性问题时其结构比SVR与BPNN更加复杂，借助智能优化算法可降低预测模型的训练时长，Adam-LSTM和SCOA-LSTM这2种改进后的LSTM模型训练时长更短. 相比Adam-LSTM和SCOA-LSTM，WAdam-LSTM训练时长最短，改进后Adam个体自适应学习率的更新与权重衰减解耦，更适应于模型的各耦合参数输入. 在内存占用方面，LSTM比SVR大，在测试集相同情况下网络结构更为复杂,经过智能算法优化改进后的LSTM模型的内存占用更少，综合考虑WAdam-LSTM在预测效果方面的优越性更高，计算复杂度更低，更适合于实际应用.

图 7

DOI:10.1016/j.apenergy.2021.117486 [本文引用: 1]

图 7 预测模型的计算复杂度对比

Fig.7 Computational complexity comparison of prediction models

WAdam-LSTM在空调冷负荷预测中的应用虽然具有显著优势，但存在一些固有的技术局限性. 这些局限性主要体现在模型基于循环神经网络的核心架构. LSTM逐步处理时序数据的特性限制了并行化计算能力，使得它在处理大规模数据集时的效率明显低于CNN或Transformer架构. 在北方地区空调冷负荷预测这一特定应用场景中，这个局限性不会对实际工程应用造成实质性影响. 北方地区空调负荷具有典型的季节性特征，全年有效数据集中在6—9月约120 d内，即使按30 min采样频率计算，年度总样本量为5856条，远低于模型处理能力上限. 更重要的是，北方地区的空调负荷变化主要受短期气候因素主导，包括温度波动和湿度变化的滞后效应，这些短周期特性使得模型4~6步的记忆窗口完全能够满足预测需求. 如果将该模型应用于热带地区需要全年使用空调的场景，由于数据量会增加3~5倍，且需要处理跨季节的长期气候依赖关系（如季风影响），这时所提模型的性能可能会显著下降，在这种情况下，须改用具有并行计算优势的架构，引入注意力机制增强的模型.

4. 结　语

以提高大型商业建筑冷负荷预测精度和泛化能力为目标，引入时间序列预测思想，结合WAdam优化算法建立WAdam-LSTM，采用2个实际大型商业建筑夏季冷负荷数据作为短期预测研究案例，对WAdam-LSTM预测效果进行验证，从预测性能的角度将该方法与主流的模型进行比较得出以下结论. 1） WAdam-LSTM比SVR网络模型更能充分有效记忆历史数据，较Adam-LSTM的稳定性能更强，预测精度更高. 以建筑1为例，与SVR和LSTM相比逐时冷负荷预测的MSE分别降低了83%和78%，与SCOA-LSTM和Adam-LSTM相比MSE分别降低了66%和30%，与BPNN相比MSE降低了88%，因此，WAdam-LSTM预测精度更高，稳定性更好，更适应于商业建筑短期能耗预测. 2）从SCOA、Adam和WAdam对LSTM的参数优化收敛曲线可知，WAdam收敛更快且更平坦，WAdam具有较好的稳定性和收敛性，可应用于LSTM参数优化. 3）由预测结果可知，在少量样本情况下，WAdam-LSTM比参与对比的单一或混合预测模型的预测结果更准确，泛化能力更强. 现有的研究仅适用于商用建筑的冷负荷预测，在未来的工作中，将进一步研究不同建筑负荷特点，将WAdam-LSTM应用在住宅或写字楼建筑中以提高模型的普适性.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

GAO L, LIU T, CAO T, et al

Comparing deep learning models for multi energy vectors prediction on multiple types of building

[J]. Applied Energy, 2021, 301: 117486

[2]

SOMU N, RAMAN G M R, RAMAMRITHAM K

A hybrid model for building energy consumption forecasting using long short term memory networks

[J]. Applied Energy, 2020, 261: 114131

DOI:10.1016/j.apenergy.2019.114131 [本文引用: 1]

[3]

KIM Y, SON H G, KIM S

Short term electricity load forecasting for institutional buildings

[J]. Energy Reports, 2019, 5: 1270- 1280

DOI:10.1016/j.egyr.2019.08.086 [本文引用: 1]

[4]

HOU Z, LIAN Z, YAO Y, et al

Cooling-load prediction by the combination of rough set theory and an artificial neural-network based on data-fusion technique

[J]. Applied Energy, 2006, 83 (9): 1033- 1046

DOI:10.1016/j.apenergy.2005.08.006 [本文引用: 1]

[5]

WANG H J, JIN T, WANG H, et al

Application of IEHO–BP neural network in forecasting building cooling and heating load

[J]. Energy Reports, 2022, 8: 455- 465

DOI:10.1016/j.egyr.2022.01.216 [本文引用: 1]

[6]

贾鹏, 杨炼鑫, 唐一鸣, 等

基于SVM算法在电力负荷预测中的研究

[J]. 科技视界, 2020, 10 (31): 14- 16

DOI:10.19694/j.cnki.issn2095-2457.2020.31.05 [本文引用: 1]

JIA Peng, YANG Lianxin, TANG Yiming, et al

Research on power load forecasting based on SVM algorithm

[J]. Science and Technology Vision, 2020, 10 (31): 14- 16

DOI:10.19694/j.cnki.issn2095-2457.2020.31.05 [本文引用: 1]

[7]

MOHANDES M

Support vector machines for short-term electrical load forecasting

[J]. International Journal of Energy Research, 2002, 26 (4): 335- 345

DOI:10.1002/er.787 [本文引用: 1]

[8]

DE OLIVEIRA E M, CYRINO OLIVEIRA F L

Forecasting mid-long term electric energy consumption through bagging ARIMA and exponential smoothing methods

[J]. Energy, 2018, 144: 776- 788

DOI:10.1016/j.energy.2017.12.049 [本文引用: 1]

[9]

ZHOU C, FANG Z, XU X, et al

Using long short-term memory networks to predict energy consumption of air-conditioning systems

[J]. Sustainable Cities and Society, 2020, 55: 102000

DOI:10.1016/j.scs.2019.102000 [本文引用: 1]

[10]

WANG Z, HONG T, PIETTE M A

Data fusion in predicting internal heat gains for office buildings through a deep learning approach

[J]. Applied Energy, 2019, 240: 386- 398

DOI:10.1016/j.apenergy.2019.02.066

[11]

ZHAO L, MO C, MA J, et al

LSTM-MFCN: a time series classifier based on multi-scale spatial-temporal features

[J]. Computer Communications, 2022, 182: 52- 59

DOI:10.1016/j.comcom.2021.10.036

[13]

于军琪, 杨思远, 赵安军, 等

基于神经网络的建筑能耗混合预测模型

[J]. 浙江大学学报: 工学版, 2022, 56 (6): 1220- 1231

YU Junqi, YANG Siyuan, ZHAO Anjun, et al

Hybrid prediction model of building energy consumption based on neural network

[J]. Journal of Zhejiang University: Engineering Science, 2022, 56 (6): 1220- 1231

[12]

姜春晓, 张正贺, 段华

基于改进的LSTM模型的建筑能耗预测

[J]. 数学建模及其应用, 2023, 12 (1): 16- 24

JIANG Chunxiao, ZHANG Zhenghe, DUAN Hua

Prediction of building energy consumption based on improved LSTM model

[J]. Mathematical Modeling and Its Applications, 2023, 12 (1): 16- 24

[14]

董彦军, 王晓甜, 马红明, 等

基于随机森林与长短期记忆网络的电力负荷预测方法

[J]. 全球能源互联网, 2022, 5 (2): 147- 156

DONG Yanjun, WANG Xiaotian, MA Hongming, et al

Power load forecasting method based on random forest and long short-term memory

[J]. Journal of Global Energy Interconnection, 2022, 5 (2): 147- 156

[15]

KINGMA D P, BA J. Adam: a method for stochastic optimization [EB/OL]. (2017−01−30)[2025−06−02]. https://arxiv.org/pdf/1412.6980.

DOI:10.1016/j.energy.2019.07.134 [本文引用: 1]

[16]

CHANG Z, ZHANG Y, CHEN W

Electricity price prediction based on hybrid model of Adam optimized LSTM neural network and wavelet transform

[J]. Energy, 2019, 187: 115804

[17]

马杰. 基于季节指数与Adam优化的LSTM短期电力负荷预测研究 [D]. 北京: 北京工业大学, 2020.

MA Jie. Study on short-term power load forecasting of LSTM based on seasonal index and Adam optimization [D]. Beijing: Beijing University of technology, 2020.