基于组合损失函数的BP神经网络风力发电短期预测方法

doi:10.3785/j.issn.1008-973X.2021.03.021

基于组合损失函数的BP神经网络风力发电短期预测方法

刘芳^,, 汪震^,, 刘睿迪, 王锴

1. 浙江大学电气工程学院，浙江杭州 310027

2. 中国科学院大学计算机学院，北京 100049

Short-term forecasting method of wind power generation based on BP neural network with combined loss function

LIU Fang^,, WANG Zhen^,, LIU Rui-di, WANG Kai

1. College of Electrical Engineering, Zhejiang University, Hangzhou 310027, China

2. Department of Computer Science, University of Chinese Academy of Science, Beijing 100049, China

通讯作者: 汪震，男，教授，博士生导师. orcid.org/0000-0001-9209-673X. E-mail： eezwang@ieee.org

收稿日期: 2020-02-28

基金资助:

国家重点研发计划（2017YFB0902000）；国家电网公司科技项目（SGXJ0000KXJS1700841）

Received: 2020-02-28

Fund supported:

国家重点研发计划（2017YFB0902000）；国家电网公司科技项目（SGXJ0000KXJS1700841）

作者简介 About authors

刘芳（1995—），女，硕士生，从事新能源预测研究.orcid.org/0000-0002-3709-3699.E-mail：ee_lf@zju.edu.cn , E-mail：ee_lf@zju.edu.cn

摘要

为了改善风电大规模并网带来的电力系统功率平衡问题，提高系统的风电消纳能力，构建了基于组合损失函数的风电功率预测神经网络模型. 为了提高原始数据信息的利用率，在模型中将数据进行分类，提出以最小化组合损失函数为目标的BP神经网络风力发电短期预测模型，由均方差损失函数、交叉熵损失函数和排序损失函数按照不同的权重比构成组合损失函数. 基于实际风场数据，对基于组合损失函数的预测模型效果进行训练和仿真验证，结果表明相较于基于单一的均方差损失函数的预测方法，提出的组合损失函数可有效提高预测精度.

关键词： 风电预测 ; 人工神经网络 ; 功率分段 ; 特征提取 ; 损失函数

Abstract

A short-term forecasting model of neural network for wind power generation with the combined loss function was proposed, in order to reduce the side effect of large-scale wind power integration on power system energy balance and increase system’s wind power accommodation ability. A classification method was introduced into the model, and a BP neural network short-term wind power prediction model with the goal of minimizing the combined loss function was proposed, in order to improve the utilization of raw data information. The combined loss function was constructed by the mean square error loss function, the cross-entropy loss function and the rank loss function according to different weight ratios. Compare to the prediction method based on separate loss functions, the combined loss function proposed can effectively improve the prediction accuracy from real wind farm data test.

Keywords： wind power forecast ; artificial neural network ; power segment ; feature extraction ; loss function

PDF (937KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

刘芳, 汪震, 刘睿迪, 王锴. 基于组合损失函数的BP神经网络风力发电短期预测方法. 浙江大学学报(工学版)[J], 2021, 55(3): 594-600 doi:10.3785/j.issn.1008-973X.2021.03.021

LIU Fang, WANG Zhen, LIU Rui-di, WANG Kai. Short-term forecasting method of wind power generation based on BP neural network with combined loss function. Journal of Zhejiang University(Engineering Science)[J], 2021, 55(3): 594-600 doi:10.3785/j.issn.1008-973X.2021.03.021

随着经济社会不断发展，人类对能源的需求日益增长，传统的能源已不能满足经济绿色发展的需要，开发和利用可再生能源成为各国加强全球环境治理的共识. 风能以其无污染、可再生、利用技术相对成熟的优点，被广泛关注并得到快速发展. 风电已经成为我国继火电和水电之后的第三大类型电源. 然而，风电固有的随机性、波动性和间歇性导致大规模并网会对电网产生较大冲击，甚至对电网的安全、稳定和经济运行造成危害^[1]. 对风电功率进行准确预测，是解决风电并网冲击问题的关键手段之一. 短期预测对精度要求较高，其结果能够帮助电网进行合理的电力调度规划、机组组合操作、检修计划调整，以缓解调峰、调频压力并减少弃风^[2-3].

现在主流的风电预测方法可分为3类：物理分析法、统计分析法以及两者的组合方法^[4]. 物理分析法基于数值天气预报（numerical weather prediction，NWP）和地理地貌信息，获取风电机组轮毂高度的风速、风向数据，再依据风机功率特性曲线，计算输出功率^[5]. 该方法具有不依赖于历史数据的优点，但计算模型较为复杂，且数值天气预报的精度和更新频率会影响预测精度和速度^[6].

统计分析法基于大量历史统计数据，直接建立输入量与输出量的非线性映射关系，再根据实测数据或NWP进行预测，可分为时间序列法和人工智能法等. 其中，时间序列法是将风速或功率作为单一输入序列，人工智能法考虑输出与多变量之间的关系. 总体趋势表明，人工智能法更准确^[7]. 人工神经网络（artificial neural network，ANN）在仿真、图像识别、预测等任务中取得了很好的效果，也是风电预测中最常用的人工智能方法^[8]，在历史样本充足的条件下，通常具有较高的预测精度和较强的泛化能力. BP神经网络（back-propagation artificial neural network，BP-ANN）按误差逆向传播算法进行训练，理论上可逼近任何非线性函数^[9]. 范高锋等^[9]根据风电场输出功率的影响因素，建立了基于BP-ANN的风电功率预测模型. 师洪涛等^[10]在不同尺度上利用小波分解了风速与功率序列，再分别利用多个BP-ANN对各频率的分量进行预测，最后经过重构得到完整预测结果. 循环神经网络（recurrent neural network，RNN）具有循环反馈的框架，能够利用历史信息中的时序相关性，改进RNN得到的长短期记忆法（long short-term memory，LSTM）网络具有记忆、遗忘模式，解决了RNN梯度消失的问题，可应用于时间序列数据的预测^[11]，朱乔木等^[12]基于LSTM网络建立了风电场功率预测模型，对多变时间序列进行动态时序建模.

不论是物理分析法还是统计分析法，都把功率预测作为预测变量连续的回归问题处理，通常以最小化均方差（mean square error，MSE）损失函数为训练目标. 但是MSE更适用于高斯分布，不能反映一般概率分布情况下的峰度与偏度信息^[13]. 此外，风场变化巨大，纯回归的方法没有充分利用风场大幅变化导致的输出功率层级的差异性. 为了克服MSE损失函数的局限性，并充分利用数据的原始信息，本研究提出将回归与基于功率分段的分类相组合的风电功率预测模型. 在MSE损失函数监督的传统BP-ANN模型的基础上，考虑回归问题与分类问题之间的关联，引入交叉熵（cross entropy，CE）损失函数和排序（rank，RK）损失函数，建立以最小化组合损失函数为训练目标的预测模型. 使用CE损失函数监督模型的分类效果，使用RK损失函数加强分类效果，从而进一步改进预测模型. 与BP-ANN模型和LSTM模型进行对比实验，验证所提出模型的预测精度.

1. 基于BP-ANN和组合损失函数的风电预测方法

本研究方法包括数据预处理与分类部分、特征提取部分、组合损失函数评估部分，所提出的神经网络模型结构如图1所示. 组合损失函数值来自3个通道. 1）第一通道类似监督学习中的神经元网络结构，网络输入为气象数据 $ {{X}} $，利用全连接（fully connected，FC）层搭建高维特征提取子网和概率分布生成子网. 经高维特征提取子网生成高维特征向量 $ {{f}} $，再经过概率分布生成子网生成概率分布向量 $ {{d}} $， $ {{f}} $和 $ {{d}} $分别经过2个预测输出通道生成功率预测值 $ {p}_{1} $、 $ {p}_{2} $，将功率预测值分别与功率实际值比较，求出2个MSE子损失函数值. 2）第二通道，输入第一通道的 $ {{d}} $和如表1所示的相应数据类别值，输出CE子损失函数值. 3）第三通道，输入第一通道的 $ {{f}} $和相应的数据类别值，输出RK子损失函数值. 将3个通道的子损失函数值通过加权求和获得组合损失Loss，以最小化该损失为训练目标，通过梯度下降法对网络权值进行迭代更新. 预测模型以某风场未来1日内间隔为15 min的96个NWP气象预测数据作为输入，预测输出为该日96个点的风场输出功率，预测的时间分辨率与NWP气象数据采样间隔一致. 训练样本选取过去几日甚至几十日内的气象数据和风场实际功率数据.

图 1

新窗口打开| 下载原图ZIP| 生成PPT

图 1 基于BP-ANN和组合损失函数的风电预测模型示意图

Fig.1 Schematic diagram of wind power prediction model based on BP-ANN and combined loss function

表 1 风电功率、类别及样本数的列表

Tab.1 List of wind power，category，and sample numbers

风电功率/kW	类别	样本数
<50	1	2094
50~110	2	2120
110~180	3	2008
180~290	4	2356
290~500	5	2169
>500	6	2165

新窗口打开| 下载CSV

1.1. 数据预处理与分类

输入历史数据包括由数据采集与监控系统获取的实测输出功率和NWP系统提供的风速、风向（风向角正弦值）、温度、湿度和气压等 $ k $类气象数据，在本研究中 $ k= $5. 所有数据的时间分辨率均为15 min，即一天拥有96个数据样本.

为消除不同变量的量纲，让模型更好更快收敛，对各项数据通过最大值归一化到[0，1.0]. 根据风电机组的容量和样本数量，将风电功率值按照样本数量均匀且足量的原则进行区间划分，以实现回归问题向分类问题的转化，获得如表1所示的 $ m $类风电数据，在本研究中 $ m= $6.

气象数据 ${{X}}=\left[{ v,\;{v_{\rm{sin}}} ,\; T,\; P,\;h } \right]$为网络输入，其中 $ v $、 $ {v}_{\rm{sin}} $分别为风速和风向正弦值， $ T $为摄氏温度， $ P $为大气压强， $ h $为空气相对湿度. ${{Y}}={[{y}_{1},\;{y}_{2},\;\cdots,\; {y}_{n}]}^{T}$为所有样本的功率实际值， $ n $为样本数量； ${{L}}= $ $ {[{l}_{1},\;{l}_{2},\;\cdots,\; {l}_{n}]}^{T}$表示所有样本的类别， $ {l}_{i}\in \left\{1,\cdots ,m\right\} $.

1.2. 特征提取

将样本表示为向量 $ {{x}}\in {\mathbb{R}}^{n} $时，向量的每一个元素 $ {x}_{i} $都代表一个特征^[14]. 高维特征是样本特征输入神经网络后，乘以权重矩阵使维度扩大后的结果，代表样本深层次的特征. 类别不同的样本应具有不同的高维特征. FC层的作用是将输入向量乘以相应的连接权值矩阵再加上偏置，输入和输出维度分别为 $ {n}_{1} $和 $ {n}_{2} $的单层FC层，大小记为 $ {n}_{1}:{n}_{2} $，FC层的输出可表示为

(1) $ {o}_{j}=g\left(\sum \limits_{i=1}^{{n}_{1}}{w}_{ij}{x}_{i}+{b}_{j}\right) ;\;\;\; j=1,2,\cdots ,{n}_{2}{.}$

式中： $ {{x}}=\left[{x}_{1},{x}_{2},\cdots ,{x}_{{n}_{1}}\right] $为 $ {n}_{1} $维输入变量， $ {w}_{ij} $为第 $ i $个输入到第 $ j $个输出的连接权值， $ g $为激活函数， $ {{b}}=\left[{b}_{1},{b}_{2},\cdots ,{b}_{{n}_{2}}\right] $为偏置.

如图1所示，维度为5的气象数据 $ {{X}} $经过高维特征提取子网（该子网由大小分别为 $ k $: $ {c}_{1} $、 $ {c}_{1} $: $ {c}_{2} $的2层FC层构成），生成维度为 $ {c}_{2} $的 ${{f}}=\left[ { {{f_1}},\;{{f_2}},\;\cdots ,\;{{f_{{c_2}}}} } \right]$. $ {{f}} $经过概率分布生成子网生成 ${{d}}=\left[ { {{d_1}},{{d_2}} , \cdots ,{{d_m}} } \right]$， $ {d}_{i} $为样本类别为 $ i $的概率， $ i\in \left\{1,\cdots ,m\right\} $. 该子网由大小为 $ {c}_{2} $∶ $ m $的FC层和Softmax层构成，Softmax函数又称为归一化函数，Softmax层的功能如图2所示，它将 $ m $个 $ (-{\infty },+{\infty }) $的实数映射为 $ m $个 $ \left({0,1}\right) $的实数并保证它们的和为1.

图 2

新窗口打开| 下载原图ZIP| 生成PPT

图 2 Softmax层示意图

Fig.2 Illustration of Softmax layer

1.3. 组合损失函数评估

$ {{f}} $经过预测输出通道1（该通道由大小为 $ {c}_{2} $∶1的FC层构成），生成风电功率预测值 $ {p}_{1} $； $ {{d}} $经过预测输出通道2（该通道由大小为 $ m $∶1的FC层构成），生成风电功率预测值 $ {p}_{2} $.

以组合损失函数计算得到的组合损失 $ {\rm{Loss}} $为模型预测效果的评估标准，经多次反向传播得到使 $ {\rm{Loss}} $最小化的预测模型.

2. 人工神经网络中的组合损失函数

2.1. MSE损失函数

在监督学习中，损失函数用于衡量预测值和实际值之间的差距，并以损失函数最小为训练目标，对预测模型参数进行迭代求解^[15]. MSE损失函数是标准BP-ANN的损失函数，将其定义为

(2) ${L_{{\rm{MSE}}}} = \frac{1}{n}\sum\limits_{i = 1}^n {{{\left( {{{\hat y}_i} - {y_i}} \right)}^2}} .$

式中： $ {y}_{i} $和 $ {\hat{y}}_{i} $分别为实际值和预测值. 当模型预测值与真实值误差服从高斯分布时，MSE损失函数较为适用^[13].

2.2. CE损失函数

考虑训练模型与真实模型的概率性误差，通过引入CE损失函数衡量误差大小^[16]：

(3) ${L_{{\rm{CE}}}} = \frac{1}{n}\mathop \sum \limits_{i = 1}^n \left[ { - \log \left( {{d_{{l_i}}}} \right)} \right].$

式中： $ {l}_{i} $为第 $ i $个样本的实际类别， $ {d}_{{l}_{i}} $为该样本预测类别为实际类别的概率.

CE损失函数经常用于分类问题，表征2个概率模型之间的相似程度，CE损失函数越小，表征训练出的概率模型越接近真实的概率模型^[14].

2.3. RK损失函数

为了减少类内特征的分散，扩大不同类间特征的差异，通过引入如下的RK损失函数来加强分类学习的效果.RK损失函数由中心损失函数 $ {L}_{\rm{c}} $和边距排序损失函数 $ {L}_{{\rm{m}}{\rm{r}}} $构成^[17-19]，将其定义为

(4) ${L_{{\rm{rank}}}} = {L_{\rm{c}}} + {L_{{\rm{mr}}}}.$

中心损失函数 $ {L}_{\rm{c}} $用于表征类内高维特征距离

(5) ${L_c} = \frac{1}{{2n}}\mathop \sum \limits_{i = 1}^n {\left\| {\left. {{{{f}}_i} - {{{C}}_{{l_i}}}} \right\|} \right.^2}.$

式中：第 $ i $个样本的高维特征为 $ {{{f}}}_{i} $、类别为 $ {l}_{i} $，所有第 $ {l}_{i} $类样本的高维特征中心为 $ {{C}}_{{l}_{i}} $. 边距排序损失函数 $ {L}_{{\rm{m}}{\rm{r}}} $用于表征不同类间高维特征距离

(6) ${L_{mr}} = \mathop \sum \limits_{i = 1}^{m - 2} {L_{m{r_i}}}.$

(7) $\left. {\begin{array}{*{20}{c}} {{L_{{\rm{mr1}}}} = \displaystyle\displaystyle \sum \limits_{i = 1}^{m - 2} \displaystyle \sum \limits_{j = 1}^{m - 1} {\rm{max}}\left( {0,\delta - \left( {d_i^2 - d_j^1} \right)} \right),} \\ {{L_{{\rm{mr2}}}} = \displaystyle \sum \limits_{i = 1}^{m - 3} \displaystyle \sum \limits_{j = 1}^{m - 1} {\rm{max}}\left( {0,2\delta - \left( {d_i^3 - d_j^1} \right)} \right),} \\ { \vdots } \\ {{L_{{\rm{mr}}\left( {m - 2} \right)}} = \displaystyle \sum \limits_{i = 1}^1 \displaystyle \sum \limits_{j = 1}^{m - 1} {\rm{max}}\left( {0,\left( {m - 2} \right)\delta - \left( {d_i^{m - 1} - d_j^1} \right)} \right).} \end{array}} \right\}$

式中： $ \delta $为不同类别样本特征的边距值（margin）， $ {d}_{i}^{1} $、 $ {d}_{i}^{2} $、…、 $ {d}_{i}^{m-1} $为每类样本高维特征中心 $ {{C}}_{i} $之间的L2范数距离，计算方法如下.

(8) $\left. {\begin{array}{*{20}{c}} {d_i^1 = \left\| {{{{C}}_i} - {{{C}}_{i + 1}}} \right\|,i = 1,2, \cdots ,m - 1;} \\ {d_i^2 = \left\| {{{{C}}_i} - {{{C}}_{i + 2}}} \right\|,i = 1,2, \cdots ,m - 2;} \\ { \vdots } \\ {d_i^{m - 1} = \left\| {{{{C}}_i} - {{{C}}_{i + m - 1}}} \right\|,i = 1.} \end{array}} \right\}$

式中：当 $ k<l $时， $ {d}_{i}^{k} $应小于 $ {d}_{i}^{l} $. 每类样本高维特征中心 $ {{C}}_{i} $定义为

(9) ${{{C}}_i} = \frac{{\displaystyle\sum \nolimits_{j = 1}^n \lambda \left( {{l_j} = i} \right) {{{f}}_j}}}{{\displaystyle \sum \nolimits_{j = 1}^n \lambda \left( {{l_j} = i} \right)}};i = 1,2, \cdots ,m.$

其中，条件函数

$\lambda \left( {{l_j} = i} \right) = \left\{ {\begin{array}{*{20}{c}} {1,{l_j} = i};\\ {0,{l_j} \ne i} .\end{array}} \right.$

排序损失函数示意如图3所示.

图 3

新窗口打开| 下载原图ZIP| 生成PPT

图 3 排序损失函数示意图

Fig.3 Schematic diagram of rank loss function

当类内特征分散而远离中心时， $ {L}_{\rm{c}} $相应增大；当类间距离小于设定的 $ \delta $时， $ {L}_{{\rm{m}}{\rm{r}}} $会相应增大，最终都会使排序损失增大. 因此，RK损失函数越小，表明类内距离越小、类间距离越大，即类内特征更紧凑、类间特征区分度更大，分类更准确.

2.4. 组合损失函数

用风电功率预测值 $ {p}_{1} $、 $ {p}_{2} $与功率实际值 $ {{Y}} $经过式（2）计算MSE损失，分别得到表征回归损失的 $ {\rm{loss}}_{{{\rm{r}}{\rm{eg}}}_{1}} $和 $ {\rm{loss}}_{{{\rm{r}}{\rm{eg}}}_{2}} $. 用 $ {{d}} $与类别 $ {{L}} $计算CE损失，得到表征分类损失的 $ {\rm{los}}{{\rm{s}}_{{\rm{cls}}}} $；用 $ {{f}} $与类别 $ {{L}} $计算RK损失，得到表征排序损失的 $ {\rm{los}}{{\rm{s}}_{{\rm{rank}}}} $. 将3类损失值加权求和得到组合损失值

(10) ${\rm{Loss}} = \alpha \left( {{\rm{los}}{{\rm{s}}_{{\rm{re}}{{\rm{g}}_{\rm{1}}}}} + {\rm{los}}{{\rm{s}}_{{\rm{re}}{{\rm{g}}_{\rm{2}}}}}} \right) + \beta {\rm{los}}{{\rm{s}}_{{\rm{cls}}}} + \gamma {\rm{los}}{{\rm{s}}_{{\rm{rank}}}}.$

式中： $ \alpha $、 $ \beta $、 $ \gamma $为组合损失函数权重系数.

3. 算例分析

3.1. 实验方法

实验样本来自江苏某地风电机组在2011年上半年的实测数据，额定容量为1200 kW，共有近13000条数据.

根据实际的气象数据维度和类别数量，及经典网络结构中神经元个数设置的经验^[20]，设置网络结构. 初始化方式为高斯随机，激活函数采用Sigmoid函数，训练周期（epoch）的数目设置为10，学习率（learning rate）初始化为0.001，训练过程和测试过程的批次（batch）分别设置为40、1；联合损失函数的权重系数分别取1、1、0.001，RK损失函数中的边距值 $ \delta $=0.5.

本研究使用可变的学习率，初期学习速度较快以大幅更新连接权值，在训练进行到第3个周期时，学习率乘以0.1，进行到第6个周期时，再乘以0.1，使学习速度逐渐减小以缓慢稳定地更新网络.

3.2. 评价指标

采用平均绝对误差 ${\varepsilon }_{{\rm{MAE}}}$和均方根误差 ${\varepsilon }_{{\rm{RMSE}}}$作为评价指标.

(11) ${\varepsilon _{{\rm{MAE}}}} = \frac{1}{N}\mathop \sum \limits_{i = 1}^N \left| {{{\hat y}_i} - {y_i}} \right|.$

(12) ${\varepsilon _{{\rm{RMSE}}}} = \sqrt {\frac{1}{N}\mathop \sum \limits_{i = 1}^N {{\left( {{{\hat y}_i} - {y_i}} \right)}^2}} .$

式中： $ N $为预测数据个数.

3.3. 预测性能分析

取2011年1月6日0:00至15日24:00的样本数据作为训练集，取1月16日0:00~24:00的样本数据作为测试集，实际功率曲线与采用BP-ANN模型、组合损失函数模型（本文模型）得到的预测功率曲线如图4所示. 由图可知，本文模型能有效预测风电出力.

图 4

新窗口打开| 下载原图ZIP| 生成PPT

图 4 实际功率曲线与采用BP-ANN模型、本文模型得到的预测功率曲线

Fig.4 Actual power curve and the predicted power curve obtained by using the BP-ANN model and proposed model

为了进一步验证组合损失函数的作用，在不同的数据量规模下比较本文模型、BP-ANN模型和LSTM模型的风电功率预测效果. BP-ANN模型和LSTM模型均采用3层隐层网络结构. 为减小随机性初始化对结果的影响，采用6次独立实验的误差结果平均值， $ {\varepsilon }_{\rm{MAE}} $、 $ {\varepsilon }_{\rm{RMSE}} $和训练时间如表2所示. 由表可知，本文模型具有较好的学习能力， $ {\varepsilon }_{\rm{MAE}} $是机组额定容量的10.6%， $ {\varepsilon }_{\rm{RMSE}} $是机组额定容量的11.8%，符合文献[21]的要求，且预测精度优于BP-ANN模型和LSTM模型.

表 2 模型的预测性能对比

Tab.2 Comparison of prediction performance

训练集样本数	模型	$ {{{\varepsilon}} _{{\bf{MAE}}}} $ /kW	$ {{{\varepsilon}} _{{\bf{RMSE}}}} $ /kW	训练时间/s
900	BP-ANN	131.9	150.5	1.8
	LSTM	154.0	179.1	5
	本文	110.0	133.9	3.1
1800	BP-ANN	126.2	144.4	3.0
	LSTM	222.9	259.7	16.5
	本文	131.7	141.6	4.5
4500	BP-ANN	152.6	186.8	5.4
	LSTM	120.9	147.5	26.6
	本文	118.1	144.1	8.8
7200	BP-ANN	133.3	185.2	8.3
	LSTM	131.6	161.5	42.9
	本文	94.5	105.2	13.8
9000	BP-ANN	125.9	187.7	10.2
	LSTM	109.2	130.9	78.8
	本文	103.2	128.9	16.6

新窗口打开| 下载CSV

本文模型的计算量大于BP-ANN模型，在3.60 GHz Intel（R）Core（TM）i7-4790/8G RAM的测试平台上，学习速度略低于BP-ANN模型，但优于LSTM模型. 原因是LSTM模型每一时刻的计算都依赖于前一时刻的计算和输出结果.

3.4. 功能验证

为了进一步测试组合损失函数的效果，利用以下3种损失函数训练模型：1）单独MSE损失函数；2）MSE+CE损失函数；3）组合损失函数，其余的设置相同. 基于五类训练数据规模最终得到的 $ {\varepsilon }_{\rm{MAE}} $和 $ {\varepsilon }_{\rm{RMSE}} $如表3所示. 由表可知，在不同的训练集样本数下，在MSE损失函数的基础上依次引入CE损失函数和RK损失函数，预测精度均有所提高，证明了组合损失函数对预测模型的改进作用.

在某一训练集规模下，改变组合损失函数的权重系数 $ \alpha $、 $ \beta $、 $ \gamma $，以分别测试各损失函数对权重系数的敏感度， $ {\varepsilon }_{\rm{RMSE}} $如表4所示. 由表可知，随着权重系数变化，预测误差的变化趋势没有明显的相关性，表明MSE、CE及RK损失函数对权重系数的设置不敏感，模型参数调节难度较低.

表 3 训练后的模型的预测功率误差对比

Tab.3 Comparison of prediction errors of trained models 单位：kW

训练集样本数	${{\varepsilon } }_{{{\rm{MAE}}} }$/ ${{\varepsilon } }_{{{\rm{RMSE}}} }$
训练集样本数	MSE	MSE+CE	MSE+CE+RK
900	121.7/145.0	119.5/138.3	110.0/133.9
1800	153.9/162.6	146.1/155.1	131.7/141.6
4500	134.3/161.0	128.5/150.9	118.1/144.1
7200	104.2/113.3	98.5/108.7	94.5/105.2
9000	146.6/171.9	134.0/159.3	103.2/128.9

新窗口打开| 下载CSV

表 4 不同损失函数权重系数的预测误差对比

Tab.4 Comparison of prediction errors of different loss function weight coefficients

${{\alpha } }$/ ${{\beta } }$/ ${{\gamma } }$	${{\varepsilon } }_{{{\rm{RMSE}}} }$/kW	${{\alpha } }$/ ${{\beta } }$/ ${{\gamma } }$	${{\varepsilon } }_{{{\rm{RMSE}}} }$/kW	${{\alpha } }$/ ${{\beta } }$/ ${{\gamma } }$	${{\varepsilon } }_{{{\rm{RMSE}}} }$/kW
1/0.5/0.001	138.9	1/1/0.0005	144.1	1/1/0.005	142.3
1/1/0.002	144.2	1/1/0.01	126.4	1/5/0.001	148.8
1/10/0.001	133.9	2/1/0.001	130.5	10/1/0.001	166.7

新窗口打开| 下载CSV

4. 结　论

（1）与BP-ANN模型、LSTM模型的对比实验，证明了本文模型具有更强的学习与泛化能力，能够获得更高的预测精度，且训练速度快于LSTM模型.

（2）引入CE损失函数，将分类的思维引入回归问题，弥补了MSE作为损失函数的局限性. 与仅用MSE来训练的方法相比，MSE+CE联合训练的预测精度有所提高.

（3）引入RK损失函数，通过提高同类别样本高维特征的集中度与不同类别样本高维特征的区分度，进一步加强分类的效果. 并通过与MSE+CE联合训练方法的对比，充分验证了本文模型的效果.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

彭小圣, 熊磊, 文劲宇, 等

风电集群短期及超短期功率预测精度改进方法综述

[J]. 中国电机工程学报, 2016, 36 (23): 6315- 6326