浙江大学学报(工学版), 2022, 56(4): 718-726 doi: 10.3785/j.issn.1008-973X.2022.04.011

计算机技术、信息工程

基于改进型相似性建模的光伏积灰监测方法

王中豪,, 徐正国,, 章筠

1. 浙江大学 控制科学与工程学院,浙江 杭州 310027

2. 上海电气分布式能源科技有限公司,上海 200070

Improved similarity-based modeling approach for dust deposition monitoring of photovoltaic modules

WANG Zhong-hao,, XU Zheng-guo,, ZHANG Yun

1. College of Control Science and Engineering, Zhejiang University, Hangzhou 310027, China

2. Shanghai Electric Distributed Energy Technology Limited Company, Shanghai 200070, China

通讯作者: 徐正国,男,教授. orcid.org/0000-0003-0599-7324. E-mail: xzg@zju.edu.cn

收稿日期: 2021-05-10  

基金资助: 国家自然科学基金资助项目(61751307,61973269)

Received: 2021-05-10  

Fund supported: 国家自然科学基金资助项目(61751307,61973269)

作者简介 About authors

王中豪(1993—),男,博士生,从事光伏系统运维优化的研究.orcid.org/0000-0001-5317-2322.E-mail:11632028@zju.edu.cn , E-mail:11632028@zju.edu.cn

摘要

针对光伏系统积灰程度监测的问题,考虑到基于理论公式的方法误差较大,基于计算机视觉的方法成本较高,传统机器学习方法对训练数据有较高需求,提出弱监督的数据驱动方法:改进型相似性建模(SBM)方法. 在原始的SBM方法的基础上,对参数选取、状态矩阵构建与更新、相似性算子设计进行针对性的改进,使得该方法更加适用于光伏系统的应用,提高准确性与响应速度. 利用真实的积灰实验数据,对改进型SBM方法与其他5种方法的积灰诊断效果进行对比,包括基于理论公式的方法、前馈神经网络(FNN)、支持向量回归(SVR)、随机森林(RF)和原始SBM方法. 结果表明,改进型SBM方法可以以可接受的响应速度劣势实现最佳的积灰程度监测准确性.

关键词: 光伏系统 ; 积灰 ; 系统状态监测 ; 对比实验 ; 相似性建模(SBM)

Abstract

A weakly-supervised data-driven approach, improved similarity-based modeling (SBM) approach, was proposed aiming at the problem of dust deposition monitoring of photovoltaic modules. The great error of theoretical formulas approaches, the high cost of computer vision approaches and the large requirements for training data of classical machine learning approaches were considered. Improvements in the steps of parameters selection, state matrix construction and update and similarity operator were made based on the original SBM in order to adapt the approach to the PV systems monitoring and increase the estimated accuracy and response rate. The improved SBM and five other approaches, theoretical formulas, feedforward neural network (FNN), support vector regression (SVR), random forest (RF), and the original SBM were employed for the dust estimation, and their performances were evaluated based on the real data from a dust deposition experiment. Results show that the improved SBM has the best accuracy at the cost of acceptable response time increase.

Keywords: photovoltaic system ; dust deposition ; system condition monitoring ; comparative experiment ; similarity-based modeling (SBM)

PDF (1572KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王中豪, 徐正国, 章筠. 基于改进型相似性建模的光伏积灰监测方法. 浙江大学学报(工学版)[J], 2022, 56(4): 718-726 doi:10.3785/j.issn.1008-973X.2022.04.011

WANG Zhong-hao, XU Zheng-guo, ZHANG Yun. Improved similarity-based modeling approach for dust deposition monitoring of photovoltaic modules. Journal of Zhejiang University(Engineering Science)[J], 2022, 56(4): 718-726 doi:10.3785/j.issn.1008-973X.2022.04.011

我国在2020年提出力争在2030年前实现碳达峰,2060年前实现碳中和的目标,发展清洁能源是必经之路. 光伏系统作为目前利用太阳能的主流技术之一,受到了越来越多的关注[1]. 研究表明,光伏组件表面积灰可以导致光伏系统发电效率下降20%~40%[2-3],因此,积灰程度监测成为光伏系统状态监测中的一个重要组成部分,也是开展光伏系统运维工作不可缺少的基础工作[4]. 现有的积灰状态监测方法主要有以下3类:基于理论公式的方法、基于计算机视觉的方法和数据驱动的方法.

理论公式法通常先根据公式,利用额定功率与气象参数,计算清洁状态下系统的理想发电功率,得到实际功率受积灰影响的降低程度. Mattei等[5-6]采用标准测试条件下的太阳辐射值和温度以及组件额定功率,计算无积灰影响时的理想发电功率. Araneo等[7-8]改进了组件温度的计算方法. 该类方法不需要历史数据,成本低,适用性强,但是受组件特性差异、使用时间及工作环境的影响较大,监测结果可能会有较大的误差.

基于计算机视觉的积灰诊断方法是人工智能技术的新兴应用领域. 张姝伟[9]利用改进的插值算法和图像平均灰度的计算方法对光伏板积灰图像进行处理,分析积灰情况. Yang等[10]提出基于黑白比的图像处理算法来识别组件积灰,分析成像条件对识别效果的影响. Simonazzi等[11]利用新型传感器,研究计算机视觉在积灰诊断与运维决策中的应用. 目前对一些大型光伏电站和分布式系统的拍照成本很高,有时甚至无法获得;因为光伏系统的组件特性和工作环境多种多样,模型的泛化能力是一个问题.

数据驱动的方法通常利用历史数据中气象参数、发电功率和积灰程度的关系计算功率损失,诊断积灰程度,目前应用最广泛的是机器学习方法. Pulipaka等[12-14]研究利用人工神经网络、支持向量回归、随机森林等机器学习方法进行积灰程度及清洗行为的诊断工作. 这些方法的成本较低,准确性好. 大多数机器学习方法都需要大量带有标签的历史数据进行训练,而这些训练数据在许多情况下是难以获得的. 缺乏可解释性是这些机器学习方法在工业应用中的一个缺点.

考虑到以上方法的不足,本文提出基于改进型相似性建模的积灰状态监测方法.相似性建模方法(similarity-based modeling, SBM)是数据驱动的非参数经验建模技术,通过部分具有代表性的历史数据估计各种状态下对应的正常情况. SBM基于参数的相关性,但不依赖于超参数和标签数据[15-16]. SBM方法多用于定性的故障检测[17-18].为了使该方法更加适合光伏系统的应用并提高诊断的准确性和响应速度,对算法中参数选择、状态矩阵构造、相似性算子设计、状态矩阵更新4个关键步骤进行改进.通过清洁–积灰对比实验,获取积灰对光伏发电影响的实验数据. 对改进型SBM方法的积灰程度监测效果进行验证,与其他5种方法进行对比.

1. 基于相似性的建模方法(SBM)

介绍SBM算法的基本原理. SBM是非参数经验建模技术,根据设备历史数据中具有代表性的正常运行的数据,通过插值运算估算设备当前正常运行应该呈现的数据. 这种方法是弱监督的,不需要历史数据具有积灰程度标签;不存在超参数设定的问题. 主要步骤如下所示.

1)为数据集选取参数,将参数个数标记为 $ n $.

2)从历史数据集中划定正常运行下的数据,称为“参考数据, ${\boldsymbol{X}}$”.

3)从参考数据 ${\boldsymbol{X}}$中选取部分典型数据,构建“状态矩阵, ${\boldsymbol{D}}$”.

$\begin{split} & {\boldsymbol{D}}=\left[{\boldsymbol{X}}\left(1\right)\;{\boldsymbol{X}}\left(2\right)\;\cdots\; {\boldsymbol{X}}\left(m\right)\right]=\\ & {\left[\begin{array}{cccc}{x}_{1}\left(1\right)& {x}_{1}\left(2\right)& \cdots & {x}_{1}\left(m\right)\\ {x}_{2}\left(1\right)& {x}_{2}\left(2\right)& \cdots & {x}_{2}\left(m\right)\\ \vdots & \vdots & & \vdots \\ {x}_{n}\left(1\right)& {x}_{n}\left(2\right)& \cdots & {x}_{n}\left(m\right)\end{array}\right]}_{n \times m} . \end{split}$

${\boldsymbol{D}}$${\boldsymbol{X}}$$ m $条典型数据组成. 每一个列向量代表一组正常运行下的各参数数据.

4)获取输入,即某一时刻的实际运行数据 ${{\boldsymbol{x}}}_{\mathrm{i}\mathrm{n}}$

$ {{\boldsymbol{x}}_{{\rm{in}}}} = {[{x_{{\rm{in,}}1}},\;{x_{{\rm{in,}}2}},\; \cdots ,\;{x_{{\rm{in,}}n}}]^{\rm{T}}} . $

比较与状态矩阵 ${\boldsymbol{D }}$的相似性,得到“相似性向量, ${\boldsymbol{a}}$”,

$ {\boldsymbol{a}}={{\boldsymbol{D}}}^{{\rm{T}}}\otimes {{\boldsymbol{x}}}_{{\rm{in}}} , $

其中 $\otimes $是用来计算2个向量之间欧氏距离的非线性算子.

5)按照下式将相似性向量 ${\boldsymbol{a}}$转化为权重向量 ${\boldsymbol{w}}$

$ {{\boldsymbol{w}}}_{0}={{\boldsymbol{G}}}^{-1}{\boldsymbol{a}} \text{,} $

$ {{\boldsymbol{G}}}^{-1}={({{\boldsymbol{D}}}^{{\rm{T}}}\otimes {\boldsymbol{D}})}^{-1} \text{,} $

$ {\boldsymbol{w}} = \frac{{{{\boldsymbol{w}}_0}}}{{\displaystyle\sum\limits_i {{w_{0,i}}} }} . $

式中: ${{w_{0,i}}} $${{{{\boldsymbol{w}}_0}}} $的第i个元素.

6)结合 ${\boldsymbol{D}}$${\boldsymbol{w}}$对当前工况下的正常状态进行预估,输出 ${{\boldsymbol{x}}}_{\mathrm{o}\mathrm{u}\mathrm{t}}$.

$ {{\boldsymbol{x}}}_{\mathrm{o}\mathrm{u}\mathrm{t}}={\boldsymbol{D}}{\boldsymbol{w}}=\frac{{\boldsymbol{D}}{({{\boldsymbol{D}}}^{{\rm{T}}}\otimes {\boldsymbol{D}})}^{-1}({{\boldsymbol{D}}}^{{\rm{T}}}\otimes {{\boldsymbol{x}}}_{{\rm{in}}})}{\displaystyle\sum {({{\boldsymbol{D}}}^{{\rm{T}}}\otimes {\boldsymbol{D}})}^{-1}({{\boldsymbol{D}}}^{{\rm{T}}}\otimes {{\boldsymbol{x}}}_{{\rm{in}}})} . $

7)利用 ${{\boldsymbol{x}}}_{\mathrm{o}\mathrm{u}\mathrm{t}}$${{\boldsymbol{x}}}_{\mathrm{i}\mathrm{n}}$的相对误差向量 ${\boldsymbol{d}}$,可以实现对异常程度的诊断.

$ {{{d}}_i} = \frac{{{{{x}}_{{\rm{out}},i}} - {{{x}}_{{\rm{in}},i}}}}{{{{{x}}_{{\rm{out}},i}}}}. $

式中: ${{{x}}_{{\rm{out}},i}} $${{{x}}_{{\rm{in}},i}} $分别为 ${{\boldsymbol{x}}_{{\rm{out}}}} $${{\boldsymbol{x}}_{{\rm{in}}}} $的第i个元素,did的第i个元素.

上述过程可以总结为如图1所示的流程图. 在将该方法应用到光伏系统积灰监测问题中时,“正常状态”对应系统在清洁无积灰时的工作状态,“异常程度”对应于组件的积灰程度. ${\boldsymbol{D}}$是通过一定策略选取出的具有代表性的清洁状态运行数据. 基于 ${{\boldsymbol{x}}}_{\mathrm{i}\mathrm{n}}$${\boldsymbol{D}}$的相似性得到预估输出 ${{\boldsymbol{x}}}_{\mathrm{o}\mathrm{u}\mathrm{t}}$,它可以理解为 ${\boldsymbol{D}}$所包含的理想状态通过插值得到的与 ${{\boldsymbol{x}}}_{\mathrm{i}\mathrm{n}}$最接近的正常状态. ${{\boldsymbol{x}}}_{\mathrm{o}\mathrm{u}\mathrm{t}}$${{\boldsymbol{x}}}_{\mathrm{i}\mathrm{n}}$越接近,说明 ${{\boldsymbol{x}}}_{\mathrm{i}\mathrm{n}}$${\boldsymbol{D}}$的相似性越高,说明这一输出状态越正常,两者偏差越大,说明 ${{\boldsymbol{x}}}_{{\rm{in}}}$偏离 ${\boldsymbol{D}}$所代表的正常状态越远,即不正常程度越大. 当选取的数据集的参数包含了会影响发电功率的各项环境参数,排除了设备老化带来的影响后,可以认为积灰是造成 ${{\boldsymbol{x}}}_{\mathrm{i}\mathrm{n}}$${{\boldsymbol{x}}}_{\mathrm{o}\mathrm{u}\mathrm{t}}$偏差的因素.

图 1

图 1   SBM算法的流程图

Fig.1   Flowchart of SBM approach


在基于上述原理的原始型SBM方法的基础上,为了实现更好的积灰诊断效果,提出改进型SBM方法,在参数选取、状态矩阵构建、相似性算子设计、状态矩阵更新等方面进行研究与改进.

2. 改进型SBM方法

在原始SBM算法的基础上,针对光伏发电积灰问题提出对应的参数选择方法. 将单一状态矩阵的构建方式改进为分类状态矩阵. 提出新的相似性算子,改进对向量的相似性度量效果. 提出应用中的状态矩阵更新方法. 对以上诸点分别进行介绍,总结基于改进型SBM方法的光伏积灰诊断算法.

2.1. 参数选择

参数选择是SBM算法的第1个步骤.由于光伏发电依赖于环境状态,选用部分光伏系统运行参数以及与发电相关的气象参数. 关键参数的缺失和不必要参数的冗余都会影响预估结果的准确性. 在本文的改进型SBM算法中,选取4个参数:直流发电功率、斜面总辐射照度、温度和相对湿度. 依据有以下2个方面:1)对光伏发电原理的分析;2)对这些参数的相关性分析.

光伏电池板通过光生伏打效应,将太阳能转化为电能. 如图2所示为光伏发电的工作原理. 当太阳光照射到半导体上,一部分被吸收的光子与半导体中的价电子碰撞,形成电子-空穴对,光能以这种形式转化为电能.电池板产生的电能是直流电,经过逆变器后成为交流电.分析组件表面积灰对发电的影响,应尽量避免后续环节的干扰,因此在选择光伏运行参数时,选用组件输出的直流功率. 在环境参数中,太阳辐射照度是影响功率的最重要因素.衡量太阳辐射有很多参数,包括全局总辐射照度、直接计算辐射照度、漫射辐射照度、斜面总辐射照度等.选择斜面总辐射照度. 这一参数考虑了光伏电池板倾角及太阳入射角度来量化电池板实际可以接收到的辐射,是与能量转化最直接相关的辐射参数. 温度是与发电相关的气象条件. 更高的温度会加速电子和空穴的重组,降低发电的效率. 另一个相关气象参数是相对湿度. 相对湿度的影响主要体现在对光伏板表面灰尘积累的影响上. 在不同湿度下,积灰过程的快慢不同,积灰对发电造成的影响不同.

图 2

图 2   光伏发电工作原理

Fig.2   Diagram of PV work principle


除了上述原理分析,根据历史数据开展参数的相关性分析,结果如表1所示. 在积灰程度监测中,光伏板直流发电效率、斜面总辐射、温度和相对湿度被确定为模型所包含的参数.

表 1   参数的相关性分析

Tab.1  Correlation analysis of selected parameters

参数 功率 斜面总辐射照度 温度 相对湿度
功率 1 0.973 0.333 −0.481
斜面总辐射照度 0.973 1 0.252 −0.437
温度 0.333 0.252 1 −0.244
相对湿度 −0.481 −0.437 −0.244 1

新窗口打开| 下载CSV


2.2. 状态矩阵构建

状态矩阵的构建有以下2个基本原则:1)为了提高预估的准确性,选取的数据集应具有足够的代表性,即要覆盖尽可能多的正常工作状态;2)为了提高计算效率,状态矩阵包含的数据量越小越好. 这要求状态矩阵的构建要兼顾准确性和计算效率. 已有研究对状态矩阵数据量的取舍有了一些研究,提出经验性建议:状态矩阵中的数据量为参数个数的4倍左右为优[17-18]. 除了数据量,对于状态矩阵的形式没有做出改进,对于一个过程或设备,都是建立单个状态矩阵. 在本文的改进型方法中,利用光伏发电的日周期性,提出分类状态矩阵的构建方法.

本文提出的分类状态矩阵是在基于相似性建模的方法中考虑数据的时间特性来构造状态矩阵. 在分类状态矩阵中,分类的标准是一天中的不同时刻,单位是h,每天从日出到日落的时间范围内,以每小时为单位各建立一个子矩阵. 于是,整体的状态矩阵成为由多个子矩阵组成的集合. 改进型状态矩阵对应的SBM算法的流程框图如图3所示. 输入矩阵的各个向量根据时刻,分别与对应的子矩阵进行相似性分析,得到正常状态的预估结果,例如子矩阵1对应xin1−1~xin n−1xout1−1~xout n−1.于是,可以避免环境参数在一天中不同时刻隐含的一些内在规律,排除不同时刻的干扰,使得到的输入与输出的差距更加贴近积灰程度这个单一原因造成的影响.

图 3

图 3   改进型SBM算法的流程图

Fig.3   Flowchart of improved SBM with classified state matrix


2.3. 相似性算子

SBM算法中对向量之间进行相似性度量的算子称为相似性算子. 目前,大多数相关研究采用欧氏距离作为相似性算子. 由于欧氏距离没有考虑到不同参数之间的量纲差距,当模型中某个参数的取值过大时,该参数对应的相似性计算结果会很大,相应的权重也很大.受此影响,预估结果变得不够准确. 为了解决这一问题,在一些研究中对测量值进行归一化处理,将测量值投射到0~1.0. 这种处理方式有以下2个问题. 1)在归一化后的值中会有0值或近似0值. 在计算相对误差时,若除数为0,则无法得到结果;若除数为近似0值,则会计算得到很大的结果. 2)归一化处理后各个参数的值都失去了自身的物理意义,使得状态监测的结果不直观.

考虑到上述问题,提出使用标准化欧氏距离作为相似性算子. 向量 ${\boldsymbol{P}} = [{{{p}}_1},{{{p}}_2}, \cdots ,{{{p}}_n}]$Q = [q1q2,··· ,qn]的标准化欧氏距离定义如下:

$ \otimes \left({{{\boldsymbol{P}}}},{{{\boldsymbol{Q}}}}\right)=\sqrt{\sum _{i=1}^{n}\frac{{({{{p}}}_{i}-{{{q}}}_{i})}^{2}}{{\delta }_{i}^{2}}} . $

式中: $ {\delta }_{i}^{2} $为第 $ i $个参数所有取值的方差. 标准欧氏距离解决了传统欧氏距离的权重问题,避免了归一化欧氏距离存在的2个问题.

2.4. 状态矩阵的更新设计

在原始SBM方法中,状态矩阵构建完成并开始使用后保持不变. 考虑到光伏系统工作所处环境状态多变的问题,利用状态矩阵的组成数据相对独立的特点,提出改进型SBM方法中状态矩阵的在线更新设计.

状态矩阵中数据集的覆盖性和代表性在很大程度上决定了积灰诊断结果的准确性. 这意味着可以根据积灰诊断效果来反向判断状态矩阵的合理性并进行调整,在离线状态下,可以利用已知实际积灰程度的实验数据对状态矩阵进行调整. 在光伏系统的实际在线工作过程中,没有实时的真实积灰程度作为参照. 基于相似性建模方法的特点是利用理想情况下的工作状态预估得到实际运行时应有的理想状态. 对于本身是理想状态的数据,预估得到的输出值应与实际值相同或相近. 利用这一点,可以进行状态矩阵的在线更新.

在光伏系统的运行过程中,运维人员可以通过运行日志,获知组件何时进行了人工清洗;清洗完之后的较短时间段内可以认为组件是在清洁状态下工作的. 若积灰监测算法对清洁状态组件的诊断结果为积灰程度接近0,则说明此时的状态矩阵可以覆盖这段时间内出现的环境状态. 如果出现将清洁状态诊断为积灰程度较高的情况,说明这条输入数据没有被状态矩阵通过插值找到很好的相似结果,建议通过人工判断确认光伏板的清洁情况. 如果确实是清洁的,那么将该输入数据纳入状态矩阵中,实现状态矩阵覆盖性和代表性的提升.

2.5. 改进型SBM算法总结

将改进型SBM算法流程总结为算法1.

算法1 改进型SBM积灰诊断算法

 1   初始化:由历史数据构建改进型状态矩阵 ${\boldsymbol{D}}$

 2   while 积灰诊断正在进行

 3   输入:某一时刻的实际运行数据 ${{\boldsymbol{x}}}_{{\rm{in}}}$

 4  比较 ${\boldsymbol{D}}$${{\boldsymbol{x}}}_{{\rm{in}}}$的相似性,得到相似性向量 ${\boldsymbol{a}}$

 5  将相似性向量 ${\boldsymbol{a}}$转化为权重向量 ${\boldsymbol{w}}$

 6  结合 ${\boldsymbol{D}}$${\boldsymbol{w}}$对当前工况下的正常状态进行预     估,得到 ${{\boldsymbol{x}}}_{{\rm{out}}}$

 7   输出:积灰程度 ${\boldsymbol{d}}$,即 ${{\boldsymbol{x}}}_{{\rm{in}}}$${{\boldsymbol{x}}}_{{\rm{out}}}$的相对误差

 8   if (输入对应时刻为清洁状态且 ${\boldsymbol{d}}\gg {\boldsymbol{0}}$

 9   then  将 ${{\boldsymbol{x}}}_{{\rm{in}}}$纳入 ${\boldsymbol{D}}$

 10   end if

 11   end while

3. 实验分析

3.1. 实验系统

清洁–积灰对比实验系统位于中国上海一座建筑的屋顶,经纬度为(31.25,121.46),系统照片如图4所示. 实验系统由2组光伏组串与环境监测仪组成. 如图5所示为实验系统的图解. 如图5所示,2组光伏组串各由19块相同的光伏组件组成,所有组件的电池板均按照南向30°角安装,且均未安装角度自动追踪系统.光伏电池板参数的标称值如表2所示. 根据系统组成和标称数据可知,单个组件的光伏板面积为1.65 m2,额定功率为305 W;每组组串的光伏板总面积为31.35 m2,总额定功率为5.795 kW.

2组组串的相互距离很近,均没有被建筑物、树木及其他阴影遮挡. 一组作为实验组,保持自然积灰状态,不进行清洗. 另一组配备了自动清洗机器人作为对照组. 南德意志集团(TÜV SÜD)对清洗机器人进行实验测试. 测试对2组(2个品牌、每组5块)光伏组件进行机器人清扫,累计5 000次. 结果表明,机器人有良好的清洗效果,由于机器人清扫导致的2组光伏组件发电效率衰减分别约为0.04%/年和0.05%/年,可以认为清洗机器人不会造成组件效率明显衰减.

图 4

图 4   清洁–积灰对比实验系统的照片

Fig.4   Photo of clean-dusty comparative experiment system


图 5

图 5   清洁–积灰对比实验系统的结构图

Fig.5   Diagram of clean-dusty comparative experiment system


表 2   光伏组件参数的标称值

Tab.2  Nominal values of PV panel parameters

参数 参数值
标准辐射照度/(W·m−2 1000
标准环境温度/(°) 25
额定最大功率/W 305
标准条件工作电流/A 7.71
标准条件工作电压/V 29.2
标准条件短路电流/A 8.15
标准条件开路电压/V 37.6
组件尺寸 1658 mm×992 mm×6 mm

新窗口打开| 下载CSV


在对比实验中,机器人每天自动清洗对照组组串一次. 忽略2次清洗之间的积灰过程,可以将对照组的光伏组件视为在无积灰的清洁状态下工作. 机器人清洗会选择日落后的时间,每次清洗只需要耗时5 min. 清洗机器人有独立的供电系统,不需要消耗光伏组串生产的电力. 根据以上几点,可以忽略清洗工作对光伏发电带来的影响. 2组组串发电情况的差别可以用来衡量积灰带来的影响. 环境监测仪可以测量并记录包括太阳辐射、温度、湿度在内的气象参数. 光伏系统运行数据与环境监测数据的采样频率均为5 min/次.

3.2. 积灰影响

选取从2019年5月到9月的数据. 在进行数据分析之前,开展数据预处理,主要包括以下步骤.

1) 有些天清洗机器人由于故障没有工作,对应的数据为无效数据,进行去除.

2) 下雨天的数据进行去除. 在下雨的状态下,光伏系统的发电功率很低,对应的数据会有很大的噪声,计算相对值时会有较大的误差.

3) 由于光伏系统在没有光照的时候不工作,每天日出前和日落后的数据为无效数据,进行去除.

4) 为了避免噪声的干扰,对数据进行周期为1 h的重采样.

对预处理后的数据集进行分析,对比实验组和对照组的发电功率P,如图6所示. 由于相对差距较小,两者的功率曲线差别不显著,如图7所示为相对差距R曲线.

在实验时间范围内,对照组与实验组组串发电功率的平均相对差距为2.29%. 可知,在上海这样的沿海大城市,屋顶光伏系统因积灰而产生的平均发电量损失会超过2%. 根据光伏行业的现状可知,一个装机容量为1 mW的光伏系统每年可发电120万kW·h. 在不采取人工清洗的情况下,因积灰造成的功率损失约为27.48万kW·h. 到2020年,中国分布式光伏系统的装机容量将达到6万MW. 积灰造成的电力损失将超过16.2亿kW·h,每年经济损失将超过5.5亿美元. 考虑到积灰对光伏发电的影响,积灰状态监测是值得研究的问题.

图 6

图 6   对照组与实验组组串的发电功率

Fig.6   Power of control group and experimental group


图 7

图 7   对照组与实验组发电功率的相对差距

Fig.7   Relative difference of power of control group and experimental group


3.3. 积灰程度诊断

3.3.1. 对比方法与评价指标

基于对比实验的数据结果,比较以下6种积灰诊断方法的性能:1)基于理论公式的方法;2)FNN;3)SVR;4)RF;5)原始SBM方法;6)本文提出的改进型SBM方法.

参考国标《光伏发电效率技术规范》[19]与文献[5,6],选择式(10)作为对比的理论公式,计算理想发电功率

$ {P}_{\mathrm{i}\mathrm{d}\mathrm{e}\mathrm{a}\mathrm{l}}={P}_{\mathrm{m}\mathrm{a}\mathrm{x}}\frac{E}{{E}_{\mathrm{S}\mathrm{T}\mathrm{C}}}[1+\beta (T-{T}_{\mathrm{S}\mathrm{T}\mathrm{C}}\left)\right] . $

式中: $ {P}_{\mathrm{m}\mathrm{a}\mathrm{x}} $为额定最大功率, $E$为实际光照辐射照度, ${E}_{\mathrm{S}\mathrm{T}\mathrm{C}}$为标准条件下的辐射照度, $ \beta $为功率温度系数, $ T $为实际温度, $ {T}_{\mathrm{S}\mathrm{T}\mathrm{C}} $为标准工作温度. 积灰程度 $y$可以由下式计算得到:

$ y=1-\frac{{P}_{\mathrm{a}\mathrm{c}\mathrm{t}}}{{P}_{\mathrm{i}\mathrm{d}\mathrm{e}\mathrm{a}\mathrm{l}}} . $

式中: ${P}_{\mathrm{a}\mathrm{c}\mathrm{t}}$为实际发电功率.

FNN[20]、SVR[21] 和RF[22]是3种常用的解决回归问题的机器学习方法. 受限于篇幅,不介绍这些方法的原理. 由于这3种机器学习方法是有监督的,带标签的训练数据的可用性是影响性能的重要因素. 采用不同的训练数据和测试数据比例(40%∶60%,60%∶40%,80%∶20%),评估方法的效果.

为了更直观地评价这些方法的诊断性能,选择6个误差指标对诊断结果的准确性进行评价,分别为:均方误差(mean square error,MSE)、平均相对误差(mean relative error,MRE)、均方根误差(root mean square error,RMSE)、归一化均方误差(normalized mean square error,NMSE)、归一化平均绝对误差(normalized mean absolute error,NMAE)和确定系数(R-Squared,R2). 这些误差指标的计算方法如下.

$ {\rm{MSE}} = {n^{ - 1}}\sum\limits_{i = 1}^n {{{({y_i} - y_i^*)}^2}} . $

$ {\rm{MRE}}={n^{ - 1}} \sum _{i=1}^{n}\frac{|{y}_{i}-{y}_{i}^{*}|}{{y}_{i}} . $

$ {\rm{RMSE}}=\sqrt{{n^{ - 1}}\sum _{i=1}^{n}|{y}_{i}-{y}_{i}^{*}|} . $

$ {\rm{NMSE}} = \frac{\rm{MSE}}{{{n^{ - 1}}\displaystyle\sum\nolimits_{i = 1}^n {{{\left( {{y_i} - \bar y_i} \right)}^2}} }}. $

$ {\rm{NMAE}}=\frac{{n^{ - 1}}\displaystyle\sum _{i=1}^{n}|{y}_{i}-{y}_{i}^{*}|}{\mathrm{max}\left({y}_{i}\right)-\mathrm{m}\mathrm{i}\mathrm{n}\left({y}_{i}\right)} . $

$ {R^2} = \frac{{\displaystyle\sum\nolimits_{i = 1}^n {{{(y_i^* - {{\bar y}_i})}^2}} }}{{\displaystyle\sum\nolimits_{i = 1}^n {{{({y_i} - {{\bar y}_i})}^2}} }} . $

式中: $ {y}_{i} $为实际积灰程度, $ {y}_{i}^{*} $为积灰程度的估计值, ${{{\bar y}_i}} $为实际积灰程度的平均值, $ n $为数据量. MSE、MRE、RMSE、NMSE和NMAE是衡量误差的不同指标. 这些指标越小,表示估计结果越准确. R2表示拟合效果,通常被作为选择不同模型的标准. R2小于1,越接近1,表示变量的解释能力越强,即模型对数据的拟合越好.

3.3.2. 结果分析

利用积灰监测结果进行应用的时间单位一般为1 d. 对预处理后的数据集以1 h为单位进行估计,每日的积灰程度取当天各小时结果的平均值. 各诊断方法的性能表现如表3所示. 在这些方法中,基于理论公式的方法的估计误差与其他方法的估计误差均在不同的数量级上. 该方法的准确性较低,且诊断结果中有许多负值. 一般来说,实验系统的积灰情况不算严重. 用标准情况下的公式计算系统的理想发电量是比较困难的,容易出现较大的误差.考虑到该方法的性能过差,不对相应结果进行对比分析.

表 3   积灰诊断结果评价

Tab.3  Evaluation of dust diagnostic results

方法 训练数据占比/% MSE/10−5 MRE/10−4 RMSE/10−2 NMSE NMAE R2
理论公式法 79.241 4.812 8.902 84.112 −83.112 −83.112
FNN 40 1.237 0.653 1.112 1.313 0.242 −0.313
FNN 60 1.102 0.683 1.050 1.170 0.240 −0.170
FNN 80 0.992 0.658 0.996 1.053 0.217 −0.053
SVR 40 0.992 0.617 0.996 1.053 0.215 −0.053
SVR 60 0.911 0.549 0.954 0.966 0.200 0.034
SVR 80 0.839 0.568 0.916 0.890 0.197 0.110
RF 40 1.125 0.669 1.061 1.194 0.232 −0.194
RF 60 1.102 0.577 1.050 1.170 0.236 −0.170
RF 80 0.880 0.485 0.938 0.934 0.200 0.066
原始SBM 1.735 0.550 1.324 1.861 0.266 −0.861
改进型SBM 0.412 0.339 0.642 0.437 0.130 0.053

新窗口打开| 下载CSV


对于3种有监督的机器学习方法,对训练数据的影响进行分析. 不同训练与测试数据划分下的诊断结果如图8~10所示. 结果评价通过雷达图显示在图11中. 雷达图可以显示指标较多时不同方法的性能对比效果. 结果表明,无论用哪个指标来评估,FNN、SVR和RF的性能都随着训练数据的可用性增加而提高. 为了简明起见,只对性能最好的FNN、SVR和RF,即训练数据为80%的情况下,与原始和改进型SBM进行比较.

图 8

图 8   FNN积灰诊断结果

Fig.8   Diagnostic results of FNN


图 9

图 9   SVR积灰诊断结果

Fig.9   Diagnostic results of SVR


图 10

图 10   RF积灰诊断结果

Fig.10   Diagnostic results of RF


改进型SBM方法、原始SBM方法、FNN、SVR和RF的诊断结果如图12所示. 这些方法的评估指标结果如图13所示. 结果表明,FNN、SVR和RF的主要问题是对取值较大和较小样本的估计精度较低. 它们的估计值与实际情况相比过于稳定,无法很好地监测较大的波动. 原始的SBM方法具有匹配较大和较小值的能力. 波动过大,导致评价指标不理想. 利用提出的改进型SBM方法解决了波动大的问题,保持了对较大值和较小值的拟合能力. 实现效果提升的原因主要有以下几点. 1)由于分类状态矩阵的构造,每个子矩阵对正常工况的代表性更有针对性. 2)提出的标准化欧氏距离有助于对异常数据对应的正常情况进行估计. 从如图14所示的R2评价结果可以看出,原始SBM方法和FNN方法的拟合结果较差. 在训练数据充足的情况下,RF和SVR可以实现更好的性能,改进型SBM方法在所有测试方法中的表现最好. 根据使用的评价指标结果可知,在诊断准确性方面,这6种方法的效果排名为:改进型SBM、SVR、RF、FNN、原始SBM、理论公式方法.

图 11

图 11   FNN、SVR、RF积灰诊断结果的评价

Fig.11   Evaluation results for dust deposition of FNN, SVR, and RF


图 12

图 12   各方法积灰诊断结果的对比

Fig.12   Comparision of dust diagnostic results of all methods


图 13

图 13   各方法积灰诊断结果的评价指标

Fig.13   Evaluation results for dust deposition of all methods


图 14

图 14   各方法积灰诊断结果的评价指标:R2

Fig.14   Evaluation results for dust deposition of all methods: R2


对上述各方法的响应速度进行分析对比,测试环境为普通个人笔记本电脑,处理器为Intel(R)Core(TM)i5-7300U, CPU 2.60 GHz,4 GB RAM. 编程语言均使用python,编译器均为jupyter notebook. 各方法对输入数据的平均响应时间tr表4所示. 利用理论公式法直接根据参数进行简单计算可以得到结果,响应时间可以忽略不计,故表4中没有列出.

表 4   各方法的响应时间

Tab.4  Response time of methods

诊断方法 tr/ms 诊断方法 tr/ms
FNN 8.45 原始SBM 103
SVR 2.38 改进型SBM 10.75
RF 3.79

新窗口打开| 下载CSV


表4可以看出,原始SBM方法和改进型SBM方法均需要比3种机器学习方法更长的响应时间,这一点是此类依赖矩阵计算方法的弱项. 与原始SBM方法相比,改进型方法将反应时间降低了一个数量级,可以达到与机器学习方法相同的数量级. 响应时间得以明显缩短的原因主要是分类状态矩阵的构建,使得输入向量可以只与最相关的矩阵数据进行相似性计算,大幅减低计算量,以缩短算法响应时间. 虽然响应速度比几种机器学习方法慢一些,但在可接受的范围内,可以满足在线应用的需求.

4. 结 语

本文研究光伏系统的积灰状态监测问题,提出弱监督的数据驱动方法:改进型SBM方法. 在传统的SBM方法基础上改进参数选择、状态矩阵构造、相似性算子设计、状态矩阵更新等步骤,提高了诊断精度和响应速度.

基于清洁–积灰对比实验系统的真实运行数据,对比基于理论公式的方法、3种有监督的机器学习方法(FNN、SVR、RF)、原始SBM方法及改进型SBM方法等6种方法的积灰监测效果. 结果表明,改进型SBM方法可以以可接受的响应速度劣势,实现最佳的积灰程度监测准确性.

在未来的研究中,可以关注SBM算法计算效率的问题,考虑通过状态矩阵构建和相似性计算的进一步优化来提高算法响应速度. 考虑将积灰程度监测的问题扩展成积灰程度的预测问题,结合光伏发电功率预测对清洗计划进行优化决策.

参考文献

WANG Z, XU Z, ZHANG Y, et al

Optimal cleaning scheduling for photovoltaic systems in the field based on electricity generation and dust deposition forecasting

[J]. IEEE Journal of Photovoltaics, 2020, 10 (4): 1126- 1132

DOI:10.1109/JPHOTOV.2020.2981810      [本文引用: 1]

KAZEM H A, CHAICHAN M T

Experimental analysis of the effect of dust’s physical properties on photovoltaic modules in Northern Oman

[J]. Solar Energy, 2016, 139: 68- 80

DOI:10.1016/j.solener.2016.09.019      [本文引用: 1]

SCHILL C, BRACHMANN S, KOEHL M

Impact of soiling on IV-curves and efficiency of PV-modules

[J]. Solar Energy, 2015, 112: 259- 262

DOI:10.1016/j.solener.2014.12.003      [本文引用: 1]

赵波, 张姝伟, 曹生现, 等

基于状态监测的电池板积灰清洗周期确定与费用评估

[J]. 中国电机工程学报, 2019, 39 (14): 4205- 4213

[本文引用: 1]

ZHAO Bo, ZHANG Shu-wei, CAO Sheng-xian, et al

Cleaning cycle determination and cost estimation for photovoltaic modules based on dust accumulating condition monitoring

[J]. Proceedings of the Chinese Society for Electrical Engineering, 2019, 39 (14): 4205- 4213

[本文引用: 1]

MATTEI M, NOTTON G, CRISTOFARI C, et al

Calculation of the polycrystalline PV module temperature using a simple method of energy balance

[J]. Renewable Energy, 2006, 31 (4): 553- 567

DOI:10.1016/j.renene.2005.03.010      [本文引用: 2]

ZAPATA J W, PEREZ M A, KOURO S, et al

Design of a cleaning program for a pv plant based on analysis of energy losses

[J]. IEEE Journal of Photovoltaics, 2015, 5 (6): 1748- 1756

DOI:10.1109/JPHOTOV.2015.2478069      [本文引用: 2]

ARANEO R, GRASSELLI U, CELOZZI S

Assessment of a practical model to estimate the cell temperature of a photovoltaic module

[J]. International Journal of Energy and Environmental Engineering, 2014, 5 (72): 1- 16

[本文引用: 1]

RAMLI M A M, PRASETYONO E, WICAKSANA R W, et al

On the investigation of photovoltaic output power reduction due to dust accumulation and weather conditions

[J]. Renewable Energy, 2016, 99: 836- 844

DOI:10.1016/j.renene.2016.07.063      [本文引用: 1]

张姝伟. 基于视觉的光伏板积灰状态监测与性能评估[D]. 吉林: 东北电力大学, 2019.

[本文引用: 1]

ZHANG Shu-wei. Vision-based monitoring and performance evaluation of photovoltaic panel dust deposition [D]. Jilin: Northeast Electric Power University, 2019.

[本文引用: 1]

YANG M, JI J, GUO B

Soiling quantification using an image-based method: effects of imaging conditions

[J]. IEEE Journal of Photovoltaics, 2020, 10 (6): 1780- 1787

DOI:10.1109/JPHOTOV.2020.3018257      [本文引用: 1]

SIMONAZZI M, CHIORBOLI G, COVA P, et al

Smart soiling sensor for PV modules

[J]. Microelectronics Reliability, 2020, 114: 113789

DOI:10.1016/j.microrel.2020.113789      [本文引用: 1]

PULIPAKA S, MANI F, KUMAR R

Modeling of soiled PV module with neural networks and regression using particle size composition

[J]. Solar Energy, 2016, 123: 116- 126

DOI:10.1016/j.solener.2015.11.012      [本文引用: 1]

PULIPAKA S, KUMAR R

Power prediction of soiled PV module with neural networks using hybrid data clustering and division techniques

[J]. Solar Energy, 2016, 133: 485- 500

DOI:10.1016/j.solener.2016.04.004     

HEINRICH M, MEUNIER S, SAMÉ A, et al

Detection of cleaning interventions on photovoltaic modules with machine learning

[J]. Applied Energy, 2020, 263: 114642

DOI:10.1016/j.apenergy.2020.114642      [本文引用: 1]

SINGER R M, GROSS K C, HERZOG J P, et al. Model-based nuclear power plant monitoring and fault detection: theoretical foundations [R]. Lemont: Argonne National Lab. , IL, 1997.

[本文引用: 1]

GERTLER J. Fault detection and diagnosis in engineering systems [M]. New York: CRC Press, 1998.

[本文引用: 1]

WEGERICH S W. Similarity based modeling of time synchronous averaged vibration signals for machinery health monitoring [C]// Proceedings of 2004 IEEE Aerospace Conference. Big Sky: IEEE, 2004: 3654–3662.

[本文引用: 2]

WEGERICH S

Similarity-based modeling of vibration features for fault detection and identification

[J]. Sensor Review, 2005, 25: 114- 122

DOI:10.1108/02602280510585691      [本文引用: 2]

国家市场监督管理总局. 光伏发电效率技术规范: GB/T 39857–2021 [S]. 北京: 中国标准出版社, 2021.

[本文引用: 1]

ZHU J, CHEN N, PENG W

Estimation of bearing remaining useful life based on multiscale convolutional neural network

[J]. IEEE Transactions on Industrial Electronics, 2018, 66 (4): 3208- 3216

[本文引用: 1]

MOHAMMADI B, MEHDIZADEH S

Modeling daily reference evapotranspiration via a novel approach based on support vector regression coupled with whale optimization algorithm

[J]. Agricultural Water Management, 2020, 237: 106145

DOI:10.1016/j.agwat.2020.106145      [本文引用: 1]

NHU V H, SHIZADI A, SHAHABI H, et al

Shallow landslide susceptibility mapping by random forest base classifier and its ensembles in a semi-arid region of Iran

[J]. Forests, 2020, 11 (4): 421

DOI:10.3390/f11040421      [本文引用: 1]

/