浙江大学学报(工学版), 2021, 55(10): 1856-1866 doi: 10.3785/j.issn.1008-973X.2021.10.007

计算机技术

面向工业平稳/非平稳复杂系统的在线故障监测技术

孔祥玉,, 王晓兵, 李红增, 罗家宇

火箭军工程大学 导弹工程学院,陕西 西安 710000

On-line fault monitoring technology for industrial stationary/nonstationary complex system

KONG Xiang-yu,, WANG Xiao-bing, LI Hong-zeng, LUO Jia-yu

Department of Missile Engineering, Rocket Force University of Engineering, Xi’an 710000, China

收稿日期: 2021-01-23  

基金资助: 国家自然科学基金资助项目(61673387,61833016);陕西省自然科学基金资助项目(2020JM-356)

Received: 2021-01-23  

Fund supported: 国家自然科学基金资助项目(61673387,61833016);陕西省自然科学基金资助项目(2020JM-356)

作者简介 About authors

孔祥玉(1967—),男,教授,从事复杂系统故障诊断研究.orcid.org/0000-0003-2084-7826.E-mail:xiangyukong@126.com , E-mail:xiangyukong@126.com

摘要

针对复杂系统中关键性能指标(KPI)相关故障检测方法检测精度低的问题,提出基于双层改进潜结构投影(DL-IPLS)的KPI相关故障检测方法. 利用协整分析和主元分析建立底层模型,对非平稳和平稳变量进行特征提取. 将提取的信息进行融合,建立改进潜结构投影的上层模型,根据融合信息对KPI的贡献进行空间分解. 在2个正交子空间中设计统计量,实现KPI相关故障的在线监测. 田纳西-伊斯曼过程和青霉素发酵过程的仿真结果表明,在面向工业平稳和非平稳复杂工业系统检测时,所提方法有效提高了KPI相关故障的检测率,降低了KPI无关故障的误报率.

关键词: 数据驱动 ; 协整分析 ; 改进潜结构投影 ; 关键性能指标 ; 过程监控 ; 故障检测

Abstract

A KPI related fault detection method based on double-layer improved projection to latent structures (DL-IPLS) was proposed in view of the low detection accuracy of key performance indicators (KPI) related fault detection methods in complex systems. The underlying model was established by using cointegration analysis and principal component analysis in order to extract the features of non-stationary and stationary variables. Then the extracted information was fused to establish the upper model of improved projection to latent structures. Statistics were designed in two orthogonal subspaces to realize on-line monitoring of KPI related faults. The simulation results of Tennessee-Eastman process and penicillin fermentation process show that the proposed method can effectively improve the detection rate of KPI related faults for industrial stationary and non-stationary complex industrial systems, and reduce the false alarm rate of KPI independent fault.

Keywords: data driven ; cointegration analysis ; improved projection to latent structures ; key performance indicator ; process monitoring ; fault detection

PDF (1586KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

孔祥玉, 王晓兵, 李红增, 罗家宇. 面向工业平稳/非平稳复杂系统的在线故障监测技术. 浙江大学学报(工学版)[J], 2021, 55(10): 1856-1866 doi:10.3785/j.issn.1008-973X.2021.10.007

KONG Xiang-yu, WANG Xiao-bing, LI Hong-zeng, LUO Jia-yu. On-line fault monitoring technology for industrial stationary/nonstationary complex system. Journal of Zhejiang University(Engineering Science)[J], 2021, 55(10): 1856-1866 doi:10.3785/j.issn.1008-973X.2021.10.007

随着现代工业规模的不断提高及分布式控制系统和存储技术的快速发展,数据驱动的方法在过程控制和监控领域得到了广泛的应用. 其中主成分分析(principal component analysis,PCA)[1-2]、独立成分分析 [3-4]、潜结构投影(projection to latent structures,PLS)[5-7]等是较典型的数据驱动分析方法.

PLS算法通过建立测量值与KPI之间的回归关系,将测量值分解为主元空间和残差空间. Li等[8]指出PLS在空间分解过程中存在局限性. Zhou等[9]提出全潜结构投影算法,将得分和负载矩阵进一步分解. Qin等[10]提出并行潜结构投影算法,将分解过程分为输入相关和输出相关. Yin等[11]提出改进的潜结构投影(modified projection to latent structures,MPLS)算法,将输入 ${\boldsymbol{X}}$正交投影到2个子空间. Yin等[12]提出新的改进潜结构投影(improved projection to latent structures,IPLS)算法,根据测量值对KPI的贡献进行空间分解. Wang等[13]提出结合正交信号校正和MPLS(orthogonal signal correction and modified-PLS,OSC-MPLS)的检测方法.

受设备的老化、正常计划的调整、外部扰动等因素的影响,工业过程中的变量往往呈现非平稳特性[14],故障信息很容易被非平稳的变化趋势所掩盖. Chen等[15]将协整分析(cointegration analysis,CA)的思想引入到过程监测领域. 近年来,Sun等[16]提出基于CA的稀疏重构策略. Zhao等[17]提出基于CA和慢特征分析的全状态监测方法. 协整理论能够结合时间序列中短期和长期模型的优点[18]. 以往的研究虽然考虑了非平稳特性,但未建立过程信息与KPI之间的关系,将会丢失一些与质量相关的关键信息,而这些信息的丢失会造成过程监控失效[19].

本文提出基于双层改进潜结构投影(double-level improved projection to latent structures,DL-IPLS)的故障检测方法. 在底层模型中,建立CA模型和PCA模型. 将CA模型中的平稳残差序列与PCA模型中的主元信息进行融合. 针对融合信息建立IPLS模型,根据过程信息在KPI相关空间和KPI无关空间设计统计量,实现在线监测. 本文的贡献总结如下:1)面向平稳/非平稳复杂工业过程,提出基于双层改进潜结构投影的KPI相关故障检测方法. 2)所提方法能够综合考虑系统中平稳和非平稳变量的特征信息,建立正交的KPI相关的监测模型,有效提高了故障检测的性能.

1. CA和PLS概述

1.1. CA概述

非平稳变量间存在共同的随机趋势,为了简单描述,考虑2个随机向量的情况[15]

${{\boldsymbol{z}}_1}= {{\boldsymbol{w}}_1} + {{{\bf\textit{φ}}} _1} ,$

${{\boldsymbol{z}}_2} = {{\boldsymbol{w}}_2} + {{\bf\textit{φ}} _2}.$

式中: ${{\boldsymbol{w}}_i}$为非平稳向量, ${{\bf\textit{φ}} _i}$为平稳向量. 若这些向量是协整的,则存在一组参数 $\;{{\boldsymbol{\beta}} _1}$$\;{{\boldsymbol{\beta }}_2}$,使得 $\;{{\boldsymbol{\beta}} _1}{{\boldsymbol{z}}_1} + {{\boldsymbol{\beta}} _2}{{\boldsymbol{z}}_2}$为平稳随机序列.

$\begin{split} {{\boldsymbol{\beta }}_1}{{\boldsymbol{z}}_1} + {{\boldsymbol{\beta}} _2}{{\boldsymbol{z}}_2}\;{\rm{ = }}\;&{{\boldsymbol{\beta}} _1}\left( {{{\boldsymbol{w}}_1} + {{\bf\textit{φ}} _1}} \right) + {{\boldsymbol{\beta}} _2}\left( {{{\boldsymbol{w}}_2} + {{\bf\textit{φ}} _2}} \right) =\\ & \left( {{{\boldsymbol{\beta}} _1}{{\boldsymbol{w}}_1} + {{\boldsymbol{\beta}} _2}{{\boldsymbol{w}}_2}} \right) + \left( {{{\boldsymbol{\beta}} _1}{{\bf\textit{φ}} _1} + {{\boldsymbol{\beta}} _2}{{\bf\textit{φ}} _2}} \right). \end{split} $

$\;{{\boldsymbol{\beta}} _1}{{\boldsymbol{z}}_1} + {{\boldsymbol{\beta }}_2}{{\boldsymbol{z}}_2} = 0$$\;{{\boldsymbol{\beta}} _1}{{\boldsymbol{z}}_1} = - {{\boldsymbol{\beta}} _2}{{\boldsymbol{z}}_2}$时, $\;{{\boldsymbol{\beta}} _1}{{\boldsymbol{z}}_1} + {{\boldsymbol{\beta}} _2}{{\boldsymbol{z}}_2}$为平稳的序列. 这意味着 ${{\boldsymbol{w}}_1}$${{\boldsymbol{w}}_2}$的非平稳趋势间存在比例系数 $ - {{{{\boldsymbol{\beta}} _2}} / {{{\boldsymbol{\beta}} _1}}}$. 参数必须从线性组合中清除趋势,因此,如果2个随机向量 ${{\boldsymbol{z}}_1}$${{\boldsymbol{z}}_2}$协整,必然有共同的随机趋势,共同趋势可以是确定性的,也可以是随机的.

在实际应用中,时间序列可能复杂得多. 若一个非平稳时间向量 ${{\boldsymbol{w }}_t}$经过 $d$次差分后变为平稳时间向量,则该时间序列即为d阶单整,记为 ${{\boldsymbol{w}} _t} \sim I\left( d \right)$. 如果时间序列 ${{\boldsymbol{z}}_t} = {\left[ {{{\boldsymbol{z}}_1},{{\boldsymbol{z}}_2}, \cdots ,{{\boldsymbol{z}}_n}} \right]^{\rm{T}}} \in {{\bf{R}}^n}$具有长期均衡关系 (其中 $n$为非平稳时间序列的个数),那么非平稳变量的线性组合可以有如下描述[16]

${{\gamma }} = {{\boldsymbol{\beta }}_1}{{\boldsymbol{z}}_1} + {{\boldsymbol{\beta }}_2}{{\boldsymbol{z}}_2} + \cdots + {{\boldsymbol{\beta }}_n}{{\boldsymbol{z}}_n}.$

式中: $\;{{\boldsymbol{\beta }}^{\rm T}}{\rm{ = }}\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{\beta }}_1}},\;{{{\boldsymbol{\beta }}_2}},\;\cdots,\;{{{\boldsymbol{\beta }}_n}} \end{array}} \right]$为协整向量, ${{\gamma }}$为均衡的残差.

Johansen等[20]提出基于向量自回归模型(vector autoregressive,VAR)的方法,用于求取CA模型中的协整向量. 给定一组非平稳时间序列 ${\boldsymbol{X}}(n \times {n_{\rm{s}}}) = $ $ \left[ {{{\boldsymbol{x}}_1},{{\boldsymbol{x}}_2}, \cdots ,{{\boldsymbol{x}}_{{n_{\rm{s}}}}}} \right]$,其中 $n$为样本个数, ${n_{\rm{s}}}$为非平稳变量个数. 假设所有时间序列为同阶单整 ${{\boldsymbol{x}}_t} \sim I\left( 1 \right)$,可以建立如式(5)形式的VAR模型[21]

${{\boldsymbol{x}}_t} = {{\boldsymbol{\varPi }}_1}{{\boldsymbol{x}}_{t - 1}} + \cdots + {{\boldsymbol{\varPi }}_p}{{\boldsymbol{x}}_{t - p}} + {\boldsymbol{c}} + {{\boldsymbol{\mu }}_t}.$

式中: ${{\boldsymbol{\varPi }}_i}$为系数矩阵; ${\boldsymbol{c}}$为常数向量; $p$为VAR模型的阶次; ${{\boldsymbol{\mu }}_t}$为白噪声向量,服从高斯分布 $N\left( {0,{\boldsymbol{\varXi }}} \right)$.

在式(5)两端减去 ${{\boldsymbol{x}}_{{{t}} - 1}}$,该过程消除了常数向量,得到矢量误差纠正模型:

$\Delta {{\boldsymbol{x}}_t} = \sum\limits_{i = 1}^{p - 1} {{{\boldsymbol{\varOmega }}_i}} \Delta {{\boldsymbol{x}}_{t - i}} + {\boldsymbol{\varGamma }}{{\boldsymbol{x}}_{t - 1}} + {{\boldsymbol{\mu }}_t}.$

式中:

其中 $I_m $为随机矩阵. ${\boldsymbol{\varGamma }}$可以分解为A$\;{\boldsymbol{\beta }}$2个列满秩矩阵: ${\boldsymbol{\varGamma }} = {\boldsymbol{A}}{{\boldsymbol{\beta }}^{\rm T}}$. 其中, ${\boldsymbol{A}} \in {{\bf{R}}^{{n_{\rm{s}}} \times r}}$$\;{\boldsymbol{\beta }} \in {{\bf{R}}^{{n_{\rm{s}}} \times r}}$.

式(6)可以转化为

$\Delta {{\boldsymbol{x}}_t} = \sum\limits_{i = 1}^{p - 1} {{{\boldsymbol{\varOmega }}_i}} \Delta {{\boldsymbol{x}}_{t - i}} + {\boldsymbol{A}}{{\boldsymbol{\beta }}^{\rm T}}{{\boldsymbol{x}}_{t - 1}} + {{\boldsymbol{\mu }}_t}.$

$\;{\boldsymbol{\beta }}$的列向量为协整向量,通过 $\;{\boldsymbol{\beta }}$的向量与过程变量数据的乘积可以得到平稳的潜在的特征向量. 协整向量可以通过求解以下似然函数[20]得到:

$\begin{split} & L\left( {{{\boldsymbol{\varOmega }}_1}, \cdots, {{\boldsymbol{\varOmega }}_{p - 1}},{\boldsymbol{A}},\;{\boldsymbol{\beta }},\;{\boldsymbol{\varXi }}} \right)= \\ & - \frac{{n \times n_{\rm{s}}}}{2}\ln\; (2{\text{π}} ) - \frac{n}{2}\ln \left| {\boldsymbol{\varXi }} \right| - \frac{1}{2}\sum\limits_{t = 1}^n {{\boldsymbol{\mu }}_t^{\rm T}{{\boldsymbol{\varXi }}^{ - 1}}} {{\boldsymbol{\mu }}_t}. \end{split} $

$\;{\boldsymbol{\beta }}$通过极大似然函数 $L$估计出. Johansen等[20]证明了通过求取式(9)的特征向量矩阵,可以得到所求的协整向量 $\;{\boldsymbol{\beta }}$

$\left| {{\boldsymbol{\lambda }}{{\boldsymbol{S}}_{11}} - {{\boldsymbol{S}}_{10}}{\boldsymbol{S}}_{00}^{ - 1}{{\boldsymbol{S}}_{01}}} \right| = 0.$

式中: ${{\boldsymbol{S}}_{ij}} = {1 / \Big({n{{\boldsymbol{e}}_i}{\boldsymbol{e}}_i^{\rm T}}}\Big),\;i,j = 0,1$${{\boldsymbol{e}}_0} = \Delta {{\boldsymbol{x}}_t} - \displaystyle\sum\nolimits_{i = 1}^{p - 1} {{{\boldsymbol{\varTheta }}_i}} \Delta {{\boldsymbol{x}}_{t - i}}$${{\boldsymbol{e}}_1} = \Delta {{\boldsymbol{x}}_{t - 1}} - \displaystyle\sum\nolimits_{i = 1}^{p - 1} {{{\boldsymbol{\varPhi }}_i}} \Delta {{\boldsymbol{x}}_{t - i}}$,通过最小二乘方法估计系数矩阵 ${{\boldsymbol{\varTheta }}_i}$${{\boldsymbol{\varPhi }}_i}$[20].

利用式(9)可以求出特征向量矩阵,协整向量包含在特征向量矩阵中. 根据Johansen等[20]提出的检验方法确定协整向量的个数为 $r(1 \leqslant r \leqslant n_{\rm{s}} - 1)$,获得协整向量矩阵为 $\;{\boldsymbol{\beta }} = \left[ {{{\boldsymbol{\beta }}_1},{{\boldsymbol{\beta }}_2}, \cdots ,{{\boldsymbol{\beta }}_r}} \right] \in {{\boldsymbol{R}}^{n_{\rm{s}} \times r}}$,得到残差向量 ${{\boldsymbol{\gamma}} _{ti}}$

${{\boldsymbol{\gamma }}_{ti}} = {\boldsymbol{\beta }}_i^{\rm{T}}{{\boldsymbol{x}}_t} = {{\boldsymbol{\beta }}_{i1}}{{\boldsymbol{x}}_1} + {{\boldsymbol{\beta }}_{i2}}{{\boldsymbol{x}}_2} + \cdots + {{\boldsymbol{\beta }}_{in_{\rm{s}}}}{{\boldsymbol{x}}_{n_{\rm{s}}}};\;i = 1, \cdots ,r.$

式(10)为协整模型. 根据协整理论可知,当非平稳变量经过协整分析后,可以有效提取非平稳变量间的长期均衡关系,同时能够去除噪声因素对模型的影响. CA模型更详细的介绍参见文献[22,23].

1.2. PLS概述

给出 ${\boldsymbol{U}} \in {{\bf{R}}^{n \times l}}$包含 $n$个样本和 $l$个输入变量, ${\boldsymbol{Y}} \in $ $ {{\bf{R}}^{n \times m}}$包含 $m$个KPI变量. PLS将数据投影到由少数潜变量( ${{\boldsymbol{t}}_1}, \cdots ,{{\boldsymbol{t}}_A}$$A$为PLS主元的个数)构成的低维空间中[9]

$\left. \begin{array}{l} {\boldsymbol{U}} = {\boldsymbol{T}}{{\boldsymbol{P}}^{\rm T}} + {\boldsymbol{E}} = {\hat{\boldsymbol U}} + {\boldsymbol{E}}, \\ {\boldsymbol{Y}} = {\boldsymbol{T}}{{\boldsymbol{Q}}^{\rm T}} + {\boldsymbol{F}} = {\boldsymbol{UM}} + {\boldsymbol{F}}. \\ \end{array} \right\}$

式中:T为得分矩阵, ${\boldsymbol{T}} = \left[ {{{\boldsymbol{t}}_1}, \cdots ,{{\boldsymbol{t}}_A}} \right]$P为针对 ${\boldsymbol{U}}$的负载矩阵, ${\boldsymbol{P}} = \left[ {{{\boldsymbol{p}}_1}, \cdots ,{{\boldsymbol{p}}_A}} \right]$Q为针对Y的负载矩阵, ${\boldsymbol{Q}} = \left[ {{{\boldsymbol{q}}_1}, \cdots ,{{\boldsymbol{q}}_A}} \right]$M为回归系数矩阵, ${\boldsymbol{M}} \in {{\bf{R}}^{l \times m}}$${\boldsymbol{E}}$${\boldsymbol{F}}$分别为 ${\boldsymbol{U}}$${\boldsymbol{Y}}$的建模误差.

在代数方面,PLS可以用迭代算法[13],总结如下.

1)对 ${\boldsymbol{U}}$${\boldsymbol{Y}}$进行标准化处理.

2)执行以下迭代步骤, $i = 1, \cdots ,A$

式中: $A$由交叉验证确定, ${\boldsymbol{w}}_i^ * $${\boldsymbol{q}}_i^ * $分别为权重向量.

3)得到 ${\boldsymbol{P}}、{\boldsymbol{Q}}、{\boldsymbol{T}}、{\boldsymbol{R}}$.

利用 ${{{T}}^2}$${{{\rm{SPE}}}}$统计量进行主成分空间和残差空间的监测.

${{{T}}^2} = {{\boldsymbol{u}}^{\rm T}}{\boldsymbol{R}}{\left( {\frac{{{{\boldsymbol{T}}^{\rm T}}{\boldsymbol{T}}}}{{n - 1}}} \right)^{ - 1}}{{\boldsymbol{R}}^{\rm T}}{\boldsymbol{u}} \sim \frac{{A\left( {{n^2} - 1} \right)}}{{n\left( {n - A} \right)}}{{{F}}_\alpha }\left( {A,n - A} \right).$

${{{\rm{SPE}}}} = {\left\| {\left( {{\boldsymbol{I}} - {\boldsymbol{P}}{{\boldsymbol{R}}^{\rm T}}} \right){\boldsymbol{u}}} \right\|^2} \sim g\chi _{\alpha ,\partial }^2.$

式中: ${{F}}\left( {A,n - A} \right)$ 表示F分布, $\alpha $ 为显著性水平, $A$ 为有显著意义的自由度. $g\chi _{\alpha ,\partial }^2$${\chi ^2}$分布, $g = {S / \mu }$$\partial = {{2{\mu ^2}} / S}$,其中 $S$$\;\mu $分别为 ${{{\rm{SPE}}}}$的均值和方差.

2. 基于DL-IPLS的KPI相关故障监测技术

复杂工业过程往往具有平稳/非平稳的混杂特性,在模型建立前将平稳和非平稳变量分离开. 两者具有不同的特性,所以对两者采用不同的特征提取策略,以提取最有效的特征信息.

利用Augmented Dickey-Fuller(ADF)[24]检验,将过程变量分为非平稳变量和平稳变量,记为

$\left. \begin{array}{l} {{\boldsymbol{U}}_{{n_{\rm{s}}}}} = \left[ {{{\boldsymbol{u}}_{{n_{\rm{s}}},1}},{{\boldsymbol{u}}_{{n_{\rm{s}}},2}}, \cdots ,{{\boldsymbol{u}}_{{{{n}}_{\rm{s}}},v}}} \right] \in {{\bf{R}}^{n \times v}}, \\ {{\boldsymbol{U}}_{\rm{s}}} = \left[ {{{\boldsymbol{u}}_{{\rm{s}},1}},{{\boldsymbol{u}}_{{\rm{s}},2}}, \cdots ,{{\boldsymbol{u}}_{{\rm{s}},h}}} \right] \in {{\bf{R}}^{n \times h}}. \\ \end{array} \right\}$

式中: ${{\boldsymbol{U}}_{{n_{\rm{s}}}}}$为非平稳矩阵, $n$为样本数, $v$为非平稳变量的个数, ${{\boldsymbol{U}}_{\rm{s}}}$为平稳矩阵, $h$为平稳变量的个数.

2.1. 底层建模

对于选择出来的 ${{\boldsymbol{U}}_{{n_{\rm{s}}}}}$,根据协整理论[16]建立CA模型,如下式所示:

${{\boldsymbol{\gamma }}_{{n_{\rm{s}}}}} = {{\boldsymbol{U}}_{{n_{\rm{s}}}}}{\boldsymbol{\beta}} {\rm{.}}$

式中: $\;{\boldsymbol{\beta}} \in {{\bf{R}}^{v \times r}}$为协整矩阵; $r$为协整向量的个数; ${{\boldsymbol{\gamma }}_{{n_{\rm{s}}}}} = \left[ {{{\boldsymbol{\gamma }}_{{n_{\rm{s}}}{\rm{,1}}}},{{\boldsymbol{\gamma }}_{{n_{\rm{s}}}{\rm{,2}}}}, \cdots ,{{\boldsymbol{\gamma }}_{{n_{\rm{s}}}{\rm{,}}r}}} \right] \in {{\bf{R}}^{n \times r}}$为非平稳变量经过CA模型提取出的平稳残差矩阵,用于描述非平稳变量间的长期均衡关系.

对于选择出来的平稳变量,采用PCA提取 ${{\boldsymbol{U}}_{\rm{s}}}$中的特征信息,在建立PCA模型前对平稳变量进行标准化处理,剔除变量量纲对模型精度的影响.

${\tilde u_{i,j}} = \frac{{{{\tilde u}_{i,j}} - {{\bar u}_j}}}{{{s_j}}}(i = 1, \cdots ,n;\;j = 1, \cdots ,h).$

式中: $i$为样本的索引, $j$为变量的索引, ${\bar u_j}$${s_j}$分别为 ${{\boldsymbol{u}}_j}$的均值和标准差. 为了方便表示,对于标准化后的平稳变量,用 ${{\boldsymbol{U}}_{\rm{s}}}$表示.

将平稳变量进行数据的压缩和特征信息的提取,建立 ${{\boldsymbol{U}}_{\rm{s}}}$的PCA模型[14]

$ \left. \begin{array}{l} {{\boldsymbol{U}}_{\rm{s}}}{\rm{ = }}{{\boldsymbol{T}}_{\rm{s}}}{\boldsymbol{P}}_{\rm{s}}^{\rm T}{\rm{ + }}{{\boldsymbol{E}}_{\rm{s}}}, \\ {{\boldsymbol{T}}_{\rm{s}}} = {{\boldsymbol{U}}_{\rm{s}}}{{\boldsymbol{P}}_{\rm{s}}}. \\ \end{array} \right\} $

式中: ${{\boldsymbol{P}}_{\rm{s}}} \in {{\bf{R}}^{h \times A}}$为负载矩阵, ${{\boldsymbol{T}}_{\rm{s}}} \in {{\bf{R}}^{n \times A}}$为得分矩阵, ${{\boldsymbol{T}}_{\rm{s}}}$的各列称为主元变量, $A$为主元的个数, ${{\boldsymbol{E}}_{\rm{s}}}$为残差矩阵.

底层建模的目的是有效提取过程变量的有效信息. 根据CA模型提取非平稳变量间的长期均衡关系,有效避免了故障信号被非平稳趋势掩盖,消除非平稳变量的变化趋势对变量信息的影响,即环境和运行条件所导致的趋势. 根据PCA模型提取平稳变量的主元信息,消除平稳变量中噪声因素对故障检测的影响.

2.2. 上层建模

将底层中CA模型和PCA模型提取的特征信息进行融合,得到新的数据矩阵:

${\boldsymbol{X}} = \left[ {{{\boldsymbol{\gamma }}_{{n_{\rm{s}}}}},{{\boldsymbol{T}}_{\rm{s}}}} \right].$

对于复杂的工业过程,过程信息总是显示出与KPI的相关关系. IPLS算法[12]是在PLS的基础上提出的,具有空间分解清晰且高效的优势,具有较好的KPI相关故障检测性能.

根据IPLS模型的正交分解形式,建立 ${\boldsymbol{X}}$${\boldsymbol{Y}}$之间的关系模型[12]. 期望的分解形式表示为

$\left. \begin{array}{l} {\boldsymbol{X}} = {\hat{\boldsymbol X}} + {\tilde{\boldsymbol X}}, \\ {\boldsymbol{Y = \hat Y}} + {\boldsymbol{F}} = {\hat{\boldsymbol X}}{\boldsymbol{M}} + {\boldsymbol{F}}. \\ \end{array} \right\}$

式中: ${\boldsymbol{M}} \in {{\bf{R}}^{l \times m}}$为系数矩阵,由1.2节中PLS迭代过程得到; ${\hat{\boldsymbol X}}$${\tilde{\boldsymbol X}}$是正交的; ${\boldsymbol{F}}$为建模误差.

${\boldsymbol{M}}{{\boldsymbol{M}}^{\rm T}}$进行奇异值分解(singular value decomposition,SVD)[11]

${\boldsymbol{M}}{{\boldsymbol{M}}^{\rm T}} = \left[ {\begin{array}{*{20}{c}} {{{{\hat{\boldsymbol \varGamma }}}_{\rm{M}}}}&{{{{\tilde{\boldsymbol \varGamma }}}_{\rm{M}}}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{\varLambda }}_{\rm{M}}}}&{\boldsymbol{0}} \\ {\boldsymbol{0}}&{\boldsymbol{0}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {{\hat{\boldsymbol \varGamma }}_{\rm{M}}^{\rm T}} \\ {{\tilde{\boldsymbol \varGamma }}_{\rm{M}}^{\rm T}} \end{array}} \right].$

式中: ${{\hat{\boldsymbol \varGamma }}_{\rm{{\rm M}}}} \in {{\bf{R}}^{l \times m}}$${{\tilde{\boldsymbol \varGamma }}_{\rm{M}}} \in {{\bf{R}}^{l \times (l - m)}}$${{\boldsymbol{\varLambda }}_{\rm{M }}} \in {{\bf{R}}^{m \times m}}$.

构造正交投影矩阵 ${{\boldsymbol{\varPi }}_{\rm{M}}}$${\boldsymbol{\varPi }}_{\rm{M}}^ \bot $

$\left. \begin{array}{l} {{\boldsymbol{\varPi }}_{\rm{M}}} = {{{\hat{\boldsymbol \varGamma }}}_{\rm{M}}}{\hat{\boldsymbol \varGamma }}_{\rm{M}}^{\rm T} \in {{\bf{R}}^{l \times l}}, \\ {\boldsymbol{\varPi }}_{\rm{M}}^ \bot = {{{\tilde{\boldsymbol \varGamma }}}_{\rm{M}}}{\tilde{\boldsymbol \varGamma }}_{\rm{M}}^{\rm T} \in {{\bf{R}}^{l \times l}}. \\ \end{array} \right\}$

因此,可以将X分解为 $\hat {\boldsymbol{X}}$$\tilde {\boldsymbol{X}}$

${\hat{\boldsymbol T}}{\rm{ = }}{\boldsymbol{X}}{{\hat{\boldsymbol \varGamma }}_{\rm{M}}} \in {{\bf{R}}^{n \times m}},$

$ \tilde{{\boldsymbol T}}={\boldsymbol{X}}{\tilde{{\boldsymbol{\varGamma}} }}_{\rm{M}}\in {{\bf{R}}}^{n\times (l-m)}.$

$\hat {\boldsymbol{X}}{\rm{ = }}{\boldsymbol{X}}{{\boldsymbol{\varPi }}_{\rm{M}}}{\rm{ = }}{\hat{\boldsymbol { T}}}\hat {\boldsymbol{\varGamma}} _{\rm{M}}^{\rm{T}} \in {S _{{{\hat {\boldsymbol{X}}}}}} \equiv {\rm{span}}\left\{ {\boldsymbol{M}} \right\},$

$\tilde {\boldsymbol{X}}{\rm{ = }}{\boldsymbol{X}}{\boldsymbol{\varPi }}_{\rm{M}}^ \bot {\rm{ = }}{\tilde{\boldsymbol {T}}}\tilde {\boldsymbol{\varGamma}} _{\rm{M}}^{\rm{T}} \in {S _{{{\tilde {\boldsymbol{X}}}}}} \equiv {\rm{span}}\;{\left\{ {\boldsymbol{M}} \right\}^ \bot }.$

式中: $\hat {\boldsymbol{X}}$${\boldsymbol{Y}}$相关, $\tilde {\boldsymbol{X}}$${\boldsymbol{Y}}$无关, ${\hat{\boldsymbol { T}}}$${\tilde{\boldsymbol {T}}}$分别为 $\hat {\boldsymbol{X}}$$\tilde {\boldsymbol{X}}$的得分矩阵.

2.3. 在线故障监测

为了实现在线过程的监测,针对新采集的样本 ${{\boldsymbol{u}}_{{\rm{new}}}}$,根据离线建模过程ADF检验的分离结果将 ${{\boldsymbol{u}}_{{\rm{new}}}}$分解为平稳向量 ${{\boldsymbol{u}}_{{\rm{new,s}}}}$和非平稳向量 ${{\boldsymbol{u}}_{{\rm{new,}}{n_{\rm{s}}}}}$,建立融合数据:

${{\boldsymbol{x}}_{{\rm{new}}}} = \left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{\gamma }}_{{{{\rm new},{n_{\rm{s}}}}}}}}\;,\;{{{\boldsymbol{t}}_{{\rm{new,s}}}}} \end{array}} \right].$

式中: ${{\boldsymbol{\gamma}} _{{{{\rm new},{n_{\rm{s}}} }}}} = {{\boldsymbol{u}}_{{{{\rm new},{n_{\rm{s}}} }}}}{\boldsymbol{\beta }}$${{\boldsymbol{t}}_{{\rm{new }},{\rm{s}}}} = {{\boldsymbol{u}}_{{\rm{new }},{\rm{s}}}}{{\boldsymbol{P}}_{\rm{s}}}$.

根据上层IPLS模型,计算 ${{\boldsymbol{x}}_{{\rm{new}}}}$在2个正交空间上的得分:

${{\boldsymbol{t}}_{\hat x}}{\rm{ = }}{\hat{\boldsymbol \varGamma }}_{\rm{M}}^{\rm T}{{\boldsymbol{x}}_{{\rm{new}}}},$

${{\boldsymbol{t}}_{\tilde x}}{\rm{ = }}{\tilde{\boldsymbol \varGamma }}_{\rm{M}}^{\rm T}{{\boldsymbol{x}}_{{\rm{new}}}}.$

式中: ${{\boldsymbol{t}}_{\hat x}}$${{\boldsymbol{t}}_{\tilde x}}$为过程信息分别在2个空间的得分.

在2个空间中,分别采用 ${T^2}$统计量检测异常:

$\begin{split} T_{\hat x}^2 =\;& {\boldsymbol{x}}_{{\rm{new}}}{{{\hat{\boldsymbol \varGamma }}}_{\rm{M}}}{\left( {\frac{{{\hat{\boldsymbol \varGamma }}_{\rm{M}}^{\rm{T}}{{\boldsymbol{X}}^{\rm T}}{\boldsymbol{X}}{{{\hat{\boldsymbol \varGamma }}}_{\rm{M}}}}}{{n - 1}}} \right)^{ - 1}}{\hat{\boldsymbol \varGamma }}_{\rm{M}}^{\rm{T}}{{\boldsymbol{x}}^{\rm{T}}_{{\rm{new}}}}= \\ & {\boldsymbol{t}}_{\hat x}^{\rm T}{\left( {\frac{{{{{\hat{\boldsymbol T}}}^{\rm T}}{\hat{\boldsymbol T}}}}{{n - 1}}} \right)^{ - 1}}{{\boldsymbol{t}}_{\hat x}}, \end{split} $

$\begin{split} T_{\tilde x}^2 =\;& {\boldsymbol{x}}_{{\rm{new}}}{{{\tilde{\boldsymbol \varGamma }}}_{\rm{M}}}{\left( {\frac{{{\tilde{\boldsymbol \varGamma }}_{\rm{M}}^{\rm{T}}{{\boldsymbol{X}}^{\rm T}}{\boldsymbol{X}}{{{\tilde{\boldsymbol \varGamma }}}_{\rm{M}}}}}{{n - 1}}} \right)^{ - 1}}{\tilde{\boldsymbol \varGamma }}_{\rm{M}}^{\rm{T}}{{\boldsymbol{x}}^{\rm{T}}_{{\rm{new}}}}= \\ & {\boldsymbol{t}}_{\tilde x}^{\rm T}{\left( {\frac{{{{{\tilde{\boldsymbol T}}}^{\rm T}}{\tilde{\boldsymbol T}}}}{{n - 1}}} \right)^{ - 1}}{{\boldsymbol{t}}_{\tilde x}}. \end{split} $

式中: $T_{\hat x}^2$为KPI相关子空间的统计量, $T_{\tilde x}^2$为KPI无关子空间的统计量.

采用 ${\chi ^{\rm{2}}}$分布[12],计算相应的控制限:

${J_{{\rm{th,}}{T}_{\hat x}^2}} = \hat g\chi _{{{\rm{\alpha ,}}}{\hat h}}^2,\;{\hat g_{\rm{c}}} = \frac{{\hat S}}{{2\hat \mu }}\;,\;{\hat h_{\rm{c}}} = \frac{{2{{\hat \mu }^2}}}{{\hat S}}.$

${J_{{\rm{th,}}{T}_{\tilde x}^2}} = \tilde g\chi _{{{{\rm\alpha} ,\tilde h}}}^2,\;\tilde g = \frac{{\tilde S}}{{2\tilde \mu }}\;,\;\tilde h = \frac{{2{{\tilde \mu }^2}}}{{\tilde S}}.$

式中: ${J_{{\rm{th,}}{T}_{\hat x}^2}}$为KPI相关统计量 $T_{{{\hat x}_{\rm{c}}}}^2$的控制限, ${J_{{\rm{th,}}{T}_{\tilde x}^2}}$为KPI无关统计量 $T_{\tilde x}^2$的控制限, $\;\hat \mu $$\hat S$分别为正常训练样本 ${\boldsymbol{X}}$$T_{\hat x}^2$的均值与方差, $\;\tilde \mu $$\tilde S$分别为正常训练样本 ${\boldsymbol{X}}$$T_{\tilde x}^2$的均值与方差, $\alpha $为统计量阈值的置信水平.

2.4. 基于DL-IPLS的故障监测流程

面向工业复杂系统的建模与监控过程包括离线建模和在线监控两部分. 如图1所示为基于DL-IPLS的故障监测流程图,具体步骤的描述如下.

图 1

图 1   基于DL-IPLS故障监测流程图

Fig.1   Fault monitoring flow chart based on DL-IPLS


离线建模阶段如下.

1)对测量值 ${\boldsymbol{U}}$进行ADF检验,将 ${\boldsymbol{U}}$分为非平稳变量 ${{\boldsymbol{U}}_{{{n_{\rm s}}}}}$和平稳变量 ${{\boldsymbol{U}}_{\rm{s}}}$.

2)根据底层模型中CA模型提取 ${{\boldsymbol{U}}_{{{n_{\rm s}}}}}$的平稳残差矩阵 ${{\boldsymbol{\gamma }}_{\rm{u}}}$,同时根据PCA模型提取 ${{\boldsymbol{U}}_{\rm{s}}}$中的特征信息 ${{\boldsymbol{T}}_{\rm{s}}}$.

3)将 ${{\boldsymbol{\gamma }}_{\rm{u}}}$${{\boldsymbol{U}}_{\rm{s}}}$进行融合,得到数据矩阵 ${\boldsymbol{X}}$.

4)根据PLS的迭代过程,得到 ${\boldsymbol{X}}$${\boldsymbol{Y}}$之间的系数矩阵 ${\boldsymbol{M}}$.

5)对 ${\boldsymbol{M}}{{\boldsymbol{M}}^{\rm T}}$进行SVD分解,得到 ${{\hat{\boldsymbol \varGamma }}_{\rm{M}}}$${{\tilde{\boldsymbol \varGamma }}_{\rm{M}}}$.

6)构造正交投影矩阵 ${{\boldsymbol{\varPi }}_{\rm{M}}}$${\boldsymbol{\varPi }}_{\rm{M}}^ \bot $.

7)将 ${\boldsymbol{X}}$${{\boldsymbol{\varPi }}_{\rm{\varphi }}}$${\boldsymbol{\varPi }}_{\rm{\varphi }}^ \bot $上投影,得到正交的 ${\hat{\boldsymbol X}}$${\tilde{\boldsymbol X}}$.

8)根据正常样本的统计量,计算控制限 ${J_{{\rm{th,}}{T}_{\hat x}^2}}$${J_{{\rm{th,}}{T}_{\tilde x}^2}}$.

在线监控阶段如下.

1)将新采集的样本 ${{\boldsymbol{u}}_{{\rm{new}}}}$分为非平稳样本 ${{\boldsymbol{u}}_{{{{\rm new},{n_{\rm{s}}}}}}}$和平稳样本 ${{\boldsymbol{u}}_{{\rm{new,s}}}}$.

2)由 ${{\boldsymbol{\gamma }}_{{{{\rm new},{n_{\rm{s}}}}}}} = {{\boldsymbol{u}}_{{{{\rm new},{n_{\rm{s}}}}}}}{\boldsymbol{\beta }}$获得 ${{\boldsymbol{u}}_{{{{\rm new},{n_{\rm{s}}}}}}}$的残差序列 ${{\boldsymbol{\gamma }}_{{{{\rm new},{n_{\rm{s}}}}}}}$,由 ${{\boldsymbol{t}}_{{\rm{new,s}}}} = {{\boldsymbol{u}}_{{\rm{new,s}}}}{{\boldsymbol{P}}_{\rm{s}}}$提取 ${{\boldsymbol{u}}_{{\rm{new,s}}}}$的特征信息 ${{\boldsymbol{t}}_{{\rm{new,s}}}}$.

3)建立融合数据 ${{\boldsymbol{x}}_{{\rm{new}}}} = \left[ {\begin{array}{*{20}{c}} {{{\boldsymbol{\gamma }}_{{{{\rm new},{n_{\rm{s}}}}}}}}\;,\;{{{\boldsymbol{t}}_{{\rm{new,s}}}}} \end{array}} \right]$.

4)根据式(27)、(28),分别计算 ${{\boldsymbol{x}}_{{\rm{new}}}}$在KPI相关子空间和KPI无关子空间的得分.

5)根据式(29)、(30),计算样本的监控统计量 $T_{\hat x}^2$$T_{\tilde x}^2$.

6)在线监控逻辑如下.

$T_{\hat x}^2 > {J_{{\rm{th,}}{T}_{\hat x}^2}}$,则检测到KPI相关故障;若 $T_{\hat x}^2 \leqslant $ $ {J_{{\rm{th,}}{T}_{\hat x}^2}}$${T_{\tilde x}^2 > {J_{{\rm{th,}}{T}_{\tilde x}^2}}}$,则检测到KPI无关故障.

3. 仿真实验

通过TE过程与MPLS[11]、OSC-MPLS[13]、IPLS[12]3种KPI相关故障检测算法比较,利用青霉素发酵过程[25]验证提出算法的有效性. 当系统中KPI相关故障发生时,要求在KPI相关空间及时监测到故障的发生;当系统中KPI无关故障发生时,在KPI相关空间要求不报警,若在KPI相关空间的统计量超过控制限,则发生的报警称为误报警. 采用故障检测率(fault detection rate,FDR)和故障误报率(fault alarm rate,FAR)[13]2个常用指标进行性能评价:

$\left. {\begin{array}{*{20}{c}} {{\rm{FDR}} = \dfrac{{{N_{{\rm{nea}}}}}}{{{N_{{\rm{tfs}}}}}} \times 100{\text{%}} ,} \\ {{\rm{FAR}} = \dfrac{{{N_{{\rm{nfa}}}}}}{{{N_{{\rm{tfs}}}}}} \times 100{\text{%}} .} \end{array}} \right\}$

式中: ${N_{{\rm{nea}}}}$为有效报警数, ${N_{{\rm{nfa}}}}$为KPI无关故障在KPI相关空间发生的误报警数, ${N_{{\rm{tfs}}}}$为发生故障的样本总数.

在实际的工业过程中,一个较好的KPI相关故障检测方案主要表现在以下2个方面.

1)当KPI相关故障发生时,KPI相关的统计指标FDR高.

2)当KPI无关故障发生时,KPI相关的统计指标FAR低.

3.1. TE过程

TE过程[26]由美国Tennessee Eastman 化学公司过程控制部门提出,被广泛作为连续过程的策略、监视、诊断等优化的研究平台[27]. 该过程有4种反应物(A、C、D、E)、2种生成物(G、H). 此外,还包含一种惰性物质B及副产物F. 系统中存在的化学反应如下:

${\rm{A(g) + C(g) + E(g)}} \to {\rm{H(liq),}}$

${\rm{A(g) + E(g)}} \to {\rm{F(liq),}}$

${\rm{3D(g)}} \to {\rm{2F(liq)}}{\rm{.}}$

其中 ${\rm{g}}$表示气体, ${\rm{liq}}$表示液体. 整个过程由反应器、冷凝器、气液分离塔、循环压缩机和汽提塔5个主要操作单元组成.

TE过程包含41个过程变量XMEAS(1~41)和12个操纵变量XMV(1~12),产生的22个数据集用于过程监控和故障诊断,包括1个正常数据集和21个故障的数据集. 其中IDV(1)~IDV(15)及IDV(21)为已知原因的故障,IDV(16)~IDV(20)为未知原因的故障将用于本文研究,验证提出DL-IPLS算法的有效性. 正常数据集包含500个采样样本,每个故障数据集包含960个采样样本,前160个样本为正常样本,后800个样本为故障样本.对MPLS[11]、OSC-MPLS[13]、IPLS[12]、DL-IPLS 4种算法建模过程中选择22个过程变量XMEAS(1~22)和11个操纵变量XMV(1~11)作为过程变量数据U,选择最终产品组分G的摩尔分数XMEAS(35)作为影响质量的关键性能指标Y.

根据故障分类的标准[8],若故障发生后10%或更多的样本超过阈值,则认为该故障为KPI相关故障. 根据这一原则,Yin等[11]将IDV(1、2、5、6~8、10、12、13,17、18、20、21)分为KPI相关故障,IDV(3、4、9、11、15、16、19)分为KPI无关故障. 如表1所示为MPLS、OSC-MPLS、IPLS、DL-IPLS 4种监测算法在TE实验过程中的控制限值,控制限的置信水平 $\alpha = 99{\text{%}} $.

表 1   4种算法在TE过程中的控制限

Tab.1  Control limits of four algorithms in TE process

监测算法 ${J_{{\rm{th,}}{T}_{\hat x}^2}}$ ${J_{{\rm{th,}}{T}_{\tilde x}^2}}$
MPLS 6.70 58.58
OSC-MPLS 7.10 52.75
IPLS 11.53 55.46
DL-IPLS 17.24 20.71

新窗口打开| 下载CSV


表2所示为MPLS[11]、OSC-MPLS[13]、IPLS[12]、DL-IPLS 4种算法对13种已知KPI相关故障的检测率,其中同一故障FDR较高的用黑体表示.可以看出,除IDV(5)、IDV(8)、IDV(18)、IDV(21)外,DL-IPLS算法的FDR均高于其他3种算法,尤其是对故障IDV(7)、IDV(10)、IDV(20)的检测率有大幅度提高,相对于IPLS故障监测方法,分别提高了26.26%、31.75%、36.63%. DL-IPLS对于IDV(8)、IDV(12)2种故障的FDR略低于IPLS算法,但相对MPLS、OSC-MPLS这2种算法的有效报警率有很大程度的提高. 由TE过程中KPI相关故障的平均报警率可知,所提算法对该类故障进行监测时,DL-IPLS总体上优于其他3种算法,提高了对KPI相关故障的有效报警率.

表 2   TE过程中KPI相关故障有效报警率

Tab.2  FDR of KPI related faults in TE process

故障编号 KPI相关故障描述 FDR /%
MPLS OSC-MPLS IPLS DL-IPLS
IDV(1) A/C进料流量比发生变化,成分B恒定 89.87 89.00 99.50 99.65
IDV(2) 组分B质量浓度发生变化,A/C供料比恒定 88.12 96.75 94.37 98.50
IDV(5) 冷凝器冷却水的入口温度 100 100 25.25 24.38
IDV(6) A供料损失(管道1) 99.12 98.75 99.12 99.13
IDV(7) C存在压力损失 41.12 49.37 73.00 99.63
IDV(8) 物料A,B,C供料质量浓度(管道4) 67.12 77.37 94.75 90.88
IDV(10) 物料C供料温度发生变化 46.00 54.37 46.12 77.87
IDV(12) 压缩机冷凝水入口温度变化 84.12 86.37 93.37 91.13
IDV(13) 反应器中的反应程度 90.37 89.87 90.12 92.38
IDV(17) 未知 54.87 65.37 56.50 69.25
IDV(18) 未知 90.00 89.75 88.50 89.13
IDV(20) 未知 49.25 68.25 39.25 75.88
IDV(21) 阀固定在稳态位置 70.25 75.87 56.62 34.50

新窗口打开| 下载CSV


已知IDV(5)是冷凝器冷却水的入口温度发生变化引起的故障,故障发生时具有反馈机制,系统进行自我调节,保证KPI的质量及稳定性. 根据文献[12]可知,IDV(5)在8.0~9.0 h(161~300个样本)时影响KPI,系统在9 h后通过系统反馈调节冷凝器冷却水的入口温度恢复到正常水平. 如图2所示为利用DL-IPLS算法对IDV(5)的检测结果,在161~300个样本之间,利用DL-IPLS算法能够准确地检测出KPI相关故障的发生.

图 2

图 2   DL-IPLS对KPI相关故障IDV(5)的检测结果

Fig.2   Detection results of KPI related fault IDV (5) by DL-IPLS


IDV(7)发生时具有反馈机制,该故障是由于物料C压力损失造成的,在一段时间的自我调节过程中,得到了一定的恢复. 通过实验表明,反馈调节后物料C压力没有恢复到正常水平[12],该故障仍然存在. 由图3可知,提出算法能够体现过程中的这一特征,在KPI相关空间能够持续报警,提醒工程师及操作人员进行人为干预,对系统进行调节.

图 3

图 3   DL-IPLS对KPI相关故障IDV(7)的检测结果

Fig.3   Detection results of KPI related fault IDV (7) by DL-IPLS


当KPI相关故障发生时,工程师及操作人员重点关注KPI相关空间的报警情况,要求在KPI相关空间的统计指标中有较高的检测率. 对于KPI无关空间的统计量主要包含模型的残差、噪声等一些与KPI无关的信息,该空间的报警情况不能直接反映监测的性能[13]. 如图4~6所示分别为OSC-MPLS、IPLS、DL-IPLS对IDV(10)的检测结果. IDV(10)是由物流C的供料温度发生变化引起的,该故障的发生将会影响KPI质量的变化. 从图45可知,当故障发生时,OSC-MPLS、IPLS在KPI相关空间存在较多的漏报警情况,未能持续报警. 从图6可知,提出算法对该故障检测时存在较少的漏报警情况,在KPI相关空间的有效报警率为77.87%,相对其他3种算法有效提高了20%以上. OSC-MPLS、IPLS在KPI无关空间的报警情况比DL-IPLS有更好的检测效果,但由于该空间是对KPI无关信息的监测,不能直接反映KPI相关故障的监测性能.

图 4

图 4   OSC-MPLS对KPI相关故障IDV(10)的检测结果

Fig.4   Detection results of KPI related fault IDV (10) by OSC-MPLS


图 5

图 5   IPLS对故障KPI相关IDV(10)的检测结果

Fig.5   Detection results of KPI related fault IDV (10) by IPLS


图 6

图 6   DL-IPLS对KPI相关故障IDV(10)的检测结果

Fig.6   Detection results of KPI related fault IDV (10) by DL-IPLS


表3所示为MPLS[11]、OSC-MPLS[13]、IPLS[12]、DL-IPLS 4种算法对7种已知KPI无关故障在KPI相关空间的误报率,其中同一故障FAR低的用黑体表示. KPI无关故障的发生不会影响产品的质量及稳定性,应及时明确故障的性质,提醒工程师及操作人员是否进行人为干预. 由表3可知,除IDV(16)外,利用提出的DL-IPLS对KPI无关故障进行监测时,IDV(3)、IDV(4)、IDV(9)、IDV(11)、IDV(15)、IDV(19)在KPI相关空间的FAR均小于2%,相对于其他3种算法的FAR显著降低. 由表3中对KPI无关故障的平均误报率可知,利用所提算法明显提高了对KPI无关故障的监测性能,可以减少工业过程中不必要的停机,提高生产效率,降低维修成本.

表 3   TE过程中KPI无关故障误报警率

Tab.3  FAR of KPI-unrelated faults in TE process

故障编号
KPI无关故障描述 FAR /%
MPLS OSC-MPLS IPLS DL-IPLS
IDV(3) 物料D供料温度发生变化 13.62 13.50 7.87 1.37
IDV(4) 反应器冷却水入口温度变化 11.00 9.37 22.00 1.37
IDV(9) D供料温度发生变化 7.50 5.00 9.12 1.12
IDV(11) 反应冷却水入口温度变化 9.62 8.50 21.37 3.37
IDV(15) 压缩机冷凝水阀门 10.51 10.75 13.25 0.62
IDV(16) 未知 45.86 35.00 28.38 66.00
IDV(19) 未知 7.00 10.88 3.38 1.25

新窗口打开| 下载CSV


图7~9所示分别为OSC-MPLS、IPLS、DL-IPLS对IDV(4)的检测结果. IDV(4)是由反应器冷凝水入口温度发生阶跃变化引起的,反应器温度通过级联控制器控制,这种变化不会影响KPI的质量. 由图7~9可知,3种算法在KPI无关空间均能检测到故障发生,但在KPI相关空间的误报警情况不同,OSC-MPLS、IPLS 2种算法的误报警情况比所提的DL-IPLS高. 从图9可以看出,当KPI无关故障发生时,利用所提算法能够有效区分故障是否KPI相关,在KPI无关空间的误报警率较低,具有较好的KPI无关故障的检测性能.

图 7

图 7   OSC-MPLS对KPI无关故障IDV(4)的检测结果

Fig.7   Detection results of KPI unrelated fault IDV (4) by OSC-MPLS


图 8

图 8   IPLS对KPI无关故障IDV(4)的检测结果

Fig.8   Detection results of KPI unrelated fault IDV (4) by IPLS


图 9

图 9   DL-IPLS对KPI无关故障IDV(4)的检测结果

Fig.9   Detection results of KPI unrelated fault IDV (4) by DL-IPLS


3.2. 青霉素发酵过程

青霉素生产过程是复杂的且含有较多相互耦合关系变量的化学反应过程,数据具有时变性、非线性、多维性和不确定性[25]. 采用青霉素发酵过程,对提出方法的有效性进行验证. 数据来源于Pensim2.0仿真软件,Pensim2.0不仅可以在正常的初始条件下模拟实际的青霉素发酵过程,而且可以设定若干个常见故障进行仿真[28]. 青霉素发酵过程的详细介绍可以参见文献[25],仿真软件产生的数据中有18个变量,由表4列出.

表 4   Pensim2.0 仿真数据变量

Tab.4  Pensim2.0 simulation data variable

标号 变量 标号 变量
1 采样时间 10 反应器体积
2 通风速率 11 排气二氧化碳浓度
3 搅拌速率 12 PH值
4 底物流加速率 13 温度
5 补料温度 14 产生热
6 底物物质的量 15 酸流加速率
7 溶解氧物质的量 16 碱流加速率
8 菌体物质的量 17 冷水流加速率
9 产物物质的量 18 热水流加速率

新窗口打开| 下载CSV


设定仿真时间为400 h,采样间隔为0.5 h,选取变量(2~5、7、10~14)10个变量作为过程变量,选取变量8和9作为输出的关键性能指标. 引入以下2种KPI相关故障数据,验证DL-IPLS监测算法的有效性[25].

故障1:对搅拌功率引入故障信号. 工况运行时,在200 h时引入故障,故障幅值为−50.

故障2:对通风速率引入故障信号. 工况运行时,在200 h时引入故障,故障幅值为50.

图10所示为DL-IPLS对故障1的检测结果. 图中,实线表示监测统计量,虚线表示统计量的控制限,其中控制限的置信水平 $\alpha = 99{\text{%}}$.图10可知,在KPI相关空间, $T_{\hat x}^2$统计量在200 h时超出控制限,及时监控到了故障的发生,能够持续报警,提醒工程师及操作人员进行人为干预.

图 10

图 10   DL-IPLS对青霉素发酵过程中故障1的检测结果

Fig.10   Detection results of fault 1 in penicillin fermentation by DL-IPLS


图11所示为DL-IPLS对青霉素发酵过程中故障2的检测结果. 故障2为200 h时对通风速率引入的故障信号,通风率的变化使得氧气的供应量产生变化,影响培养基的溶氧浓度和细菌的生长速度,导致了青霉素的产量变化. 由图11可知,在KPI相关空间中,所提算法的 ${\rm{T}}_{\hat x}^2$统计量在200 h处超出控制限,并一直持续到400 h处,能够及时地检测到故障发生,并持续报警,具有良好的检测性能.

图 11

图 11   DL-IPLS对青霉素发酵过程中故障2的检测结果

Fig.11   Detection results of fault 2 in penicillin fermentation by DL-IPLS


4. 结 语

针对复杂工业系统具有平稳/非平稳的混杂特性,本文提出双层改进潜结构投影(DL-IPLS)的KPI相关故障检测方法. 使用CA模型和PCA模型有效提取过程变量的平稳特征信息,消除了非平稳随机趋势及平稳变量中的噪声素对监测精度的影响.利用IPLS作为后处理方法,将过程信息分解成正交的KPI相关空间和KPI无关空间,实现在线监测. 通过青霉素发酵过程和TE仿真,验证了所提算法的有效性,在TE过程中与MPLS、OSC-MPLS、IPLS相比,本文方法在面向平稳/非平稳的混杂系统时具有更好的检测性能.

参考文献

LIU J, WANG D, CHEN J

Monitoring framework based on generalized tensor PCA for three-dimensional batch process data

[J]. Industrial and Engineering Chemistry Research, 2020, 59 (22): 10493- 10508

DOI:10.1021/acs.iecr.9b06244      [本文引用: 1]

罗林, 苏宏业, 班岚

Dirichlet过程混合模型在非线性过程监控中的应用

[J]. 浙江大学学报: 工学版, 2015, 49 (11): 2230- 2236

URL     [本文引用: 1]

LUO Lin, SU Hong-ye, BAN Lan

Nonparametric bayesian based on mixture of dirichlet process in application of fault detection

[J]. Journal of Zhejiang University: Engineering Science, 2015, 49 (11): 2230- 2236

URL     [本文引用: 1]

LI Z, YAN X

Performance-driven ensemble ICA chemical process monitoring based on fault-relevant models

[J]. Soft Computing, 2020, 24 (16): 12289- 12302

DOI:10.1007/s00500-020-04673-6      [本文引用: 1]

LI Z, YAN X

Fault-relevant optimal ensemble ICA model for non-gaussian process monitoring

[J]. IEEE Transactions on Control Systems Technology, 2020, 28 (6): 2581- 2590

DOI:10.1109/TCST.2019.2936793      [本文引用: 1]

ZHONG B, WANG J, ZHOU J L, et al

Quality rela-ted statistical process monitoring method based on gl-obal and local partial least squares projection

[J]. In-dustrial and Engineering Chemistry Research, 2016, 55 (6): 1609- 1622

DOI:10.1021/acs.iecr.5b02559      [本文引用: 1]

WU O, BOUASWAIG A, IMSLAND L, et al

Camp-aign-based modeling for degradation evolution in bat-ch processes using a multiway partial least squares a-pproach

[J]. Computers and Chemical Engineering, 2019, 128 (2): 117- 127

URL    

LIU H, YANG J, ZHANG Y, et al

Monitoring of wastewater treatment processes using dynamic concurrent kernel partial least squares

[J]. Process Safety and Environmental Protection, 2021, 147: 274- 282

DOI:10.1016/j.psep.2020.09.034      [本文引用: 1]

LI G, QIN S J, JI Y D

Total PLS based contribution plots for fault diagnosis

[J]. Acta Automatica Sinica, 2009, 35 (6): 759- 765

URL     [本文引用: 2]

ZHOU D H, LI G, QIN S J

Total projection to latent structures for process monitoring

[J]. AiChE Journal, 2010, 56 (1): 168- 178

URL     [本文引用: 2]

QIN S J, ZHANG Y Y

Quality-relevant and process relevant fault monitoring with concurrent projection to latent structures

[J]. AIChE Journal, 2013, 59 (2): 496- 504

DOI:10.1002/aic.13959      [本文引用: 1]

YIN S, DING S X, ZHANG P, et al

Study on modifications of PLS approach for process monitoring

[J]. IFAC Proceedings Volumes, 2011, 44 (1): 12389- 12394

DOI:10.3182/20110828-6-IT-1002.02876      [本文引用: 7]

YIN S, ZHU X P, KAYNAK O

Improved PLS focused on key performance indictor related fault diagnosis

[J]. IEEE Transactions on Industrial Informatics, 2015, 62 (3): 1651- 1658

DOI:10.1109/TIE.2014.2345331      [本文引用: 10]

WANG G, YIN S

Quality-related fault detection approach based on orthogonal signal correction and modified PLS

[J]. IEEE Transactions on Industrial Informatics, 2017, 11 (2): 398- 405

URL     [本文引用: 8]

孙鹤. 数据驱动的复杂非平稳工业过程建模与监测[D]. 杭州: 浙江大学, 2018: 8-19.

[本文引用: 2]

SUN He. Complex nonstationary industrial process modeling and monitoring based on data driven methods[D]. Hangzhou: Zhejiang University, 2018: 8-19.

[本文引用: 2]

CHEN Q, KRUGER U, LEUNG A Y T

Cointegration testing method for monitoring nonstationary processes

[J]. Industrial and Engineering Chemistry Research, 2009, 48 (7): 3533- 3543

DOI:10.1021/ie801611s      [本文引用: 2]

SUN H, ZHANG S M, ZHAO C H, et al

A sparse reconstruction strategy for online fault diagnosis in nonstationary processes with no a priori fault information

[J]. Industrial and Engineering Chemistry Research, 2017, 56 (24): 6993- 7008

DOI:10.1021/acs.iecr.7b00156      [本文引用: 3]

ZHAO C H, HUANG B

A full condition monitoring method for non-stationary dynamic chemical processes with cointegration and slow feature analysis

[J]. ALCHE Journal, 2018, 64 (5): 1662- 1681

DOI:10.1002/aic.16048      [本文引用: 1]

LIN Y, KRUGER U, CHEN Q

Monitoring nonstationary dynamic systems using cointegration and common trends analysis

[J]. Industrial and Engineering Chemistry Research, 2017, 56 (31): 8895- 8905

DOI:10.1021/acs.iecr.7b00011      [本文引用: 1]

孔祥玉, 曹泽豪, 安秋生, 等

偏最小二乘线性模型及其非线性动态扩展模型综述

[J]. 控制与决策, 2018, 33 (9): 1537- 1548

URL     [本文引用: 1]

KONG Xiang-yu, CAO Ze-hao, AN Qiu-sheng, et al

Review of partial least squares linear models and their nonlinear dynamic expansion models

[J]. Control and Decision, 2018, 33 (9): 1537- 1548

URL     [本文引用: 1]

JOHANSEN S, JUSELIUS K

Maximum likelihood estimation and inference on cointegration with applications to the demand for money

[J]. Oxford Bulletin of Economics and Statistics, 1990, 52 (2): 169- 210

URL     [本文引用: 5]

ZHAO C H, SUN H

Dynamic distributed monitoring strategy for large-scale nonstationary processes subject to frequently varying conditions under closed-loop control

[J]. IEEE Transactions on Industrial Electronics, 2019, 66 (6): 4749- 4758

DOI:10.1109/TIE.2018.2864703      [本文引用: 1]

TABRIZI A A, AL-BUGHARBEE H, TRENDAFILOVA I, et al

A cointegration-based monitoring method for rolling bearings working in time-varying operational conditions

[J]. Meccanica, 2017, 52 (4-5): 1201- 1217

DOI:10.1007/s11012-016-0451-x      [本文引用: 1]

WILMS I, CROUX C

Forecasting using sparse cointegration

[J]. International Journal of Forecasting, 2016, 32 (4): 1256- 1267

DOI:10.1016/j.ijforecast.2016.04.005      [本文引用: 1]

LI G, QIN S J, TAO Y

Non-stationarity and cointegration tests for fault detection of dynamic processes

[J]. IFAC Proceedings Volumes, 2014, 47 (3): 10616- 10621

DOI:10.3182/20140824-6-ZA-1003.00754      [本文引用: 1]

BIROL G, ÜNDEY C, CINAR A

A modular simulation package for fed-batch fermentation: penicillin production

[J]. Computers and Chemical Engineering, 2002, 26 (11): 1553- 1565

DOI:10.1016/S0098-1354(02)00127-8      [本文引用: 4]

DOWNS J J, VOFEL E F

A plant-wide industrial pr-ocess control problem

[J]. Computers and Chemical Engineering, 1993, 17 (3): 245- 255

DOI:10.1016/0098-1354(93)80018-I      [本文引用: 1]

张成, 高宪文, 李元

基于k近邻主元得分差分的故障检测策略

[J]. 自动化学报, 2020, 46 (10): 2229- 2238

URL     [本文引用: 1]

ZHANG Cheng, GAO Xian-wen, LI Yuan

Fault detection strategy based on principal component score difference of k nearest neighbors

[J]. Acta Automatica Sinica, 2020, 46 (10): 2229- 2238

URL     [本文引用: 1]

LI K, FENG J

Grouping multi‐rate sampling fault detection method for penicillin fermentation process

[J]. The Canadian Journal of Chemical Engineering, 2020, 98 (6): 1319- 1327

DOI:10.1002/cjce.23701      [本文引用: 1]

/