基于多子空间加权移动窗主成分分析的全厂流程早期故障检测

doi:10.3785/j.issn.1008-973X.2024.10.011

基于多子空间加权移动窗主成分分析的全厂流程早期故障检测

宋易盟^,, 宋冰^,, 侍洪波, 康永波

华东理工大学能源化工过程智能制造教育部重点实验室，上海 200237

Multiple subspace weighted moving window PCA for plant-wide process incipient fault detection

SONG Yimeng^,, SONG Bing^,, SHI Hongbo, KANG Yongbo

Key Laboratory of Smart Manufacturing in Energy Chemical Process of the Ministry of Education, East China University of Science and Technology, Shanghai 200237, China

通讯作者: 宋冰，男，副教授，博士. orcid.org/0000-0003-1379-245X. E-mail：songbing@ecust.edu.cn

收稿日期: 2024-01-22

基金资助:

国家自然科学基金资助项目（62073140, 62073141, 62103149, 62273147）；上海明日之星计划资助项目（21QA1401800）；国家重点研发计划资助项目（2020YFC1522502, 2020YFC1522505）.

Received: 2024-01-22

Fund supported:

国家自然科学基金资助项目（62073140,62073141,62103149,62273147）；上海明日之星计划资助项目（21QA1401800）；国家重点研发计划资助项目（2020YFC1522502,2020YFC1522505）.

作者简介 About authors

宋易盟（2000—），男，硕士生，从事特征提取、故障检测和故障诊断研究.orcid.org/0009-0007-2543-0348.E-mail：y30220987@mail.ecust.edu.cn , E-mail：y30220987@mail.ecust.edu.cn

摘要

早期故障的特征不明显，在全厂流程中比常规故障难检测. 为了提高全厂流程中早期故障的检测率和灵敏度，将检测视角由全局转移至局部，提出基于多子空间加权移动窗主成分分析(PCA)的早期故障检测方法. 使用结合过程知识和数据驱动的双层子空间划分方法，将过程变量划分到不同子空间中. 使用加权的移动窗口增大早期故障的偏移量，将局部离群因子(LOF)算法引入PCA，以便进一步关注数据的局部特征，在每个子空间中建立故障检测模型. 通过贝叶斯推理融合法对各子空间的监测结果进行信息融合，获得分布式监测结果. 通过工业实例验证所提方法的性能. 结果表明，所提方法在全厂流程中有效提升了早期故障检测的准确率和灵敏度.

关键词： 全厂流程 ; 早期故障检测 ; 两层子空间划分 ; 加权移动窗口 ; 局部离群因子 ; 贝叶斯推理融合

Abstract

Incipient faults are difficult to detect in plant-wide processes compared to conventional faults due to the lack of distinctive features. An incipient fault detection method based on multiple subspace weighted moving window principal component analysis (PCA) was proposed by shifting the detection perspective from the global to the local to improve the detection rate and sensitivity of incipient faults in plant-wide processes. Process variables were partitioned into different subspaces using a two-layer subspace partitioning method that combines process knowledge and data-driven approaches. A weighted moving window was used to increase the offset of incipient faults, while a local outlier factor (LOF) algorithm was introduced into PCA to further focus on the local features of the data to model fault detection in each subspace. The monitoring results in each subspace were fused with information by the Bayesian inference fusion method to obtain distributed monitoring results. The proposed method was validated by industrial examples, and the results showed that the method effectively improved the accuracy and detection speed of incipient fault detection in plant-wide processes.

Keywords： plant-wide process ; incipient fault detection ; two-layer subspace partitioning ; weighted moving window ; local outlier factor ; Bayesian inference fusion

PDF (912KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

宋易盟, 宋冰, 侍洪波, 康永波. 基于多子空间加权移动窗主成分分析的全厂流程早期故障检测. 浙江大学学报(工学版)[J], 2024, 58(10): 2076-2083 doi:10.3785/j.issn.1008-973X.2024.10.011

SONG Yimeng, SONG Bing, SHI Hongbo, KANG Yongbo. Multiple subspace weighted moving window PCA for plant-wide process incipient fault detection. Journal of Zhejiang University(Engineering Science)[J], 2024, 58(10): 2076-2083 doi:10.3785/j.issn.1008-973X.2024.10.011

在现代工业流程中，可靠的早期故障检测对于确保流程安全和产品质量非常重要. 多元统计分析是工业控制系统监测中应用最广泛的方法^[1-3]. 常用的多元统计分析算法^[4-5]包括主成分分析法(principal component analysis, PCA)、偏最小二乘法(partial least square, PLS)、独立成分分析法(independent components analysis, ICA)等.

控制单元的数量和变量复杂，因此传统的多参数监测方法对早期故障的检测效果不理想. 分布式方法避免了直接从复杂的全厂流程中检测早期故障，能够提高检测的准确性^[6]. 分布式方案通常包括3个步骤：子空间划分、子空间模型的建立和信息融合决策. 1）多子空间划分一般分为2种方法：知识型和数据驱动型. 知识型方法通常根据过程知识或专家经验将过程变量划分成块. 数据驱动型方法分为2类，一类根据变量之间的相关性划分子空间，如Wang等^[7]使用负载矩阵的广义骰子系数来划分过程变量，形成多子空间监控框架；另一类根据故障类型区分过程变量^[8]，如Jiang等^[9]提出基于故障相关变量选择的分布式PCA监控方法，可根据工业流程中的故障类型划分过程变量. 知识型或数据驱动型方法进行子空间划分忽略了过程信息与相应操作单元物理位置之间的相关性，分布式方案中子空间可能不是最佳划分. 2）子空间监测领域的现有方法包括常规分析方法^[10]、统计方法^[11-12]和智能方法^[13]. 其中基于统计分析的检测方法完全依赖系统的过程数据，无需深入了解系统的内部结构，使用效率高，是早期故障检测领域应用较广泛的技术. Deng等^[14]提出基于核PCA的两步局部信息挖掘框架，用于非线性的早期故障检测和隔离. Pilario等^[15]提出典型变量分析(canonical variate analysis, CVA)的扩展，利用典型变量相异分析(canonical variate dissimilarity analysis, CVDA)来检测早期故障. 早期故障特征微弱，增大故障断层偏移量有助于检测工作的开展，滑动窗口法是被证明的有效方法. Qin等^[16]提出将相关统计分析和滑动窗口技术相结合的新算法，增强了早期故障的微弱特征，实现了早期故障的检测. 关注数据的局部特征也可以增强早期故障的检测能力，其中基于密度的异常检测方法能够在确定置信区域时避免过程数据服从正态分布的假设，并在确定置信区域时减少训练数据中离群值的影响^[17]. 3）在信息融合决策方面，一般采用贝叶斯推理方法对所有子空间的检测结果进行融合，实现全厂过程检测结果的集成^[18].

本研究提出基于多子空间加权移动窗主成分分析的分布式故障检测模型，用于全厂流程的早期故障检测. 1)使用基于过程知识和数据驱动的双层子空间划分框架划分过程变量，将早期故障检测的视角从全局转向局部，提前发现早期故障；2)使用加权移动窗口法实现窗口内数据的差异化处理；3)考虑数据集的局部和全局属性，采用局部离群因子(local outlier factor, LOF)算法结合主成分分析法构建统计量.

1. 多子空间加权移动窗主成分分析

1.1. 两层子空间划分框架

1.1.1. 基于过程知识的子空间划分

分布式方案须将过程变量划分为不同的相关区块. 基于过程知识划分，过程变量可以保留同一区块内变量之间的依赖关系，准确反映实际的物理和化学关系，使子空间划分更具针对性. 为此根据工艺知识划分得到一级子空间. 为了解决连接变量的子空间划分问题，将连接2个单元的过程变量归纳至相邻的区块，进行粗略划分，以便在不使用完整过程知识的情况下指定数据驱动划分的区域^[19]. 根据该策略，过程变量$ {\boldsymbol{X}}^{m\times n} $在第一层被划分为B块.

(1)$ {\boldsymbol{X}}={\left[{\boldsymbol{X}}_{1}^{\mathrm{T}},{\boldsymbol{X}}_{2}^{\mathrm{T}},\cdots ,{\boldsymbol{X}}_{b}^{\mathrm{T}},\cdots,{\boldsymbol{X}}_{B}^{\mathrm{T}}\right]}^{\mathrm{T}}. $

式中：$ {\boldsymbol{X}}_{b}\in {\mathbf{R}}^{{m}_{b}\times n} $为第一层中包含变量的第b块.

1.1.2. 基于互信息和谱聚类算法的子空间划分

为了更好地表示变量之间的线性和非线性关系，使用互信息(mutual information, MI)和谱聚类算法划分一级子空间^[20]. MI是用于测量2个变量之间的线性和非线性关系的统计技术；谱聚类算法通常考虑变量之间的相似性，特别是在涉及空间或位置相关性的问题上，提高划分的合理性. 过程变量划分工作结束后，变量被初步划分为B块. 通过计算每个区块内每对变量之间的互信息，将这些互信息值合并成矩阵形式，称为互信息矩阵：

(2)$ \begin{split}&{\boldsymbol{R}}_{b}=\\&\left[ \begin{array}{cccc}\boldsymbol{I}\left({\boldsymbol{x}}_{b,1},{\boldsymbol{x}}_{b,1}\right)& \boldsymbol{I}\left({\boldsymbol{x}}_{b,1},{\boldsymbol{x}}_{b,2}\right)& \cdots & \boldsymbol{I}\left({\boldsymbol{x}}_{b,1},{\boldsymbol{x}}_{b,{m}_{b}}\right)\\ \boldsymbol{I}\left({\boldsymbol{x}}_{b,2},{\boldsymbol{x}}_{b,1}\right)& \boldsymbol{I}\left({\boldsymbol{x}}_{b,1},{\boldsymbol{x}}_{b,2}\right)& \cdots & \boldsymbol{I}\left({\boldsymbol{x}}_{b,1},{\boldsymbol{x}}_{b,{m}_{b}}\right)\\\vdots & \vdots & & \vdots \\ \boldsymbol{I}\left({\boldsymbol{x}}_{b,{m}_{b}},{\boldsymbol{x}}_{b,1}\right)& \boldsymbol{I}\left({\boldsymbol{x}}_{b,{m}_{b}},{\boldsymbol{x}}_{b,1}\right)& \cdots & \boldsymbol{I}\left({\boldsymbol{x}}_{b,{m}_{b}},{\boldsymbol{x}}_{b,{m}_{b}}\right)\end{array} \right].\end{split} $

式中：$ \boldsymbol{I}({\boldsymbol{x}}_{b,i},{\boldsymbol{x}}_{b,j}) $为$ {\boldsymbol{x}}_{b,i} $和$ {\boldsymbol{x}}_{b,j} $(i, j=1, 2, ···,$ {m}_{b} $)的MI，$ {\boldsymbol{x}}_{b,i} $为第b个子空间的第i个变量. 根据MI的定义，$ {\boldsymbol{R}}_{b} $矩阵中的每个元素都是非负的，而且$ \boldsymbol{I}({\boldsymbol{x}}_{b,i},{\boldsymbol{x}}_{b,j})=\boldsymbol{I}({\boldsymbol{x}}_{b,j},{\boldsymbol{x}}_{b,i}) $，因此矩阵也是非负的. MI 矩阵是对称的半正矩阵，根据谱聚类算法对$ {\boldsymbol{R}}_{b} $进行特征值分解：

(3)$ \begin{array}{c}{\boldsymbol{R}}_{b}={\boldsymbol{P}}_{b}{\boldsymbol{\varLambda }}_{b}{\boldsymbol{P}}_{b}^{\mathrm{T}}.\end{array} $

式中：$ {\boldsymbol{P}}_{b}\in {\mathbf{R}}^{{m}_{b}\times k} $为第一层第b块的传递矩阵，保留了第一特征向量；$ {\boldsymbol{\varLambda }}_{b} $为对角矩阵；特征值由大到小排列. 数据集$ {\boldsymbol{X}}_{b}\in {\mathbf{R}}^{{m}_{b}\times n} $通过$ {\boldsymbol{P}}_{b}^{\mathrm{T}} $投影到$ {\boldsymbol{Z}}_{b}\in {\mathbf{R}}^{k\times n} $，数据块b的数据通过$ {\boldsymbol{P}}_{b} $投影.

(4)$ \begin{array}{c}{\boldsymbol{Z}}_{b}={\boldsymbol{P}}_{b}^{\mathrm{T}}{\boldsymbol{X}}_{b}.\end{array} $

列向量$ {\boldsymbol{X}}_{b}=[{\boldsymbol{y}}_{1},{\boldsymbol{y}}_{2},\cdots ,{\boldsymbol{y}}_{n}] $，转移矩阵$ {\boldsymbol{P}}_{b}=[{\boldsymbol{p}}_{1}^{\left({b}\right)}, {\boldsymbol{p}}_{2}^{\left({b}\right)}, \cdots ,{\boldsymbol{p}}_{k}^{\left({b}\right)}] $，矩阵$ {\boldsymbol{Z}}_{b} $表示为

(5)$ \begin{array}{c}{\boldsymbol{Z}}_{b}=\left[\begin{array}{cccc}{\boldsymbol{p}}_{1}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{1}& {\boldsymbol{p}}_{1}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{2}& \cdots & {\boldsymbol{p}}_{1}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{n}\\ {\boldsymbol{p}}_{2}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{1}& {\boldsymbol{p}}_{2}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{2}& \cdots & {\boldsymbol{p}}_{2}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{n}\\\vdots & \vdots & & \vdots \\{\boldsymbol{p}}_{l}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{1}& {\boldsymbol{p}}_{l}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{2}& \cdots & {\boldsymbol{p}}_{l}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{n}\\ \vdots & \vdots & & \vdots \\{\boldsymbol{p}}_{k}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{1}& {\boldsymbol{p}}_{k}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{2}& \cdots & {\boldsymbol{p}}_{k}^{\left(b\right)\mathrm{T}}{\boldsymbol{y}}_{n}\end{array}\right].\end{array} $

子空间中$ {\boldsymbol{Z}}_{b} $的第l行为$ {\boldsymbol{Z}}_{b,l}\in {\mathbf{R}}^{1\times n} $(l=1, 2, ···, k)，$ {\boldsymbol{p}}_{l,1}^{\left(b\right)} $为转移矩阵$ {\boldsymbol{P}}_{b} $第l列$ {\boldsymbol{p}}_{l}^{\left(b\right)} $的第一个元素. 逐行扩展$ {\boldsymbol{X}}_{b}=[{\boldsymbol{x}}_{b,1}^{\mathrm{T}},{\boldsymbol{x}}_{b,2}^{\mathrm{T}},\cdots ,{\boldsymbol{x}}_{b,m}^{\mathrm{T}}{]}^{\mathrm{T}} $，$ {\boldsymbol{z}}_{b,l} $被拓展为

(6)$ \begin{array}{c}{\boldsymbol{z}}_{b,l}={\boldsymbol{p}}_{l,1}^{\left(b\right)}{\boldsymbol{x}}_{b,1}+{\boldsymbol{p}}_{l,2}^{\left(b\right)}{\boldsymbol{x}}_{b,2}+\cdots +{\boldsymbol{p}}_{l,{m}_{b}}^{\left(b\right)}{\boldsymbol{x}}_{b,{m}_{b}}.\end{array} $

$ {\boldsymbol{p}}_{l,1}^{\left(b\right)},{\boldsymbol{p}}_{l,2}^{\left(b\right)},\cdots ,{\boldsymbol{p}}_{l,{m}_{b}}^{\left(b\right)} $视为不同过程变量$ {\boldsymbol{x}}_{b,1},{\boldsymbol{x}}_{b,2},\cdots ,{\boldsymbol{x}}_{b,{m}_{b}} $的权重. 同一主成分中权重相近的变量将在子空间中聚类. $ {\boldsymbol{P}}_{b} $为过程变量的权重矩阵，$ {\boldsymbol{P}}_{b}={\boldsymbol{p}}_{b,1}^{\mathrm{T}},{\boldsymbol{p}}_{b,2}^{\mathrm{T}}, \cdots ,{\boldsymbol{p}}_{b,{m}_{b}}^{\mathrm{T}} $ 的第i行$ {\boldsymbol{p}}_{b,i} $视为变量i对整个主成分的贡献. 通过经典的聚类算法可以根据变量所在行的数值将变量划分至相应的类中. 如果利用频谱聚类算法将相应的行归入一个群组，那么对应的过程变量也会被归入一个群组.

1.2. 结合局部离群因子的加权移动窗PCA子空间建模

划分子空间后，基于PCA结合加权移动窗和LOF，在二层子空间的所有子块中建立故障模型.

1.2.1. 加权移动窗口重建数据

将数据标准化后，确定长度为d的移动窗口，为窗口中的数据分配不同的权重. 在时间k−d+1之前引入故障的数据处理：

(7)$ \begin{split}{{w}}_{k}^{{'}}=&{{w}}_{k}{{x}}_{k}+\Delta k+{{w}}_{k-1}{{x}}_{k-1}+\Delta \left(k-1\right)+\cdots+\\&{{w}}_{k-d+1}{{x}}_{k-d+1}+\Delta \left(k-d+1\right).\end{split} $

式中：$ \Delta k $、$ \Delta (k-1) $和$ \Delta (k-d+1) $均为故障产生的时刻偏差；$ {{w}}_{k} $为归一化后窗口中数据的权重，

(8)$ {{w}}_{k}=\frac{{{x}}_{k}}{{{x}}_{k}^{{'}}}\times 100{\text{%}}. $

1.2.2. PCA及主元素概率密度函数计算

对处理后的数据进行主成分分析，在每个子空间建立PCA模型^[21]. 通过核密度估计得到降维后的主元素概率密度函数. 核密度估计式^[22]为

(9)$ \stackrel{\wedge }{{f}_{h}}\left(x\right)=\frac{1}{n}\sum _{i=1}^{n}{{K}}_{h}\left(x-{x}_{i}\right)=\frac{1}{nh}\sum _{i=1}^{n}{K}\left(\frac{x-{x}_{i}}{h}\right). $

式中：$ \stackrel{\wedge }{{f}_{h}} $为估计的概率密度函数，n为样本点数，K(·)为核函数，h>0为带宽. 核函数选择高斯核函数，表达式为

(10)$ K\left(x\right)=\frac{1}{\sigma \sqrt{2{\text{π}}}}\mathrm{exp}\left(-\frac{(x-\mu {)}^{2}}{2{\sigma }^{2}}\right). $

h的近似值由平均综合平方误差MISE决定，即最小化L2损失函数.

1.2.3. 结合局部离群因子计算控制限

降秩矩阵由LOF处理，得到 LOF值后，将LOF值作为统计量使用，结合概率密度函数得到相应的控制限值TC. 数据$ {x}_{i} $的局部离群因子表达式^[23]为

(11)$ {\mathrm{LOF}}\left({x}_{i}\right)=\frac{1}{k}\sum _{f=1}^{k}\frac{{\rm{LRD}}\left({x}_{i}^{f}\right)}{{\rm{LRD}}\left({x}_{i}\right)}. $

式中：k为数据个数，$ {x}_{i}^{f} $为$ {x}_{i} $的第f个近邻，$ {\rm{LRD}}\left({x}_{i}\right) $为数据$ {x}_{i} $的局部可访问密度.

1.3. 贝叶斯统计融合决策

使用贝叶斯推断对所有子空间的统计数据进行统计合并，得出监测结果. 与J相对应的子空间$ {\boldsymbol{x}}_{b} $的故障概率计算式^[24]为

(12)$ {\boldsymbol{P}}\left({\mathrm{F}}|{\boldsymbol{X}}_{b}\right)=\frac{{\boldsymbol{P}}\left({\boldsymbol{X}}_{b}|{\mathrm{F}}\right){{\boldsymbol{P}}}\left({\mathrm{F}}\right)}{{{\boldsymbol{P}}}\left({\boldsymbol{X}}_{b}\right)}, $

(13)$ \begin{array}{c}{\boldsymbol{P}}\left({\boldsymbol{X}}_{b}\right)={\boldsymbol{P}}\left({\boldsymbol{X}}_{b}|{\mathrm{N}}\right){\boldsymbol{P}}\left({\mathrm{N}}\right)+{\boldsymbol{P}}\left({\boldsymbol{X}}_{b}|{\mathrm{F}}\right){\boldsymbol{P}}\left({\mathrm{F}}\right).\end{array} $

条件概率$ {\boldsymbol{P}}\left({{\boldsymbol{X}}}_{b}\right|{\mathrm{N}}) $和$ {{\boldsymbol{P}}}\left({{\boldsymbol{X}}}_{b}\right|{\mathrm{F}}) $的表达式分别为

(14)$ {\boldsymbol{P}}\left({\boldsymbol{X}}_{b}\right|{\mathrm{N}})=\mathrm{exp}\left(-\frac{{\boldsymbol{J}}_{b,\mathrm{n}\mathrm{e}\mathrm{w}}}{{\boldsymbol{J}}_{b,\mathrm{l}\mathrm{i}\mathrm{m}}}\right), $

(15)$ {\boldsymbol{P}}\left({\boldsymbol{X}}_{b}\right|{\mathrm{F}})=\mathrm{exp}\left(-\frac{{\boldsymbol{J}}_{b,\mathrm{l}\mathrm{i}\mathrm{m}}}{{\boldsymbol{J}}_{b,\mathrm{n}\mathrm{e}\mathrm{w}}}\right). $

式中：N、F分别表示正常状态和故障状态；$ {\boldsymbol{P}}\left({\mathrm{N}}\right) $、$ {\boldsymbol{P}}_{J}\left({\mathrm{F}}\right) $分别代表正常和故障条件下的先验概率；当确定置信度为$ \varepsilon $时，$ {\boldsymbol{P}}\left({\mathrm{N}}\right) $=$ \varepsilon $、$ {\boldsymbol{P}}\left({\mathrm{F}}\right) $=1–$ \varepsilon $；$ {\boldsymbol{J}}_{b,{\mathrm{new}}} $为在线检测的数据集中第b个子块的统计数据. 通过贝叶斯推理将所有不同子区块的检测结果合并，计算联合统计量之和^[20]：

(16)$ {\mathrm{BIC}}={\sum} _{b=1}^{B}\left\{\frac{{\boldsymbol{P}}\left({\boldsymbol{X}}_{b}\right){\boldsymbol{P}}\left({\mathrm{F}}|{\boldsymbol{X}}_{b}\right)}{{\displaystyle\sum} _{b=1}^{B}{\boldsymbol{P}}\left({\boldsymbol{X}}_{b}|{\mathrm{F}}\right)}\right\}. $

当$ \rm{BIC} $超过之前构建的统计置信限时，认为发生了故障；否，则认为无故障，系统正常运行.

1.4. 离线建模和在线监测程序

1.4.1. 离线建模

1）训练数据标准化. 2）根据粗略获得的过程知识将过程变量划分为第一层子空间，通过MI谱聚类算法进一步划分第二层子空间，选择最优聚类数. 3）对经过预处理的数据使用加权移动窗进行重构. 在划定的第二层子空间中构建PCA-LOF（缩写为PL）检测模型，得到各子空间的检测结果. 4）通过贝叶斯推理融合得到联合统计量$ \rm{BIC} $，计算最终的控制限，将各子空间的监测结果用于信息融合决策，实现整个系统的全面监测.

1.4.2. 在线监测

将标准化后的测试数据输入，根据离线建模阶段生成的模型，生成联合统计量$ \rm{BIC}_{{\mathrm{new}}} $与控制限值进行比较，以判断故障是否发生. 离线建模和在线检测程序示意图如图1所示.

图 1

新窗口打开| 下载原图ZIP| 生成PPT

图 1 基于多子空间加权移动窗主成分分析模型示意图

Fig.1 Schematic diagram of multiple subspace weighted moving window PCA model

2. 案例分析

2.1. 田纳西-伊斯曼过程简介与仿真设置

将所提方法在田纳西-伊斯曼过程(Tennessee Eastman process, TEP)仿真平台上进行验证. TEP是Downs等^[25-26]利用化学工程过程的真实数据开发的过程控制案例. 模拟数据有22种类型，包括正常情景和21种不同类型的故障,每种故障案例共960个样本，且都从第 161个样本点引入故障. 过程包含12个操纵变量、22个连续过程变量和19个组成变量.

为了验证所提算法的通用性，针对早期故障的准确性和及时性，选取属于工业过程中不同类型的故障（阶跃类型的故障4、随机振荡类型的故障8、慢漂移类型的故障13和未知类型的故障18）作为一组实验数据，尽量包含更多实际的数据类型. 实验数据分别使用4种对照算法检测，分析故障的检测结果. 对照组算法按照多元统计分析针对早期故障检测的性能增强逻辑选择，即常规多元统计分析算法、引入滑动窗口的早期故障增强多元统计分析算法、使用分布式的多元统计分析算法以及综合性算法. 4种算法分别是主成分分析、局部离群因子的加权移动窗主成分分析(W-PL)、结合局部离群因子的多子空间主成分分析(M-PL)、多子空间加权移动窗主成分分析(M-WP). 在对照组算法中，分布式方案通常选取TEP的前52个变量建立模型. 过程变量经过双层子空间划分后的分布结果如表1所示. 第一层的初级子空间依据粗略获得的过程知识划分，无法准确划分的连接变量被直接同时划分到不同子空间中；随后由MI与谱聚类算法对第一层的初级子空间再次划分，得到第二层子空间划分结果.

表 1 田纳西-伊斯曼过程的双层子空间划分结果

Tab.1 Two-layer subspace partitioning results of Tennessee Eastman process

区块	第一层	子区块	第二层
1	$ {x}_{1}-{x}_{9},{x}_{11}-{x}_{13},{x}_{15},{x}_{16},{x}_{18}, {x}_{20}-{x}_{28},{x}_{42}-{x}_{46},{x}_{51},{x}_{52} $	1.1	$ {x}_{1},{x}_{2},{x}_{12},{x}_{15},{x}_{21},{x}_{42},{x}_{44},{x}_{45} $
		1.2	$ {x}_{3},{x}_{6},{x}_{24},{x}_{27},{x}_{43},{x}_{51} $
		1.3	$ {x}_{4},{x}_{5},{x}_{8},{x}_{9},{x}_{11},{x}_{22},{x}_{23},{x}_{25},{x}_{26},{x}_{28},{x}_{52} $
		1.4	$ {x}_{7},{x}_{13},{x}_{16}{x}_{18},{x}_{20},{x}_{46},{x}_{52} $
2	$ {x}_{5},{x}_{6},{x}_{10}-{x}_{16},{x}_{18},{x}_{20},{x}_{22},{x}_{29}-{x}_{36},{x}_{46}-{x}_{48},{x}_{52} $	2.1	$ {x}_{5},{x}_{11},{x}_{14},{x}_{15},{x}_{22},{x}_{29}-{x}_{36},{x}_{52} $
2		2.2	$ {x}_{6},{x}_{10},{x}_{12},{x}_{13},{x}_{16},{x}_{18},{x}_{20},{x}_{46}-{x}_{50} $
3	$ {x}_{4},{x}_{5},{x}_{14}-{x}_{20},{x}_{37}-{x}_{41},{{x}_{45},x}_{46},{x}_{48}-{x}_{50} $	3.1	$ {x}_{4},{x}_{5},{x}_{14}-{x}_{20},{x}_{37}-{x}_{41},{x}_{45},{x}_{46},{x}_{48}-{x}_{50} $

新窗口打开| 下载CSV

2.2. 仿真结果与分析

针对故障4，4种故障检测模型的仿真结果如图2所示. TEP的采样点共960个，纵轴代表各模型的实时统计量，其中T²衡量样本在主成分空间中的位置，反映投影相对于总体平均的偏差；SPE衡量样本在残差空间的位置，反映样本中未被主成分模型捕获部分的偏差；lof为模型在线检测时某一时刻各变量的LOF参数之和，lof越大代表样本点与正常样本差异越大；BIC取值范围为[0, 1.0]，取值越接近1.0代表该采样时刻各子空间中的数据超限越多，故障越明显. 图中虚线为对应检测模型的控制限，当曲线超过控制限时，检测模型会发出警报. 可以看出，PCA 的T²统计量漏报率过高，SPE 统计量虽然漏报率为0，但误报率明显高于其他模型；W-PL的误报、漏报率相较PCA都有明显改善，M-PL的误报率相较PCA有明显降低； M-WP的误报率和漏报率在W-PL的基础上进一步降低，该方法的性能明显优于其他方法. 由于故障4是阶跃型故障，4种算法的故障检出点基本一致，没有明显变化.

图 2

新窗口打开| 下载原图ZIP| 生成PPT

图 2 故障4基于不同算法的仿真结果

Fig.2 Simulation results of fault 4 based on different algorithms

针对故障13，4种故障检测模型的仿真结果如图3 所示. 可以看出，PCA 的 SPE 统计量漏报率较低，但误报率明显高于其他模型；W-PL误报率为0，同时漏报率也有所降低，M-PL漏报率再次降低，误报却有所提升；M-WP在漏报率结果相对优秀的情况下，有效降低了误报率，综合精度最优. 故障13的检出点显示，PCA的T²统计量和SPE 统计量分别为第211和205个检测点，W-PL和M-PL的检测点分别为第190和199个检测点，M-WP的故障检测点为第187个. 由检测点对比可以看出，所提方法的灵敏度明显优于对照组算法.

图 3

新窗口打开| 下载原图ZIP| 生成PPT

图 3 故障13基于不同算法的仿真结果

Fig.3 Simulation results of fault 13 based on different algorithms

故障8、18的仿真结果分别如图4和图5所示. M-WP在检测随机振荡类型的故障8时，在保持误报率优秀的情况下，漏报率降低明显，检测准确率优于其他3种算法；在检测未知类型的故障18时，误报率和漏报率均明显的降低，综合准确率也是4种算法中最优的. 故障8和故障18的故障检出点均明显提前. 故障8相对于对照组的3种算法，一般有11~21个单位的检出点提前；故障18的提前效果更加明显，相对于对照组的3种算法，检出点提前大约为50个点位.

图 4

新窗口打开| 下载原图ZIP| 生成PPT

图 4 故障8基于不同算法的仿真结果

Fig.4 Simulation results of fault 8 based on different algorithms

图 5

新窗口打开| 下载原图ZIP| 生成PPT

图 5 故障18基于不同算法的仿真结果

Fig.5 Simulation results of fault 18 based on different algorithms

故障误报率（false alarm rate, FAR）是指在引入故障之前的正常工况下（采样点1~160），统计量超过控制限导致错误报警的比例；故障检测率（fault detection rate，FDR）是指在故障工况下（采样点161~960），统计量超出控制限时系统正常预警的比例. 故障检测模型的FAR越小，代表误报警次数越少；FDR越大，代表模型的检测效果越好. 故障4、8、13、18检测的详细数据结果如表2所示，4种算法对21种故障检测的平均准确率如下：PCA的T²和SPE统计量分别为64.1%与75.4%，W-PL为75.2%，M-PL为76.1%，所提算法M-WP为82.3%. 所提方法的平均准确率远高于PCA、W-PL和M-PL. M-WP在任意测试集上的故障检出点都比对照组算法的提前数个至数十个点位. 综上所述，所提方法在检测早期故障方面具有很大优势，能够在保证算法通用性的前提下，有效提高算法针对早期故障的检测性能.

表 2 故障工况的误报率和故障检测率

Tab.2 False alarm and fault detection rates for faults condition %

算法	统计参数	故障4		故障8		故障13		故障18
算法	统计参数	FAR	FDR	FAR	FDR	FAR	FDR	FAR	FDR
PCA	$ {T}^{2} $	2.50	49.63	1.25	97.37	1.87	90.03	3.12	87.52
PCA	$ \mathrm{S}\mathrm{P}\mathrm{E} $	13.13	100	16.87	97.75	10.04	92.64	12.52	89.89
W-PL	$ \mathrm{l}\mathrm{o}\mathrm{f} $	2.76	99.25	3.45	97.25	0	94.28	6.21	89.27
M-PL	BIC	8.13	100	7.50	97.88	5.00	95.21	5.62	89.14
M-WP	BIC	0.70	99.88	1.92	99.11	1.92	95.93	3.20	91.61

新窗口打开| 下载CSV

3. 结　语

为了有效提升全流程过程中早期故障检测的性能，提出基于多子空间加权移动窗主成分分析的监测方法，用于全厂过程的早期故障检测. 基于过程知识和数据驱动的双层子空间划分框架将早期故障的监测视角从全局变为局部；在处理数据时使用加权滑动窗口，实现了窗口中数据的信号增强和差异化处理；考虑数据集的局部和全局属性，构建基于PL的统计量，比较检测数据与参考模型之间的差异；在TEP中测试所提方法的性能. 所提方法能够针对全厂流程中的早期故障进行有效检测. 相比传统多元统计分析方法，所提方法在准确率提升的前提下，检测的灵敏度大幅提升. 所提模型对某些特定的微小故障的检测率欠佳，原因可能在于无法分离出导致微小故障发生的因果变量与受到耦合作用影响的其他变量，导致因果变量的变化被掩盖. 下一步研究计划针对微小早期故障的因果变量分离、减弱耦合作用影响，实现全类型早期故障的高准确率检测.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

SILVA A F, VERCRUYSSE J, VERVAET C, et al

In-depth evaluation of data collected during a continuous pharmaceutical manufacturing process: a multivariate statistical process monitoring approach

[J]. Journal of Pharmaceutical Sciences, 2019, 108 (1): 439- 450

DOI:10.1016/j.xphs.2018.07.033 [本文引用: 1]

[2]

TAO Y, SHI H, SONG B, et al

A distributed adaptive monitoring method for performance indicator in large-scale dynamic process

[J]. IEEE Transactions on Industrial Informatics, 2023, 19 (10): 10425- 10433

DOI:10.1109/TII.2023.3240732

[3]

LIU D, SHANG J, CHEN M

Principal component analysis-based ensemble detector for incipient faults in dynamic processes

[J]. IEEE Transactions on Industrial Informatics, 2021, 17 (8): 5391- 5401

DOI:10.1109/TII.2020.3031496 [本文引用: 1]

[4]

贾瑶, 李帅, 柴天佑

金矿生产全流程控制系统设计与实现

[J]. 控制工程, 2022, 29 (5): 873- 887

[本文引用: 1]

JIA Yao, LI Shuai, CHAI Tianyou

Design and implementation of whole process control system for gold ore production

[J]. Control Engineering of China, 2022, 29 (5): 873- 887

[本文引用: 1]

[5]

ZHOU J, ZHANG S, WANG J

A dual robustness projection to latent structure method and its application

[J]. IEEE Transactions on Industrial Electronics, 2021, 68 (2): 1604- 1614

DOI:10.1109/TIE.2020.2970664 [本文引用: 1]

[6]

MA J, ZHANG J

Progress of process monitoring for the multi-mode process: a review

[J]. Applied Sciences, 2022, 12 (14): 7207

DOI:10.3390/app12147207 [本文引用: 1]

[7]

WANG B, YAN X, JIANG Q, et al

Generalized dice’s coefficient-based multi-block principal component analysis with bayesian inference for plant-wide process monitoring

[J]. Journal of Chemometrics, 2015, 29 (3): 165- 178

DOI:10.1002/cem.2687 [本文引用: 1]

[8]

CHEN X, WANG J, DING S X

Complex system monitoring based on distributed least squares method

[J]. IEEE Transactions on Automation Science and Engineering, 2021, 18 (14): 1892- 1900

[本文引用: 1]

[9]

JIANG Q, YAN X, HUANG B

Performance-driven distributed PCA process monitoring based on fault-relevant variable selection and bayesian inference

[J]. IEEE Transactions on Industrial Electronics, 2015, 63 (1): 377- 386

[本文引用: 1]

[10]

KONG X, YANG Z, LUO J, et al

Extraction of reduced fault subspace based on KDICA and its application in fault diagnosis

[J]. IEEE Transactions on Instrumentation and Measurement, 2022, 71: 3505212

[本文引用: 1]

[11]

王光, 单发顺, 钱禹丞, 等

基于集成学习传递熵的化工过程微小故障检测方法

[J]. 化工学报, 2023, 74 (7): 2967- 2978

[本文引用: 1]

WANG Guang, SHAN Fashun, QIAN Yucheng, et al

Incipient fault detection method for chemical process based on ensemble learning transfer entropy

[J]. CIESC Journal, 2023, 74 (7): 2967- 2978

[本文引用: 1]

[12]

CHEN Z, YANG C, PENG T, et al

A cumulative canonical correlation analysis-based sensor precision degradation detection method

[J]. IEEE Transactions on Industrial Electronics, 2019, 8 (66): 6321- 6330

[本文引用: 1]

[13]

WONG P K, YANG Z, VONG C M, et al

Real-time fault diagnosis for gas turbine generator systems using extreme learning machine

[J]. Neurocomputing, 2014, 128: 249- 257

[本文引用: 1]

[14]

DENG X, CAI P, CAO Y, et al

Two-step localized kernel principal component analysis based incipient fault diagnosis for nonlinear

[J]. Industrial and Engineering Chemistry Research, 2020, 59 (13): 5956- 5968

DOI:10.1021/acs.iecr.9b06826 [本文引用: 1]

[15]

PILARIO K E S, CAO Y

Canonical variate dissimilarity analysis for process incipient fault detection

[J]. IEEE Transactions on Industrial Informatics, 2018, 14 (12): 5308- 5315

DOI:10.1109/TII.2018.2810822 [本文引用: 1]

[16]

QIN Y, YAN Y, JI H, et al

Recursive correlative statistical analysis method with sliding windows for incipient fault detection

[J]. IEEE Transactions on Industrial Electronics, 2022, 69 (4): 4185- 4194

DOI:10.1109/TIE.2021.3070521 [本文引用: 1]

[17]

FENG Z, LI Y, XIAO B, et al

Process monitoring of abnormal working conditions in the zinc roasting process with an ALD-based LOF-PCA method

[J]. Process Safety and Environmental Protection, 2022, 161: 640- 650

DOI:10.1016/j.psep.2022.03.064 [本文引用: 1]

[18]

ZENG J, HUANG W, WANG Z, et al

Mutual information-based sparse multiblock dissimilarity method for incipient fault detection and diagnosis in plant-wide process

[J]. Journal of Process Control, 2019, 83: 63- 76

DOI:10.1016/j.jprocont.2019.09.004 [本文引用: 1]

[19]

CAO Y, YUAN X, WANG Y, et al

Hierarchical hybrid distributed PCA for plant-wide monitoring of chemical processes

[J]. Control Engineering Practice, 2021, 111: 104784

DOI:10.1016/j.conengprac.2021.104784 [本文引用: 1]

[20]

BROWN G, POCOCK A, ZHAO M J, et al

Conditional likelihood maximisation: a unifying framework for information theoretic feature selection

[J]. The Journal Of Machine Learning Research, 2012, 13 (1): 27- 66

[本文引用: 2]

[21]

AMIN M T, KHAN F, AHMED S, et al

A data-driven Bayesian network learning method for process fault diagnosis

[J]. Process Safety and Environmental Protection, 2021, 150: 110- 122

DOI:10.1016/j.psep.2021.04.004 [本文引用: 1]

[22]

CHEN H, JIANG B, ZHANG T, et al

Data-driven and deep learning-based detection and diagnosis of incipient faults with application to electrical traction systems

[J]. Neurocomputing, 2020, 396: 429- 437

DOI:10.1016/j.neucom.2018.07.103 [本文引用: 1]

[23]

KONG X, BI Y, GLASS D

Detecting anomalies in sequential data augmented with new features

[J]. Artificial Intelligence Review, 2020, 53 (1): 625- 652

DOI:10.1007/s10462-018-9671-x [本文引用: 1]

[24]

JIANG Q, YAN X

Nonlinear plant-wide process monitoring using MI-spectral clustering and Bayesian inference-based multiblock KPCA

[J]. Journal of Process Control, 2015, 32: 38- 50

DOI:10.1016/j.jprocont.2015.04.014 [本文引用: 1]

[25]

DOWNS J J, VOGEL E F

A plant-wide industrial process control problem

[J]. Computers and Chemical Engineering, 1993, 17 (3): 245- 255

DOI:10.1016/0098-1354(93)80018-I [本文引用: 1]

[26]

HE Y L, LI K, LIANG L L, et al

Novel discriminant locality preserving projection integrated with Monte Carlo sampling for fault diagnosis

[J]. IEEE Transactions on Reliability, 2023, 72 (1): 166- 176

DOI:10.1109/TR.2021.3115108 [本文引用: 1]

In-depth evaluation of data collected during a continuous pharmaceutical manufacturing process: a multivariate statistical process monitoring approach

2019

... 在现代工业流程中，可靠的早期故障检测对于确保流程安全和产品质量非常重要. 多元统计分析是工业控制系统监测中应用最广泛的方法^[1-3]. 常用的多元统计分析算法^[4-5]包括主成分分析法(principal component analysis, PCA)、偏最小二乘法(partial least square, PLS)、独立成分分析法(independent components analysis, ICA)等. ...

A distributed adaptive monitoring method for performance indicator in large-scale dynamic process

2023

Principal component analysis-based ensemble detector for incipient faults in dynamic processes

2021

金矿生产全流程控制系统设计与实现

2022

金矿生产全流程控制系统设计与实现

2022

A dual robustness projection to latent structure method and its application

2021

Progress of process monitoring for the multi-mode process: a review

2022

... 控制单元的数量和变量复杂，因此传统的多参数监测方法对早期故障的检测效果不理想. 分布式方法避免了直接从复杂的全厂流程中检测早期故障，能够提高检测的准确性^[6]. 分布式方案通常包括3个步骤：子空间划分、子空间模型的建立和信息融合决策. 1）多子空间划分一般分为2种方法：知识型和数据驱动型. 知识型方法通常根据过程知识或专家经验将过程变量划分成块. 数据驱动型方法分为2类，一类根据变量之间的相关性划分子空间，如Wang等^[7]使用负载矩阵的广义骰子系数来划分过程变量，形成多子空间监控框架；另一类根据故障类型区分过程变量^[8]，如Jiang等^[9]提出基于故障相关变量选择的分布式PCA监控方法，可根据工业流程中的故障类型划分过程变量. 知识型或数据驱动型方法进行子空间划分忽略了过程信息与相应操作单元物理位置之间的相关性，分布式方案中子空间可能不是最佳划分. 2）子空间监测领域的现有方法包括常规分析方法^[10]、统计方法^[11-12]和智能方法^[13]. 其中基于统计分析的检测方法完全依赖系统的过程数据，无需深入了解系统的内部结构，使用效率高，是早期故障检测领域应用较广泛的技术. Deng等^[14]提出基于核PCA的两步局部信息挖掘框架，用于非线性的早期故障检测和隔离. Pilario等^[15]提出典型变量分析(canonical variate analysis, CVA)的扩展，利用典型变量相异分析(canonical variate dissimilarity analysis, CVDA)来检测早期故障. 早期故障特征微弱，增大故障断层偏移量有助于检测工作的开展，滑动窗口法是被证明的有效方法. Qin等^[16]提出将相关统计分析和滑动窗口技术相结合的新算法，增强了早期故障的微弱特征，实现了早期故障的检测. 关注数据的局部特征也可以增强早期故障的检测能力，其中基于密度的异常检测方法能够在确定置信区域时避免过程数据服从正态分布的假设，并在确定置信区域时减少训练数据中离群值的影响^[17]. 3）在信息融合决策方面，一般采用贝叶斯推理方法对所有子空间的检测结果进行融合，实现全厂过程检测结果的集成^[18]. ...

Generalized dice’s coefficient-based multi-block principal component analysis with bayesian inference for plant-wide process monitoring

2015

Complex system monitoring based on distributed least squares method

2021

Performance-driven distributed PCA process monitoring based on fault-relevant variable selection and bayesian inference

2015

Extraction of reduced fault subspace based on KDICA and its application in fault diagnosis

2022

基于集成学习传递熵的化工过程微小故障检测方法

2023

基于集成学习传递熵的化工过程微小故障检测方法

2023

A cumulative canonical correlation analysis-based sensor precision degradation detection method

2019

Real-time fault diagnosis for gas turbine generator systems using extreme learning machine

2014

Two-step localized kernel principal component analysis based incipient fault diagnosis for nonlinear

2020

Canonical variate dissimilarity analysis for process incipient fault detection

2018

Recursive correlative statistical analysis method with sliding windows for incipient fault detection

2022

Process monitoring of abnormal working conditions in the zinc roasting process with an ALD-based LOF-PCA method

2022

Mutual information-based sparse multiblock dissimilarity method for incipient fault detection and diagnosis in plant-wide process

2019

Hierarchical hybrid distributed PCA for plant-wide monitoring of chemical processes

2021

... 分布式方案须将过程变量划分为不同的相关区块. 基于过程知识划分，过程变量可以保留同一区块内变量之间的依赖关系，准确反映实际的物理和化学关系，使子空间划分更具针对性. 为此根据工艺知识划分得到一级子空间. 为了解决连接变量的子空间划分问题，将连接2个单元的过程变量归纳至相邻的区块，进行粗略划分，以便在不使用完整过程知识的情况下指定数据驱动划分的区域^[19]. 根据该策略，过程变量

$ {\boldsymbol{X}}^{m\times n} $

在第一层被划分为B块. ...

Conditional likelihood maximisation: a unifying framework for information theoretic feature selection

2012

... 为了更好地表示变量之间的线性和非线性关系，使用互信息(mutual information, MI)和谱聚类算法划分一级子空间^[20]. MI是用于测量2个变量之间的线性和非线性关系的统计技术；谱聚类算法通常考虑变量之间的相似性，特别是在涉及空间或位置相关性的问题上，提高划分的合理性. 过程变量划分工作结束后，变量被初步划分为B块. 通过计算每个区块内每对变量之间的互信息，将这些互信息值合并成矩阵形式，称为互信息矩阵： ...

... 式中：N、F分别表示正常状态和故障状态；

$ {\boldsymbol{P}}\left({\mathrm{N}}\right) $

、

$ {\boldsymbol{P}}_{J}\left({\mathrm{F}}\right) $

分别代表正常和故障条件下的先验概率；当确定置信度为

$ \varepsilon $

时，

$ {\boldsymbol{P}}\left({\mathrm{N}}\right) $

$ \varepsilon $

、

$ {\boldsymbol{P}}\left({\mathrm{F}}\right) $

=1–

$ \varepsilon $

；

$ {\boldsymbol{J}}_{b,{\mathrm{new}}} $

为在线检测的数据集中第b个子块的统计数据. 通过贝叶斯推理将所有不同子区块的检测结果合并，计算联合统计量之和^[20]： ...

A data-driven Bayesian network learning method for process fault diagnosis

2021

... 对处理后的数据进行主成分分析，在每个子空间建立PCA模型^[21]. 通过核密度估计得到降维后的主元素概率密度函数. 核密度估计式^[22]为 ...

Data-driven and deep learning-based detection and diagnosis of incipient faults with application to electrical traction systems

2020

... 对处理后的数据进行主成分分析，在每个子空间建立PCA模型^[21]. 通过核密度估计得到降维后的主元素概率密度函数. 核密度估计式^[22]为 ...

Detecting anomalies in sequential data augmented with new features

2020

... 降秩矩阵由LOF处理，得到 LOF值后，将LOF值作为统计量使用，结合概率密度函数得到相应的控制限值TC. 数据

$ {x}_{i} $

的局部离群因子表达式^[23]为 ...

Nonlinear plant-wide process monitoring using MI-spectral clustering and Bayesian inference-based multiblock KPCA

2015

... 使用贝叶斯推断对所有子空间的统计数据进行统计合并，得出监测结果. 与J相对应的子空间

$ {\boldsymbol{x}}_{b} $

的故障概率计算式^[24]为 ...

A plant-wide industrial process control problem

1993

... 将所提方法在田纳西-伊斯曼过程(Tennessee Eastman process, TEP)仿真平台上进行验证. TEP是Downs等^[25-26]利用化学工程过程的真实数据开发的过程控制案例. 模拟数据有22种类型，包括正常情景和21种不同类型的故障,每种故障案例共960个样本，且都从第 161个样本点引入故障. 过程包含12个操纵变量、22个连续过程变量和19个组成变量. ...

Novel discriminant locality preserving projection integrated with Monte Carlo sampling for fault diagnosis

2023

〈

〉