基于最大均值差异的多模态过程过渡模态识别方法

doi:10.3785/j.issn.1008-973X.2021.03.017

基于最大均值差异的多模态过程过渡模态识别方法

任超^,, 阎高伟^,, 程兰, 王芳

太原理工大学电气与动力工程学院，山西太原 030024

Transition mode identification method based on maximum mean discrepancy for multimode process

REN Chao^,, YAN Gao-wei^,, CHENG Lan, WANG Fang

College of Electrical and Power Engineering, Taiyuan University of Technology, Taiyuan 030024, China

通讯作者: 阎高伟，男，教授，博士. orcid.org/0000-0001-9714-0971. E-mail： yangaowei@tyut.edu.cn

收稿日期: 2019-10-15

基金资助:

国家自然科学基金资助项目（61973226，61603267）；山西省科技重大专项资助项目（20181102017）; 山西省重点研发计划项目（201903D121143）

Received: 2019-10-15

Fund supported:

国家自然科学基金资助项目（61973226，61603267）；山西省科技重大专项资助项目（20181102017）;山西省重点研发计划项目（201903D121143）

作者简介 About authors

任超（1996—），男，硕士生，从事过程建模研究.orcid.org/0000-0002-5191-8570.E-mail：m15988842972@163.com , E-mail：m15988842972@163.com

摘要

为了更好地揭示多模态过程的运行状态和数据分布变化规律，提高后续建模精度，提出基于最大均值差异（MMD）的多模态过程的过渡模态识别方法. 引入滑动窗口对数据进行切割，使用最大均值差异对多模态过程数据的分布差异进行度量，通过与稳定模态阈值α比较区分过程数据的稳定模态和过渡模态. 在过渡模态段内减小滑动窗口窗宽，利用过渡模态阈值β识别出过渡子模态. 数值仿真实验的模态识别结果表明，所提方法可以准确检测出输入变量期望值的阶跃变化，实现对模态的准确识别. 田纳西伊斯曼（TE）过程仿真数据实验表明，所提方法可以有效地划分出合理的模态，进而选择出分布最相近的历史模态建模，提高多模态过程的软测量建模精度.

关键词： 模态识别 ; 多模态过程 ; 最大均值差异 ; 数据分布 ; 滑动窗口

Abstract

A transition mode identification method based on maximum mean discrepancy (MMD) was proposed in order to better reveal the law of the operating state and the process data distributional variation of a multi-mode process, and further improve the accuracy of subsequent modeling. Firstly, the sliding window technique was introduced to segment process data, and the MMD was used to measure the distribution difference of the process data. The stable mode and transition mode of the process data were distinguished by comparing the MMD with the stable modal threshold α. Secondly, the width of the sliding window was reduced in transition mode segments, and a transition mode threshold β was used to identify the transition modes. The modal identification results of numerical simulation experiments show that the proposed method can achieve the goal of detecting the step change of the expected value of the input variables and identifying the transient modes. Tennessee Eastman (TE) process simulation data experiments show that the proposed method can effectively divide reasonable modes, select the historical mode modeling with the closest distribution, and improve the soft sensor modeling accuracy of multi-modal processes.

Keywords： mode identification ; multi-mode process ; maximum mean discrepancy ; data distribution ; sliding window

PDF (1350KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

任超, 阎高伟, 程兰, 王芳. 基于最大均值差异的多模态过程过渡模态识别方法. 浙江大学学报(工学版)[J], 2021, 55(3): 563-570 doi:10.3785/j.issn.1008-973X.2021.03.017

REN Chao, YAN Gao-wei, CHENG Lan, WANG Fang. Transition mode identification method based on maximum mean discrepancy for multimode process. Journal of Zhejiang University(Engineering Science)[J], 2021, 55(3): 563-570 doi:10.3785/j.issn.1008-973X.2021.03.017

基于数据驱动的过程监控和软测量已经成为工业应用研究的重要领域^[1-3]. 当操作条件、外界环境、过程本身固有因素或者特定需求发生变化时，工业生产过程呈现多模态特征^[4]. 为了更好地描述多模态过程的特性，在过程建模前须对多模态数据进行模态识别，即对没有模态指示信息的数据进行类别划分. 模态识别是建立多模态过程监控和软测量的首要前提^[5].

现阶段，针对工业多模态过程数据不同的分布特性，许多聚类方法应用在模态识别中^[6-7]. Du等^[8]采用K-means聚类进行模态识别，提取所有模态的共同特征和特有特征后对多模态数据进行建模. K-means方法在对含有过渡过程数据进行模态识别时结果会变差^[9]. 模糊C均值聚类（fuzzy C-means，FCM）在K-means聚类基础上，引入隶属度进行软划分. Zhang等^[10]在离线建模过程中采用核模糊C均值聚类算法，将多模态数据分为C个模糊组，对各模态建立KPCA模型. 当数据呈现线性可分或超球面形状时，利用FCM进行模态识别可以取得较好的效果. 高斯混合模型（Gaussian mixture model，GMM）可以拟合任意分布的数据. Jiang等^[11]在多模态过程监控中，假设每一模态对应一个高斯分量，利用高斯混合模型进行模态识别. 但工业过程中过渡数据会影响高斯密度函数的参数，导致参数优化收敛的不稳定^[12].

基于窗口的模态识别方法被提出^[13-14]来获取局部数据变化信息，进而更好地表征模态变化关系. Zheng等^[15]计算滑动窗口数据的PLS相似因子对多模态过程稳定模态进行识别；针对过渡模态的识别问题，张淑美等^[16]对窗口均值向量进行聚类，实现稳定模态和过渡模态的识别，解决聚类算法参数选取不准确造成的稳定模态被埋没现象；Song等^[17]针对局部样本间关系，扩展原始样本后引入局部异常因子，提取局部样本密度信息来判断稳定模态和过渡模态；考虑到工业过程不同阶段样本间不同的依赖性，He等^[18]利用基于互信息的相似度识别稳定模态和过渡模态. 上述方法在一定程度实现了稳定模态和过渡模态的识别，但过渡模态是从一种稳定运行模式向另一种稳定运行模式渐进式量变^[19]，在复杂工业过程中过渡模态的过程特性在不同阶段会呈现分段性变化，在识别过渡模态后进行子模态的识别分析是有必要的.

Tan等^[20]认为多模态过程潜在变量相关关系跟随模态变化呈现分段性，利用窗口数据的负载矩阵相似度进行模态识别，在对稳定模态过渡模态进行粗划分后进一步对过渡模态细划分出过渡子模态，所提方法中的相似度基于欧氏距离定义，而PCA提取子空间即负载矩阵属于格拉斯曼流形，是特殊的黎曼空间，属于非欧式空间^[21]. 利用欧氏距离度量非欧式空间的相似度，可能导致时序下的模态识别不准确. 在多模态工业过程中，合适的度量指标对实现模态识别是至关重要的.

本研究提出基于最大均值差异的多模态过渡模态识别方法. 引入最大均值差异作为局部数据分布度量指标，刻画数据概率分布的均值和方差，有效地表征多模态过程数据特性，实现多模态过程下模态的准确识别. 分析局部数据分布差异变化趋势识别模态，削弱噪声对模态识别的影响. 通过仿真实验验证方法的有效性.

1. 最大均值差异

在多模态生产过程中，稳定工作模式在同一工作点附近波动，局部数据分布逼近同一概率分布. 当模态发生变化时，过程变量随工作点的改变发生渐变，过程数据的概率分布随之发生变化.

在多模态运行过程中，假设取同一模态下的局部数据 ${{X}} = \{ {{{x}}_1},{{{x}}_2}, \cdot \cdot \cdot, {{{x}}_r}\}$服从分布p，局部数据 ${{Y}} = \{ {{{y}}_1},{{{y}}_2}, \cdot \cdot \cdot, {{{y}}_s}\}$服从分布q，r和s为局部样本个数. 定义分布p和q的差异为 $d(p,q)$. 在同一稳定模态下的局部数据分布差异处于某一变化范围，即 $d(p,q) \leqslant {d_{{\rm{s}}}}$， ${d_{{\rm{s}}}}$为稳定模态局部数据分布最大差异. 在模态发生变化后，原模态局部数据服从分布p，与模态改变后的局部数据服从分布q之间的差异 $d(p,q) > {d_{{\rm{s}}}}$.

根据局部数据服从分布的变化趋势，将多模态过程划分成若干子模态，针对不同子模态的分布特性建立子模型，能更好揭示多模态过程的运行状态和分布变化规律. 基于此，引入衡量p、q分布差异的指标进行模态识别. Gretton等^[22]定义最大均值差异（maximum mean discrepancy，MMD）：

(1) ${\rm{MMD}} [F,p,q] = \mathop {\sup \;} \limits_{f \in F} ({{{E}}_{{{x}} \sim p}}[f({{x}})] - {{{E}}_{{{y}} \sim q}}[f({{y}})]).$

其中：x、y为局部数据样本；F为特征空间映射到实数集的所有函数 $f$集合，MMD的取值取决于使差异最大的投影 $f$. 当F是再生核希尔伯特空间 ${\cal{H}}$的单位球时， ${{\rm{MMD}} ^2}[F,p,q]$表示为

(2) $ \begin{split} {{\rm{MMD}} ^2}[F,p,q] = & {\left[ {\mathop {\sup }\limits_{||f|{|_{\cal{H}}} \leqslant 1} ({{{E}}_p}[f({{x}})] - {{{E}}_q}[f({{y}})])} \right]^2} = \\ & {\left[ {\mathop {\sup }\limits_{||f|{|_{\cal{H}}} \leqslant 1} < {{{\mu }}_p} - {{{\mu }}_q},f{ > _{\cal{H}}}} \right]^2} = \\ & ||{{{\mu }}_p} - {{{\mu }}_q}||_{\cal{H}}^2. \end{split} $

由式(2)可知，MMD刻画了高维特征空间下的任意阶统计量. 针对样本集 ${{X}}$和 ${{Y}}$之间的 ${{\rm{MMD}} ^2}$的经验估计表示为

(3) $ \begin{split} {{\rm{MMD}} ^2}[F,{{X}},{{Y}}] = & ||{{{\mu }}_X} - {{{\mu }}_Y}||_{\cal{H}}^2 = {({{{\mu }}_X} - {{{\mu }}_Y})^{\rm{T}}}({{{\mu }}_X} - {{{\mu }}_Y}) = \\ & {{\mu }}_X^{\rm{T}}{{{\mu }}_X} - {{\mu }}_X^{\rm{T}}{{{\mu }}_Y} - {{\mu }}_Y^{\rm{T}}{{{\mu }}_X} + {{\mu }}_Y^{\rm{T}}{{{\mu }}_Y} = \\ & < {{{\mu }}_X},{{{\mu }}_X} > + < {{{\mu }}_Y},{{{\mu }}_Y} > - \\ & 2 < {{{\mu }}_X},{{{\mu }}_Y} > .\\[-10pt] \end{split} $

将 ${{{\mu }}_X} = \dfrac{1}{r}\displaystyle\sum\nolimits_{i = 1}^r {\phi ({{{x}}_i})}$， ${{{\mu }}_Y} = \dfrac{1}{s}\displaystyle\sum\nolimits_{i = 1}^s {\phi ({{{y}}_i})}$代入，其中 $\phi ( \cdot )$为映射函数，满足 $< \phi ({{x}}),\phi ({{y}}){ > _{\cal{H}}} = k({{{x}},{{y}}})$， $k({{{x}},{{y}}})$为正定核函数. 可得

(4) $\begin{split} {{\rm{MMD}} ^2}[F,{{X}},{{Y}}] = & \frac{1}{{{r^2}}}\sum\limits_{i,j = 1}^r {k({{{x}}_i},{{{x}}_j})} - \frac{2}{{rs}}\sum\limits_{i,j = 1}^{r,s} {k({{{x}}_i},{{{y}}_j})} + \\ & \frac{1}{{{s^2}}}\sum\limits_{i,j = 1}^s {k({{{y}}_i},{{{y}}_j})} . \\[-15pt] \end{split} $

通过引入最大均值差异指标计算相邻局部数据分布间的差异，将分布相近的局部数据识别为同一模态，分布差异较大的局部数据识别为不同模态.

2. 基于最大均值差异的离线多模态过渡模态识别

2.1. 离线稳定模态与过渡模态识别

引入稳定模态阈值 $\alpha $和过渡模态阈值 $\beta $. 通过度量稳定模态和过渡模态的数据分布差异，识别过渡模态起始点.

假设多模态过程离线建模数据表示为 ${{{{X}}}} \in {{\rm{{{R}}}}^{n \times m}}$，n为建模样本数，m为过程变量数.

借鉴Tan等^[20]的滑动窗口思想，如图1所示，引入窗宽为H的滑动窗，滑动步长为H，第K个窗口内数据为 ${{X}}_K^{\rm{T}} = \left[ {{{{x}}_{K1}},{{{x}}_{K2}},{{{x}}_{K3}} \cdots, {{{x}}_{KH}}} \right]$，x为 ${m \times 1}$的列向量. 引入大滑动窗H遍历数据，假设第1个窗口为稳定模态，从第2个窗口起，依次计算当前窗口K与前一窗口K−1的MMD指标. 当 ${\rm{MMD}} $ $ ({{X}}_K^{\rm{T}},{{X}}_{K - 1}^{\rm{T}}) > \alpha$时，表明窗口数据分布发生变化；否则K=K+1，继续遍历窗口.

图 1

新窗口打开| 下载原图ZIP| 生成PPT

图 1 基于MMD的多模态过程中的过渡模态识别示意图

Fig.1 Schematic diagram of transition mode identification based on MMD for multimode process

当2个窗口数据分布发生变化时，存在2种情况：1）窗口K数据开始包含过渡模态，K−1窗口依旧处于稳定模态，计算MMD指标大于给定稳定模态阈值. 2）窗口K−1数据后半段进入过渡模态，由于过渡数据较少整个窗口依旧呈现稳定模态分布特性，窗口K数据属于过渡模态，此时计算K窗口与K−1窗口的MMD指标大于稳定模态阈值.

当 ${\rm{MMD}} ({{X}}_K^{\rm{T}},{{X}}_{K - 1}^{\rm{T}}) > \alpha$时，过渡模态可能处于K窗口或K−1窗口. 为了准确判断过渡起始点，从K−2窗口开始分析，建模数据表示为 ${{{X}}^{\rm{T}}}$，引入小滑动窗L遍历数据，小窗口用 ${\tilde {{X}}}_1^{\rm{T}},{\tilde {{X}}}_2^{\rm{T}},{\tilde {{X}}}_3^{\rm{T}} ,\cdots$ 表示，第k个小窗口内数据表示为 ${\tilde {{X}}}_k^{\rm{T}} = \left[ {{{{x}}_{k1}},{{{x}}_{k2}},{{{x}}_{k3}} \cdots, {{{x}}_{kL}}} \right]$. 取第1个小窗口为稳定模态参考窗口，从第2个小窗口起，依次计算当前窗口i与参考窗口的MMD指标. ${\rm{MMD}} ({\tilde {{X}}}_i^{\rm{T}},{\tilde {{X}}}_1^{\rm{T}}) > \beta $表明窗口数据与稳定模态数据分布不一致，该窗口为过渡模态起始窗口.

2.2. 离线过渡子模态识别

将经过识别的过渡模态起始窗口作为过渡子模态参考窗口，计算第j个窗口数据与参考窗口数据分布的最大均值差异 ${\rm{MMD}} ({\tilde {{X}}}_j^{\rm{T}},{\tilde {{X}}}_{k1}^{\rm{T}})$， ${\rm{MMD}} $ $ ({\tilde {{X}}}_j^{\rm{T}},{\tilde {{X}}}_{k1}^{\rm{T}}) < \beta $，表明当前窗口与参考窗口属于同一过渡子模态；反之，当前窗口与参考窗口属于不同过渡子模态，第k1个窗口到第j−1个窗口数据为第1个过渡子模态. 将第j个窗口作为新的过渡子模态参考窗口 ${\tilde {{X}}}_{k2}^{\rm{T}}$，按上述步骤继续进行分析，依次完成对过渡子模态的识别. 过程一直持续到属于某过渡子模态的连续窗口样本数大于最短稳定模态长度D（D根据经验知识和实际稳定模态运行最短时间选定），过渡模态结束，连续窗口为下一个稳定模态.根据本节策略，所有过渡子模态构成过渡模态，方法完成对过渡模态及过渡子模态的识别.

本方法中引入2个阈值，分别为稳定模态阈值 $\alpha $和过渡模态阈值 $\beta $，阈值的选取会影响模态识别结果. 稳定模态阈值 $\alpha $选取偏小，同一稳定模态中数据分布相近的窗口会被识别为过渡模态窗口；稳定模态阈值 $\alpha $选取偏大，过渡模态窗口未被识别. 过渡模态阈值 $\beta $的选取偏大，过渡模态中不同分布特性的数据会被识别为同一过渡子模态，后续对不同分布的数据建立软测量模型会降低模型预测精度；过渡模态阈值 $\beta $选取偏小，对过渡模态数据分布差异识别更敏感，导致识别出更多的过渡子模态，建模样本变少，模型更易受噪声干扰. 在实际应用中，通过试验选取恰当的阈值.

2.3. 时间复杂度分析

大滑动窗口切割数据执行 $n/H$次，计算MMD指标的时间复杂度为 $O(4{H^2})$^[22]，当比较计算两两窗口数据MMD时，执行 $(n/H) {(H + H)^2}$次，根据阈值确定过渡模态起始窗口执行 $n/H$次，对剩余数据分析，小滑动窗口切割数据执行 $\tilde n/L$次，其中 $\tilde n$为 ${\tilde {{X}}}$的样本数量. 当确定过渡子模态计算MMD时，执行 $(\tilde n/L) {(L + L)^2}$次. 方法复杂度为 $O(4Hn + n/H + $ $ 4L\tilde n + \tilde n/L)$. 相较于利用负载矩阵相似度（loading matrix similarity，LMS）的模态识别方法，由于求解H阶矩阵的负载矩阵的时间复杂度为 $O({H^3})$^[23]，大于计算MMD指标的时间复杂度，当面对高维数据时本研究方法更高效. 基于聚类的模态识别方法由于实际迭代次数不确定，时间复杂度变化不稳定.

3. 数值仿真应用研究

3.1. 实验仿真数据介绍

仿真包含5个监控变量 ${{{y}}_1}{\text{、}}{{{y}}_2}{\text{、}}{{{y}}_3}{\text{、}}{{{y}}_4}{\text{、}}{{{y}}_5}$， ${{{x}}_1}{\text{、}}{{{x}}_2}$作为输入变量. 包含渐变过渡趋势的多模态过程数据方程为

(5) ${{{y}}_1} = 0.576\;8{{{x}}_1} + 0.376\;6{{{x}}_2} + {{{e}}_1},$

(6) ${{{y}}_2} = 0.738\;2{{x}}_1^2 + 0.056\;6{{{x}}_2} + {{{e}}_2},$

(7) ${{{y}}_3} = 0.829\;1{{{x}}_1} + 0.400\;9{{x}}_2^2 + {{{e}}_3},$

(8) ${{{y}}_4} = 0.651\;9{{{x}}_1}{{{x}}_2} + 0.207\;0{{{x}}_2} + {{{e}}_4},$

(9) ${{{y}}_5} = 0.397\;2{{{x}}_1} + 0.804\;5{{{x}}_2} + {{{e}}_5}.$

式中： $ {{e}}_{1}$、 ${{e}}_{2}$、 ${{e}}_{3}$、 ${{e}}_{4}$、 ${{e}}_{5}$为均值为0，标准差为0.01的白噪声. 首先令输入变量 ${{{x}}_1}$服从均值为5，方差为0.36的正态分布 $N(5,0.36)$，输入变量 ${{{x}}_2}$服从均值为20，方差为0.49的正态分布 $N(20,0.49)$，按表1所示定义稳定模态P、Q. 依次在第401、501、601、701个采样点处对源 ${{{x}}_1}$引入期望值的阶跃，产生4种过渡子模态为PQ_1、PQ_2、PQ_3、PQ_4. 仿真共采集1 200个样本，其中稳定模态P、过渡模态PQ、稳定模态Q各采集400个样本. 如图2所示为5个输出变量的变化曲线.

表 1 数值仿真中的模态定义

Tab.1 Mode definition in numerical simulation

定义模态	${{{x}}_1}$服从分布	${{{x}}_2}$服从分布
P	$N(5,0.36)$	$N(20,0.49)$
PQ_1	$N(6,0.36)$	$N(20,0.49)$
PQ_2	$N(7,0.36)$	$N(20,0.49)$
PQ_3	$N(8,0.36)$	$N(20,0.49)$
PQ_4	$N(9,0.36)$	$N(20,0.49)$
Q	$N(10,0.36)$	$N(20,0.49)$

新窗口打开| 下载CSV

图 2

新窗口打开| 下载原图ZIP| 生成PPT

图 2 数值仿真中5个输出变量变化示意图

Fig.2 Schematic diagram of changes in five output variables in numerical simulation

3.2. 实验结果与分析

利用MMD度量识别过渡模态时，选取 $H = 100$， $L = 25$， $\alpha = 0.3$， $\beta = 0.2$. 引入K-means、FCM、GMM算法作为对比方法，模态识别结果如图3所示。图中，M为识别模态标签. 由图3可知，基于聚类的模态识别方法将同一模态中波动的部分识别为2类不同模态，这是数据波动性和噪声对计算均值产生的影响. 基于负载矩阵相似度和最大均值差异的模态识别结果如图4（a）、（b）所示，图4（b）清晰地识别出400到800样本点间的4个过渡子模态，由结果可知基于MMD的模态识别结果更准确. 分析原因，以仿真数据中每100个样本构成的窗口数据为分析单元，第1个窗口（即1~100样本）为参考窗口，计算各窗口与参考窗口的负载矩阵相似度和MMD指标，如图4（c）、（d）所示。图中， ${\varphi _{\rm{LMS} }}$为负载矩阵相似度，W为窗口序号， ${\varphi _{\rm{MMD}}}$为归一化后的MMD指标. 由图4（c）、（d）可知，MMD指标随着期望的增大逐渐增大，负载矩阵相似度随着期望的增大未能呈现逐渐减小的趋势，说明负载矩阵相似度只在一定程度上度量了数据模态变化趋势，未能准确划分出模态；MMD指标可以更有效捕捉到时序上的模态变化趋势，基于MMD的模态识别方法能更准确地识别出过渡模态.

图 3

新窗口打开| 下载原图ZIP| 生成PPT

图 3 模态在不同聚类方法下的识别结果

Fig.3 Mode identification results under different clustering methods

图 4

新窗口打开| 下载原图ZIP| 生成PPT

图 4 基于负载矩阵相似度及最大均值差异的模态识别结果分析

Fig.4 Analysis of mode identification results based on load matrix similarity and maximum mean discrepancy

4. TE过程仿真研究

4.1. TE仿真实验设置

本研究的实验数据来源于田纳西-伊斯曼（Tennessee Eastman, TE）过程的仿真. 以反应器压力设定值变化的过程为对象，选择TE过程中15个过程连续变量作为被监控变量^[20].

模拟40 h的仿真过程，压力初始值为2 800 kPa，过程运行至 $T = 20.824$ h，将反应器压力设定值减少为2 705 kPa，采集新模态过程数据. 仿真多模态过程数据共4 000个样本，包含2种稳定模态和1种过渡模态. 仿真过程变量V₁~V₁₅变化如图5所示.

图 5

新窗口打开| 下载原图ZIP| 生成PPT

图 5 TE过程下15个过程变量过渡期间变化示意图

Fig.5 Schematic diagram of 15 process variables during TE transition proces

4.2. 模态识别结果

取 $H = 100$， $L = 30$，经试验确定 $\alpha $和 $\beta $，取 $\alpha = $ $ 0.3$， $\beta = 0.06$. 最终模态识别结果如下：P（1~2 080样本点），PQ_1（2 081~2 110样本点），PQ_2（2 111~2 140样本点），PQ_3（2 141~2 170样本点），PQ_4（2 171~2 260样本点），Q（2 261~4 000样本点）. 结合图5分析可知，本方法识别出第2 081~2 110样本点作为第1个过渡子模态，在该过程下反应器温度由于压力设定值突然降低而降低. 在第2111~2170样本点上，很多过程变量正处在一定的趋势变化中，例如反应器、分离器和汽提塔温度处于持续升高的过程中，而分离器和汽提塔压力处于持续减小的过程. 基于MMD的模态识别方法在捕捉到变量分布变化趋势基础上，将该过程划分为分布差异较大的2个过渡子模态. 在第2 170~2 260样本点上，各变量在偏离原稳态工作点后逐渐达到新稳态. 第2 261样本点之后，局部数据分布之间的差异较小，步入下一个稳定模态.

4.3. 多模型软测量实验

为了验证方法的有效性，利用不同模态识别方法进行模态识别，建立多模型软测量实验，具体步骤如下。1）选择15 个过程变量作为软测量模型输入变量，将TE过程流9中的3个成分浓度（变量A、B、C）作为输出变量.2）将TE仿真实验中获取的4 000个离线样本进行标准化处理，选取包含完整过渡过程的中间2 800 个样本作为训练样本集. 在其他仿真条件不变的情况下，改变压力设定值至2700 kPa的过程作为工况1，改变压力设定值至2710 kPa的过程作为工况2，从2种工况中获取包含过渡过程的仿真数据作为测试样本集.3）在训练集上，将K-means、FCM、GMM、基于LMS模态识别方法以及本文基于MMD的模态识别方法划分后的数据子集，分别建立局部PLSR模型.4）针对测试样本，选择最相近的数据子集建立的软测量模型，对变量A、B、C进行预测.

利用均方根误差（root mean square error，RMSE）指标定量分析不同模态识别方法下的多模型软测量预测结果，如表 2所示.

表 2 多模型软测量方法的均方根误差预测结果对比

Tab.2 Comparison of RMSE prediction results of multimode soft sensing methods

工况	方法	RMSE
工况	方法	浓度A	浓度B	浓度C
一	MMD-PLSR	0.221 2	0.118 2	0.251 1
	GMM-PLSR	0.227 3	0.132 1	0.256 5
	FCM-PLSR	0.246 8	0.198 7	0.267 9
	Kmeans-PLSR	0.246 9	0.194 7	0.273 6
	LMS-PLSR	0.247 4	0.282 5	0.288 6
二	MMD-PLSR	0.221 2	0.113 1	0.249 7
	GMM-PLSR	0.228 8	0.113 8	0.268 4
	FCM-PLSR	0.248 2	0.211 9	0.272 5
	Kmeans-PLSR	0.247 4	0.205 5	0.274 4
	LMS-PLSR	0.265 5	0.293 3	0.285 4

新窗口打开| 下载CSV

由表2可知，基于MMD的模态识别方法下的多模型软测量预测效果更好. 基于聚类的模态识别方法可能将过渡过程中的分布接近但标签不一致的不同子阶段识别为同一子模态，而基于MMD的模态识别方法是根据时序划分过渡子模态，使得样本的标签分布基本一致，以提高后续建模精度. 相较于负载矩阵相似度划分模态，通过MMD直接度量分布差异，识别出的子模态样本间分布差异更明显，待测样本更易选择最合适的软测量模型进行预测，提高预测精度.

5. 结　语

针对现有模态识别方法在多模态过渡数据上难以准确划分的问题，提出基于最大均值差异的多模态过程中的过渡模态识别方法. 在数值仿真中，所提方法准确识别出过渡子模态，实验结果表明，最大均值差异相较负载矩阵相似度，更能有效地刻画局部数据分布差异，提高模态识别精度，相比聚类模态识别方法，基于最大均值差异的模态识别方法可以更准确地识别模态. 在TE仿真实验中，在实现更准确识别过渡模态的基础上，将复杂多模态数据按时序识别为分布差异明显的子模态后建模，克服了过渡过程中具有相似数据分布的样本中标签分布不一致的问题，在过渡阶段的建模预测中具有较好的优势，证明本研究方法的有效性.本研究方法通过对数据的反复试验确定滑动窗的窗宽取值，在多模态过程中能否针对数据分布的变化自适应确定窗宽，需要进一步研究。

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

杜文莉, 王坤, 钱锋

基于特征空间降维的溶剂脱水分离过程监控

[J]. 浙江大学学报: 工学版, 2010, 44 (7): 1255- 1259

[本文引用: 1]

DU Wen-li, WANG Kun, QIAN Feng

Feature space dimension-reduction based process monitoring of solvent dehydration separation process

[J]. Journal of Zhejiang University: Engineering Science, 2010, 44 (7): 1255- 1259

[本文引用: 1]

[2]

赵立杰, 汤健, 柴天佑

基于选择性极限学习机集成的磨机负荷软测量

[J]. 浙江大学学报: 工学版, 2011, 45 (12): 2088- 2092

ZHAO Li-jie, TANG Jian, CHAI Tian-you

Soft sensor of mill load based on selective extreme learning machine ensemble

[J]. Journal of Zhejiang University: Engineering Science, 2011, 45 (12): 2088- 2092

[3]

尤海辉, 马增益, 唐义军, 等

循环流化床入炉垃圾热值软测量

[J]. 浙江大学学报: 工学版, 2017, 51 (6): 1163- 1171

[本文引用: 1]

YOU Hai-hui, MA Zeng-yi, TANG Yi-jun, et al

Soft measurement of heating value of burning municipal solid waste for circulating fluidized bed

[J]. Journal of Zhejiang University: Engineering Science, 2017, 51 (6): 1163- 1171

[本文引用: 1]

[4]

谭帅, 王福利, 彭俊, 等

多模态过程中新模态过程建模方法

[J]. 控制与决策, 2012, 27 (8): 1241- 1245

[本文引用: 1]

TAN Shuai, WANG Fu-li, PENG Jun, et al

Modeling algorithm for new mode in multi-mode process

[J]. Control and Decision, 2012, 27 (8): 1241- 1245

[本文引用: 1]

[5]

谭帅, 王福利, 常玉清, 等

基于差分分段PCA的多模态过程故障监测

[J]. 自动化学报, 2010, 36 (11): 1626- 1636

DOI:10.3724/SP.J.1004.2010.01626 [本文引用: 1]

TAN Shuai, WANG Fu-li, CHANG Yu-qing, et al

Fault detection of multi-mode process using segmented PCA based on differential transform

[J]. Acta Automatica Sinica, 2010, 36 (11): 1626- 1636

DOI:10.3724/SP.J.1004.2010.01626 [本文引用: 1]

[6]

YANG C, ZHOU L, HUANG K, et al

Multimode process monitoring based on robust dictionary learning with application to aluminium electrolysis process

[J]. Neurocomputing, 2019, 332: 305- 319

DOI:10.1016/j.neucom.2018.12.024 [本文引用: 1]

[7]

张雷, 张小刚, 陈华

基于Gath-Geva算法和核极限学习机的多阶段间歇过程软测量

[J]. 化工学报, 2018, 69 (6): 2576- 2585

[本文引用: 1]

ZHANG Lei, ZHANG Xiao-gang, CHEN Hua

Soft sensors for multi-stage batch processes based on Gath-Geva algorithm and kernel extreme learing machine

[J]. CIESC Journal, 2018, 69 (6): 2576- 2585

[本文引用: 1]

[8]

DU W, FAN Y, ZHANG Y

Multimode process monitoring based on data-driven method

[J]. Journal of the Franklin Institute, 2017, 354 (6): 2613- 2627

DOI:10.1016/j.jfranklin.2016.11.002 [本文引用: 1]

[9]

HE Y, GE Z, SONG Z. Adaptive monitoring for transition process using dynamic mutual information similarity analysis [C]// 2016 Chinese Control and Decision Conference. Yinchuan: IEEE. 2016: 5832-5837.

[本文引用: 1]

[10]

ZHANG S, ZHAO C

Stationarity test and Bayesian monitoring strategy for fault detection in nonlinear multimode processes

[J]. Chemometrics and Intelligent Laboratory Systems, 2017, 168: 45- 61

DOI:10.1016/j.chemolab.2017.07.010 [本文引用: 1]

[11]

JIANG Q, HUANG B, YAN X

GMM and optimal principal components-based Bayesian method for multimode fault diagnosis

[J]. Computers and Chemical Engineering, 2016, 84: 338- 349

DOI:10.1016/j.compchemeng.2015.09.013 [本文引用: 1]

[12]

LIU J, CHEN D S

Nonstationary fault detection and diagnosis for multimode processes

[J]. AIChE Journal, 2010, 56 (1): 207- 219

[本文引用: 1]

[13]

MA Y, SONG B, SHI H, et al

Neighborhood based global coordination for multimode process monitoring

[J]. Chemometrics and Intelligent Laboratory Systems, 2014, 139: 84- 96

DOI:10.1016/j.chemolab.2014.09.019 [本文引用: 1]

[14]

QUIÑONES-GRUEIRO M, PRIETO-MORENO A, LLANES-SANTIAGO O

Modeling and monitoring for transitions based on local kernel density estimation and process pattern construction

[J]. Industrial and Engineering Chemistry Research, 2016, 55 (3): 692- 702

[本文引用: 1]

[15]

ZHENG Y, QIN S J, WANG F

PLS-based similarity analysis for mode identification in multimode manufacturing processes

[J]. IFAC-PapersOnLine, 2015, 48 (8): 777- 782

DOI:10.1016/j.ifacol.2015.09.063 [本文引用: 1]

[16]

张淑美, 王福利, 谭帅, 等

多模态过程的全自动离线模态识别方法

[J]. 自动化学报, 2016, 42 (1): 60- 80

[本文引用: 1]

ZHANG Shu-mei, WANG Fu-li, TAN Shuai, et al

A fully automatic offline mode identification method for multi-mode processes

[J]. Acta Automatica Sinica, 2016, 42 (1): 60- 80

[本文引用: 1]

[17]

SONG B, TAN S, SHI H

Key principal components with recursive local outlier factor for multimode chemical process monitoring

[J]. Journal of Process Control, 2016, 47: 136- 149

DOI:10.1016/j.jprocont.2016.09.006 [本文引用: 1]

[18]

HE Y, ZHOU L, GE Z, et al

Dynamic mutual information similarity based transient process identification and fault detection

[J]. The Canadian Journal of Chemical Engineering, 2018, 96 (7): 1541- 1558

DOI:10.1002/cjce.23102 [本文引用: 1]

[19]

谭帅. 多模态过程统计建模及在线监测方法研究[D]. 沈阳: 东北大学, 2012: 17-23.

[本文引用: 1]

TAN Shuai. Statical modeling and online monitoring for multiple mode processes [D]. Shenyang: Northeastern University, 2012.

[本文引用: 1]

[20]

TAN S, WANG F, PENG J, et al

Multimode process monitoring based on mode identification

[J]. Industrial and Engineering Chemistry Research, 2012, 51 (1): 374- 388

[本文引用: 3]

[21]

LIU T, SHI Z, LIU Y

Supervised dimensionality reduction on grassmannian for image set recognition

[J]. Neural Computation, 2019, 31 (1): 156- 175

DOI:10.1162/neco_a_01148 [本文引用: 1]

[22]

GRETTON A, BORGWARDT K, RASCH M, et al. A kernel method for the two-sample-problem [C]// Advances in Neural Information Processing Systems. Vancouver, British Columbia, Canada: Curran Associates, 2007: 513-520.

[本文引用: 2]

[23]

迟学斌

特征值问题的算法、复杂性及并行实现

[J]. 数值计算与计算机应用, 1998, 19 (1): 28- 34

[本文引用: 1]

CHI Xue-bin

Algorithm, complexity and parallel implementation of eigen-problems

[J]. Numerical Calculation and Computer Applications, 1998, 19 (1): 28- 34

[本文引用: 1]

基于特征空间降维的溶剂脱水分离过程监控

2010

... 基于数据驱动的过程监控和软测量已经成为工业应用研究的重要领域^[1-3]. 当操作条件、外界环境、过程本身固有因素或者特定需求发生变化时，工业生产过程呈现多模态特征^[4]. 为了更好地描述多模态过程的特性，在过程建模前须对多模态数据进行模态识别，即对没有模态指示信息的数据进行类别划分. 模态识别是建立多模态过程监控和软测量的首要前提^[5]. ...

基于特征空间降维的溶剂脱水分离过程监控

2010

基于选择性极限学习机集成的磨机负荷软测量

2011

基于选择性极限学习机集成的磨机负荷软测量

2011

循环流化床入炉垃圾热值软测量

2017

循环流化床入炉垃圾热值软测量

2017

多模态过程中新模态过程建模方法

2012

多模态过程中新模态过程建模方法

2012

基于差分分段PCA的多模态过程故障监测

2010

基于差分分段PCA的多模态过程故障监测

2010

Multimode process monitoring based on robust dictionary learning with application to aluminium electrolysis process

2019

... 现阶段，针对工业多模态过程数据不同的分布特性，许多聚类方法应用在模态识别中^[6-7]. Du等^[8]采用K-means聚类进行模态识别，提取所有模态的共同特征和特有特征后对多模态数据进行建模. K-means方法在对含有过渡过程数据进行模态识别时结果会变差^[9]. 模糊C均值聚类（fuzzy C-means，FCM）在K-means聚类基础上，引入隶属度进行软划分. Zhang等^[10]在离线建模过程中采用核模糊C均值聚类算法，将多模态数据分为C个模糊组，对各模态建立KPCA模型. 当数据呈现线性可分或超球面形状时，利用FCM进行模态识别可以取得较好的效果. 高斯混合模型（Gaussian mixture model，GMM）可以拟合任意分布的数据. Jiang等^[11]在多模态过程监控中，假设每一模态对应一个高斯分量，利用高斯混合模型进行模态识别. 但工业过程中过渡数据会影响高斯密度函数的参数，导致参数优化收敛的不稳定^[12]. ...

基于Gath-Geva算法和核极限学习机的多阶段间歇过程软测量

2018

基于Gath-Geva算法和核极限学习机的多阶段间歇过程软测量

2018

Multimode process monitoring based on data-driven method

2017

Stationarity test and Bayesian monitoring strategy for fault detection in nonlinear multimode processes

2017

GMM and optimal principal components-based Bayesian method for multimode fault diagnosis

2016

Nonstationary fault detection and diagnosis for multimode processes

2010

Neighborhood based global coordination for multimode process monitoring

2014

... 基于窗口的模态识别方法被提出^[13-14]来获取局部数据变化信息，进而更好地表征模态变化关系. Zheng等^[15]计算滑动窗口数据的PLS相似因子对多模态过程稳定模态进行识别；针对过渡模态的识别问题，张淑美等^[16]对窗口均值向量进行聚类，实现稳定模态和过渡模态的识别，解决聚类算法参数选取不准确造成的稳定模态被埋没现象；Song等^[17]针对局部样本间关系，扩展原始样本后引入局部异常因子，提取局部样本密度信息来判断稳定模态和过渡模态；考虑到工业过程不同阶段样本间不同的依赖性，He等^[18]利用基于互信息的相似度识别稳定模态和过渡模态. 上述方法在一定程度实现了稳定模态和过渡模态的识别，但过渡模态是从一种稳定运行模式向另一种稳定运行模式渐进式量变^[19]，在复杂工业过程中过渡模态的过程特性在不同阶段会呈现分段性变化，在识别过渡模态后进行子模态的识别分析是有必要的. ...

Modeling and monitoring for transitions based on local kernel density estimation and process pattern construction

2016

PLS-based similarity analysis for mode identification in multimode manufacturing processes

2015

多模态过程的全自动离线模态识别方法

2016

多模态过程的全自动离线模态识别方法

2016

Key principal components with recursive local outlier factor for multimode chemical process monitoring

2016

Dynamic mutual information similarity based transient process identification and fault detection

2018

Multimode process monitoring based on mode identification

2012

... Tan等^[20]认为多模态过程潜在变量相关关系跟随模态变化呈现分段性，利用窗口数据的负载矩阵相似度进行模态识别，在对稳定模态过渡模态进行粗划分后进一步对过渡模态细划分出过渡子模态，所提方法中的相似度基于欧氏距离定义，而PCA提取子空间即负载矩阵属于格拉斯曼流形，是特殊的黎曼空间，属于非欧式空间^[21]. 利用欧氏距离度量非欧式空间的相似度，可能导致时序下的模态识别不准确. 在多模态工业过程中，合适的度量指标对实现模态识别是至关重要的. ...

... 借鉴Tan等^[20]的滑动窗口思想，如图1所示，引入窗宽为H的滑动窗，滑动步长为H，第K个窗口内数据为

${{X}}_K^{\rm{T}} = \left[ {{{{x}}_{K1}},{{{x}}_{K2}},{{{x}}_{K3}} \cdots, {{{x}}_{KH}}} \right]$

，x为

${m \times 1}$

的列向量. 引入大滑动窗H遍历数据，假设第1个窗口为稳定模态，从第2个窗口起，依次计算当前窗口K与前一窗口K−1的MMD指标. 当

${\rm{MMD}} $

$ ({{X}}_K^{\rm{T}},{{X}}_{K - 1}^{\rm{T}}) > \alpha$

时，表明窗口数据分布发生变化；否则K=K+1，继续遍历窗口. ...

... 本研究的实验数据来源于田纳西-伊斯曼（Tennessee Eastman, TE）过程的仿真. 以反应器压力设定值变化的过程为对象，选择TE过程中15个过程连续变量作为被监控变量^[20]. ...

Supervised dimensionality reduction on grassmannian for image set recognition

2019

... 根据局部数据服从分布的变化趋势，将多模态过程划分成若干子模态，针对不同子模态的分布特性建立子模型，能更好揭示多模态过程的运行状态和分布变化规律. 基于此，引入衡量p、q分布差异的指标进行模态识别. Gretton等^[22]定义最大均值差异（maximum mean discrepancy，MMD）： ...

... 大滑动窗口切割数据执行

$n/H$

次，计算MMD指标的时间复杂度为

$O(4{H^2})$

^[22]，当比较计算两两窗口数据MMD时，执行

$(n/H) {(H + H)^2}$

次，根据阈值确定过渡模态起始窗口执行

$n/H$

次，对剩余数据分析，小滑动窗口切割数据执行

$\tilde n/L$

次，其中

$\tilde n$

为

${\tilde {{X}}}$

的样本数量. 当确定过渡子模态计算MMD时，执行

$(\tilde n/L) {(L + L)^2}$

次. 方法复杂度为

$O(4Hn + n/H + $

$ 4L\tilde n + \tilde n/L)$

. 相较于利用负载矩阵相似度（loading matrix similarity，LMS）的模态识别方法，由于求解H阶矩阵的负载矩阵的时间复杂度为

$O({H^3})$

^[23]，大于计算MMD指标的时间复杂度，当面对高维数据时本研究方法更高效. 基于聚类的模态识别方法由于实际迭代次数不确定，时间复杂度变化不稳定. ...

特征值问题的算法、复杂性及并行实现

1998

... 大滑动窗口切割数据执行

$n/H$

次，计算MMD指标的时间复杂度为

$O(4{H^2})$

^[22]，当比较计算两两窗口数据MMD时，执行

$(n/H) {(H + H)^2}$

次，根据阈值确定过渡模态起始窗口执行

$n/H$

次，对剩余数据分析，小滑动窗口切割数据执行

$\tilde n/L$

次，其中

$\tilde n$

为

${\tilde {{X}}}$

的样本数量. 当确定过渡子模态计算MMD时，执行

$(\tilde n/L) {(L + L)^2}$

次. 方法复杂度为

$O(4Hn + n/H + $

$ 4L\tilde n + \tilde n/L)$

. 相较于利用负载矩阵相似度（loading matrix similarity，LMS）的模态识别方法，由于求解H阶矩阵的负载矩阵的时间复杂度为

$O({H^3})$

特征值问题的算法、复杂性及并行实现

1998

... 大滑动窗口切割数据执行

$n/H$

次，计算MMD指标的时间复杂度为

$O(4{H^2})$

^[22]，当比较计算两两窗口数据MMD时，执行

$(n/H) {(H + H)^2}$

次，根据阈值确定过渡模态起始窗口执行

$n/H$

次，对剩余数据分析，小滑动窗口切割数据执行

$\tilde n/L$

次，其中

$\tilde n$

为

${\tilde {{X}}}$

的样本数量. 当确定过渡子模态计算MMD时，执行

$(\tilde n/L) {(L + L)^2}$

次. 方法复杂度为

$O(4Hn + n/H + $

$ 4L\tilde n + \tilde n/L)$

. 相较于利用负载矩阵相似度（loading matrix similarity，LMS）的模态识别方法，由于求解H阶矩阵的负载矩阵的时间复杂度为

$O({H^3})$

〈

〉