基于最大均值差异的多模态过程过渡模态识别方法
Transition mode identification method based on maximum mean discrepancy for multimode process
通讯作者:
收稿日期: 2019-10-15
基金资助: |
|
Received: 2019-10-15
Fund supported: | 国家自然科学基金资助项目(61973226,61603267);山西省科技重大专项资助项目(20181102017);山西省重点研发计划项目(201903D121143) |
作者简介 About authors
任超(1996—),男,硕士生,从事过程建模研究.orcid.org/0000-0002-5191-8570.E-mail:
为了更好地揭示多模态过程的运行状态和数据分布变化规律,提高后续建模精度,提出基于最大均值差异(MMD)的多模态过程的过渡模态识别方法. 引入滑动窗口对数据进行切割,使用最大均值差异对多模态过程数据的分布差异进行度量,通过与稳定模态阈值α比较区分过程数据的稳定模态和过渡模态. 在过渡模态段内减小滑动窗口窗宽,利用过渡模态阈值β识别出过渡子模态. 数值仿真实验的模态识别结果表明,所提方法可以准确检测出输入变量期望值的阶跃变化,实现对模态的准确识别. 田纳西伊斯曼(TE)过程仿真数据实验表明,所提方法可以有效地划分出合理的模态,进而选择出分布最相近的历史模态建模,提高多模态过程的软测量建模精度.
关键词:
A transition mode identification method based on maximum mean discrepancy (MMD) was proposed in order to better reveal the law of the operating state and the process data distributional variation of a multi-mode process, and further improve the accuracy of subsequent modeling. Firstly, the sliding window technique was introduced to segment process data, and the MMD was used to measure the distribution difference of the process data. The stable mode and transition mode of the process data were distinguished by comparing the MMD with the stable modal threshold α. Secondly, the width of the sliding window was reduced in transition mode segments, and a transition mode threshold β was used to identify the transition modes. The modal identification results of numerical simulation experiments show that the proposed method can achieve the goal of detecting the step change of the expected value of the input variables and identifying the transient modes. Tennessee Eastman (TE) process simulation data experiments show that the proposed method can effectively divide reasonable modes, select the historical mode modeling with the closest distribution, and improve the soft sensor modeling accuracy of multi-modal processes.
Keywords:
本文引用格式
任超, 阎高伟, 程兰, 王芳.
REN Chao, YAN Gao-wei, CHENG Lan, WANG Fang.
现阶段,针对工业多模态过程数据不同的分布特性,许多聚类方法应用在模态识别中[6-7]. Du等[8]采用K-means聚类进行模态识别,提取所有模态的共同特征和特有特征后对多模态数据进行建模. K-means方法在对含有过渡过程数据进行模态识别时结果会变差[9]. 模糊C均值聚类(fuzzy C-means,FCM)在K-means聚类基础上,引入隶属度进行软划分. Zhang等[10]在离线建模过程中采用核模糊C均值聚类算法,将多模态数据分为C个模糊组,对各模态建立KPCA模型. 当数据呈现线性可分或超球面形状时,利用FCM进行模态识别可以取得较好的效果. 高斯混合模型(Gaussian mixture model,GMM)可以拟合任意分布的数据. Jiang等[11]在多模态过程监控中,假设每一模态对应一个高斯分量,利用高斯混合模型进行模态识别. 但工业过程中过渡数据会影响高斯密度函数的参数,导致参数优化收敛的不稳定[12].
基于窗口的模态识别方法被提出[13-14]来获取局部数据变化信息,进而更好地表征模态变化关系. Zheng等[15]计算滑动窗口数据的PLS相似因子对多模态过程稳定模态进行识别;针对过渡模态的识别问题,张淑美等[16]对窗口均值向量进行聚类,实现稳定模态和过渡模态的识别,解决聚类算法参数选取不准确造成的稳定模态被埋没现象;Song等[17]针对局部样本间关系,扩展原始样本后引入局部异常因子,提取局部样本密度信息来判断稳定模态和过渡模态;考虑到工业过程不同阶段样本间不同的依赖性,He等[18]利用基于互信息的相似度识别稳定模态和过渡模态. 上述方法在一定程度实现了稳定模态和过渡模态的识别,但过渡模态是从一种稳定运行模式向另一种稳定运行模式渐进式量变[19],在复杂工业过程中过渡模态的过程特性在不同阶段会呈现分段性变化,在识别过渡模态后进行子模态的识别分析是有必要的.
本研究提出基于最大均值差异的多模态过渡模态识别方法. 引入最大均值差异作为局部数据分布度量指标,刻画数据概率分布的均值和方差,有效地表征多模态过程数据特性,实现多模态过程下模态的准确识别. 分析局部数据分布差异变化趋势识别模态,削弱噪声对模态识别的影响. 通过仿真实验验证方法的有效性.
1. 最大均值差异
在多模态生产过程中,稳定工作模式在同一工作点附近波动,局部数据分布逼近同一概率分布. 当模态发生变化时,过程变量随工作点的改变发生渐变,过程数据的概率分布随之发生变化.
在多模态运行过程中,假设取同一模态下的局部数据
根据局部数据服从分布的变化趋势,将多模态过程划分成若干子模态,针对不同子模态的分布特性建立子模型,能更好揭示多模态过程的运行状态和分布变化规律. 基于此,引入衡量p、q分布差异的指标进行模态识别. Gretton等[22]定义最大均值差异(maximum mean discrepancy,MMD):
其中:x、y为局部数据样本;F为特征空间映射到实数集的所有函数
由式(2)可知,MMD刻画了高维特征空间下的任意阶统计量. 针对样本集
将
通过引入最大均值差异指标计算相邻局部数据分布间的差异,将分布相近的局部数据识别为同一模态,分布差异较大的局部数据识别为不同模态.
2. 基于最大均值差异的离线多模态过渡模态识别
2.1. 离线稳定模态与过渡模态识别
引入稳定模态阈值
假设多模态过程离线建模数据表示为
借鉴Tan等[20]的滑动窗口思想,如图1所示,引入窗宽为H的滑动窗,滑动步长为H,第K个窗口内数据为
图 1
图 1 基于MMD的多模态过程中的过渡模态识别示意图
Fig.1 Schematic diagram of transition mode identification based on MMD for multimode process
当2个窗口数据分布发生变化时,存在2种情况:1)窗口K数据开始包含过渡模态,K−1窗口依旧处于稳定模态,计算MMD指标大于给定稳定模态阈值. 2)窗口K−1数据后半段进入过渡模态,由于过渡数据较少整个窗口依旧呈现稳定模态分布特性,窗口K数据属于过渡模态,此时计算K窗口与K−1窗口的MMD指标大于稳定模态阈值.
当
2.2. 离线过渡子模态识别
将经过识别的过渡模态起始窗口作为过渡子模态参考窗口,计算第j个窗口数据与参考窗口数据分布的最大均值差异
本方法中引入2个阈值,分别为稳定模态阈值
2.3. 时间复杂度分析
大滑动窗口切割数据执行
3. 数值仿真应用研究
3.1. 实验仿真数据介绍
仿真包含5个监控变量
式中:
表 1 数值仿真中的模态定义
Tab.1
定义模态 | | |
P | | |
PQ_1 | | |
PQ_2 | | |
PQ_3 | | |
PQ_4 | | |
Q | | |
图 2
图 2 数值仿真中5个输出变量变化示意图
Fig.2 Schematic diagram of changes in five output variables in numerical simulation
3.2. 实验结果与分析
利用MMD度量识别过渡模态时,选取
图 3
图 3 模态在不同聚类方法下的识别结果
Fig.3 Mode identification results under different clustering methods
图 4
图 4 基于负载矩阵相似度及最大均值差异的模态识别结果分析
Fig.4 Analysis of mode identification results based on load matrix similarity and maximum mean discrepancy
4. TE过程仿真研究
4.1. TE仿真实验设置
本研究的实验数据来源于田纳西-伊斯曼(Tennessee Eastman, TE)过程的仿真. 以反应器压力设定值变化的过程为对象,选择TE过程中15个过程连续变量作为被监控变量[20].
模拟40 h的仿真过程,压力初始值为2 800 kPa,过程运行至
图 5
图 5 TE过程下15个过程变量过渡期间变化示意图
Fig.5 Schematic diagram of 15 process variables during TE transition proces
4.2. 模态识别结果
取
4.3. 多模型软测量实验
为了验证方法的有效性,利用不同模态识别方法进行模态识别,建立多模型软测量实验,具体步骤如下。1)选择15 个过程变量作为软测量模型输入变量,将TE过程流9中的3个成分浓度(变量A、B、C)作为输出变量.2)将TE仿真实验中获取的4 000个离线样本进行标准化处理,选取包含完整过渡过程的中间2 800 个样本作为训练样本集. 在其他仿真条件不变的情况下,改变压力设定值至2700 kPa的过程作为工况1,改变压力设定值至2710 kPa的过程作为工况2,从2种工况中获取包含过渡过程的仿真数据作为测试样本集.3)在训练集上,将K-means、FCM、GMM、基于LMS模态识别方法以及本文基于MMD的模态识别方法划分后的数据子集,分别建立局部PLSR模型.4)针对测试样本,选择最相近的数据子集建立的软测量模型,对变量A、B、C进行预测.
利用均方根误差(root mean square error,RMSE)指标定量分析不同模态识别方法下的多模型软测量预测结果,如表 2所示.
表 2 多模型软测量方法的均方根误差预测结果对比
Tab.2
工况 | 方法 | RMSE | ||
浓度A | 浓度B | 浓度C | ||
一 | MMD-PLSR | 0.221 2 | 0.118 2 | 0.251 1 |
GMM-PLSR | 0.227 3 | 0.132 1 | 0.256 5 | |
FCM-PLSR | 0.246 8 | 0.198 7 | 0.267 9 | |
Kmeans-PLSR | 0.246 9 | 0.194 7 | 0.273 6 | |
LMS-PLSR | 0.247 4 | 0.282 5 | 0.288 6 | |
二 | MMD-PLSR | 0.221 2 | 0.113 1 | 0.249 7 |
GMM-PLSR | 0.228 8 | 0.113 8 | 0.268 4 | |
FCM-PLSR | 0.248 2 | 0.211 9 | 0.272 5 | |
Kmeans-PLSR | 0.247 4 | 0.205 5 | 0.274 4 | |
LMS-PLSR | 0.265 5 | 0.293 3 | 0.285 4 |
由表2可知,基于MMD的模态识别方法下的多模型软测量预测效果更好. 基于聚类的模态识别方法可能将过渡过程中的分布接近但标签不一致的不同子阶段识别为同一子模态,而基于MMD的模态识别方法是根据时序划分过渡子模态,使得样本的标签分布基本一致,以提高后续建模精度. 相较于负载矩阵相似度划分模态,通过MMD直接度量分布差异,识别出的子模态样本间分布差异更明显,待测样本更易选择最合适的软测量模型进行预测,提高预测精度.
5. 结 语
针对现有模态识别方法在多模态过渡数据上难以准确划分的问题,提出基于最大均值差异的多模态过程中的过渡模态识别方法. 在数值仿真中,所提方法准确识别出过渡子模态,实验结果表明,最大均值差异相较负载矩阵相似度,更能有效地刻画局部数据分布差异,提高模态识别精度,相比聚类模态识别方法,基于最大均值差异的模态识别方法可以更准确地识别模态. 在TE仿真实验中,在实现更准确识别过渡模态的基础上,将复杂多模态数据按时序识别为分布差异明显的子模态后建模,克服了过渡过程中具有相似数据分布的样本中标签分布不一致的问题,在过渡阶段的建模预测中具有较好的优势,证明本研究方法的有效性.本研究方法通过对数据的反复试验确定滑动窗的窗宽取值,在多模态过程中能否针对数据分布的变化自适应确定窗宽,需要进一步研究。
参考文献
基于特征空间降维的溶剂脱水分离过程监控
[J].
Feature space dimension-reduction based process monitoring of solvent dehydration separation process
[J].
基于选择性极限学习机集成的磨机负荷软测量
[J].
Soft sensor of mill load based on selective extreme learning machine ensemble
[J].
循环流化床入炉垃圾热值软测量
[J].
Soft measurement of heating value of burning municipal solid waste for circulating fluidized bed
[J].
多模态过程中新模态过程建模方法
[J].
Modeling algorithm for new mode in multi-mode process
[J].
基于差分分段PCA的多模态过程故障监测
[J].DOI:10.3724/SP.J.1004.2010.01626 [本文引用: 1]
Fault detection of multi-mode process using segmented PCA based on differential transform
[J].DOI:10.3724/SP.J.1004.2010.01626 [本文引用: 1]
Multimode process monitoring based on robust dictionary learning with application to aluminium electrolysis process
[J].DOI:10.1016/j.neucom.2018.12.024 [本文引用: 1]
基于Gath-Geva算法和核极限学习机的多阶段间歇过程软测量
[J].
Soft sensors for multi-stage batch processes based on Gath-Geva algorithm and kernel extreme learing machine
[J].
Multimode process monitoring based on data-driven method
[J].DOI:10.1016/j.jfranklin.2016.11.002 [本文引用: 1]
Stationarity test and Bayesian monitoring strategy for fault detection in nonlinear multimode processes
[J].DOI:10.1016/j.chemolab.2017.07.010 [本文引用: 1]
GMM and optimal principal components-based Bayesian method for multimode fault diagnosis
[J].DOI:10.1016/j.compchemeng.2015.09.013 [本文引用: 1]
Nonstationary fault detection and diagnosis for multimode processes
[J].
Neighborhood based global coordination for multimode process monitoring
[J].DOI:10.1016/j.chemolab.2014.09.019 [本文引用: 1]
Modeling and monitoring for transitions based on local kernel density estimation and process pattern construction
[J].
PLS-based similarity analysis for mode identification in multimode manufacturing processes
[J].DOI:10.1016/j.ifacol.2015.09.063 [本文引用: 1]
多模态过程的全自动离线模态识别方法
[J].
A fully automatic offline mode identification method for multi-mode processes
[J].
Key principal components with recursive local outlier factor for multimode chemical process monitoring
[J].DOI:10.1016/j.jprocont.2016.09.006 [本文引用: 1]
Dynamic mutual information similarity based transient process identification and fault detection
[J].DOI:10.1002/cjce.23102 [本文引用: 1]
Multimode process monitoring based on mode identification
[J].
Supervised dimensionality reduction on grassmannian for image set recognition
[J].DOI:10.1162/neco_a_01148 [本文引用: 1]
/
〈 |
|
〉 |
