浙江大学学报(工学版), 2021, 55(10): 1937-1947 doi: 10.3785/j.issn.1008-973X.2021.10.016

机械与能源工程

基于多时间尺度相似性的涡扇发动机寿命预测

许昱晖,, 舒俊清, 宋亚, 郑宇, 夏唐斌,

上海交通大学 机械系统与振动国家重点实验室,上海 200240

Remaining useful life prediction of turbofan engine based on similarity in multiple time scales

XU Yu-hui,, SHU Jun-qing, SONG Ya, ZHENG Yu, XIA Tang-bin,

State Key Laboratory of Mechanical System and Vibration, Shanghai Jiao Tong University, Shanghai 200240, China

通讯作者: 夏唐斌,男,副教授,博导. orcid.org/0000-0001-9121-1716. E-mail: xtbxtb@sjtu.edu.cn

收稿日期: 2020-11-3  

基金资助: 国家自然科学基金资助项目(51875359);上海市自然科学基金资助项目(20ZR1428600);上海商用飞机系统工程科创中心联合研究基金资助项目(FASE-2021-M7);教育部-中国移动联合基金建设项目(MCM20180703)

Received: 2020-11-3  

Fund supported: 国家自然科学基金资助项目(51875359);上海市自然科学基金资助项目(20ZR1428600);上海商用飞机系统工程科创中心联合研究基金资助项目(FASE-2021-M7);教育部-中国移动联合基金建设项目(MCM20180703)

作者简介 About authors

许昱晖(1999—),男,硕士生,从事机器学习和装备健康预测的研究.orcid.org/0000-0001-5035-9466.E-mail:xuyuhui@sjtu.edu.cn , E-mail:xuyuhui@sjtu.edu.cn

摘要

针对传统相似性方法在提取健康指标和相似性匹配上存在的不足,提出结合自编码器神经网络的基于多时间尺度健康指标相似性的预测方法(AE MTS-HI). 采用自编码器从状态监测数据中提取表征发动机退化状态的健康指标,降低提取过程非线性信息的损失. 将测试退化轨迹长度的波动纳入考量,针对性地设计多时间尺度的健康指标进行相似性匹配. 这不仅可以克服单一时间尺度匹配导致的精度限制,而且可以提高预测的鲁棒性. 在涡扇发动机的公开数据集上验证所提方法的性能. 结果表明,利用该方法能够显著提升剩余使用寿命(RUL)的预测精度,为预知维护提供有力支撑.

关键词: 剩余使用寿命(RUL) ; 多时间尺度 ; 自编码器 ; 相似性方法 ; 涡扇发动机

Abstract

A novel method based on health index similarity in multiple time scales with autoencoder (AE MTS-HI) was proposed aiming at the shortage of the traditional similarity-based method in extracting health index and similarity matching. Autoencoder was applied to construct the health index based on monitoring data, which can minimize the loss of nonlinear information. The health index in multiple time scales was developed for similarity matching by considering the fluctuation of the length of test degradation trajectories. The method can remove the accuracy limitation caused by fixed time scales and enhance the prediction robustness. Performance of the proposed method was evaluated on public turbofan engines datasets. Results demonstrate that the method can improve the remaining useful life (RUL) prediction accuracy and provide stable support for predictive maintenance.

Keywords: remaining useful life (RUL) ; multiple time scale ; autoencoder ; similarity-based method ; turbofan engine

PDF (1382KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

许昱晖, 舒俊清, 宋亚, 郑宇, 夏唐斌. 基于多时间尺度相似性的涡扇发动机寿命预测. 浙江大学学报(工学版)[J], 2021, 55(10): 1937-1947 doi:10.3785/j.issn.1008-973X.2021.10.016

XU Yu-hui, SHU Jun-qing, SONG Ya, ZHENG Yu, XIA Tang-bin. Remaining useful life prediction of turbofan engine based on similarity in multiple time scales. Journal of Zhejiang University(Engineering Science)[J], 2021, 55(10): 1937-1947 doi:10.3785/j.issn.1008-973X.2021.10.016

涡扇发动机是飞行器的核心动力来源,可靠性要求极高. 传统的涡扇发动机维护模式以高频率、全方位的检修来保障发动机的可靠性,维护成本高昂. 提升涡扇发动机剩余使用寿命(remaining useful life, RUL)预测的准确性以优化维护策略,不仅可以避免因发动机故障引发的经济损失和安全风险,而且可以减少不必要的维护,降低维护成本[1].

常见的RUL预测方法可以分为3类,包括物理模型方法、数据驱动方法和混合方法[2]. 物理模型方法基于机理研究进行预测,但当系统复杂度较高时往往难以通过机理分析建立退化模型[3]. 数据驱动方法利用历史数据对设备退化规律进行建模,该方法无需大量的物理背景与先验信息. 混合方法综合了物理模型方法和数据驱动方法,开发有效的混合预测方法非常具有挑战[4].

数据驱动方法可以分为统计学习与机器学习2类. 统计学习主要包括Wiener过程[5]、Gamma过程[6]、粒子滤波[7]等方法. 机器学习方法包括马尔可夫模型[8]、卷积神经网络[9]、长短期记忆神经网络[10]、相似性方法等[11]. 由于无须建立参数繁多的模型且适用于预知维护下的实时决策,相似性方法自提出以来得到了广泛的研究[12-13]. 谷梦瑶等[14]运用主成分分析优化健康指标构建,通过支持向量数据描述法识别异常点. Cai等[15]在相似性匹配过程中引入核双样本检验,对预测结果进行威布尔分布拟合,得到RUL预测置信区间.

基于相似性的RUL预测的准确性受到两方面的限制. 1)学者多采用多元线性回归[11, 16]或主成分分析[3, 14]从状态监测数据中提取健康指标,但二者皆为线性方法,在降维过程中会造成非线性信息的损失. 自编码器(autoencoder)是非监督式神经网络,被广泛运用于高维数据的降维操作[17-19]. Chen等[20]证明了当降维前、后维度差异较大时,运用自编码器降维能够减少信息损失. 本文采用自编码器代替传统线性降维方法,以降低数据压缩过程中非线性信息的损失. 2)学者通常采用单一时间尺度的健康指标进行相似性匹配,这种设置忽视了退化轨迹长度的不一致性. 选用的时间尺度不得大于最短退化轨迹的长度,导致用以匹配的健康指标较短,对退化信息的利用不足[21]. 本文设计多时间尺度的健康指标,在多个时间尺度下进行相似性匹配.

综上所述,针对传统相似性方法在降维和时间尺度方面存在的不足,本文提出结合自编码器神的基于多时间尺度健康指标相似性的预测方法(health index similarity in multiple time scales with autoencoder,AE MTS-HI),利用自编码器降维和多时间尺度下的相似性匹配,提升RUL预测的准确性.

1. 预测方法建模

1.1. 问题描述

数据驱动的RUL预测主要依托传感器所获取的状态监测数据. 研究数据由商用模块化航空推进系统仿真软件(commercial modular aero-propulsion system simulation,C-MAPSS)[22]模拟得到. 不同涡扇发动机的初始磨损不同,寿命终点的定义综合考虑了风扇、高压压气机和低压压气机的失效情况. C-MAPSS的输出结果记录了涡扇发动机在不同运行条件下的退化过程,模拟了21个状态监测参数. 状态监测数据反映了涡扇发动机的风扇、压气机、涡轮等多个部件在退化过程中温度、压强、转速等参数的变化,如图1所示.

图 1

图 1   状态监测参数的示意图

Fig.1   Schematic diagram of condition monitoring parameters


由于传感器数量众多,同时发动机退化过程中存在诸多的非线性因素与模式,状态监测数据具有维度高、非线性的特点. 构建健康指标时,需要将数据从高维压缩至一维,因此要求降维方法有较强的非线性特征融合能力. 退化轨迹的长度具有不一致性,如果采用单一时间尺度进行相似性匹配,那么进行匹配的这段轨迹不得大于最短的退化轨迹,这将导致匹配的退化轨迹长度受限. 考虑到涡扇发动机运行周期较长,各阶段的退化规律不同,在寿命末期存在显著的加速退化,预测方法需要有良好的鲁棒性,能够适应不同寿命阶段的退化特点.

1.2. 自编码器

自编码器具有对称结构,由编码器和解码器组成,输入层和输出层神经元数相同. 训练时以输入数据作为输出目标,训练后编码器可以输出原始信号的压缩表示.

图2所示为仅含一个隐含层的自编码器,输入数据的维度为 $ {d}_{\mathrm{i}\mathrm{n}} $,单隐含层的维度为 $ {d}_{\mathrm{o}\mathrm{u}\mathrm{t}} $. 编码过程可以表示为

${\boldsymbol{y}} = f\left( {{{\boldsymbol{W}}_{{1}}}{\boldsymbol{x}} + {{\boldsymbol{b}}_{{1}}}} \right).$

式中: $ f $为隐含层激活函数, $ {\boldsymbol{W}}_{{{1}}} $$ {d}_{\mathrm{o}\mathrm{u}\mathrm{t}}\times {d}_{\mathrm{i}\mathrm{n}} $的权重矩阵, $ {\boldsymbol{b}}_{{1}} $$ {d}_{\mathrm{o}\mathrm{u}\mathrm{t}} $维的偏置向量. 解码过程可以表示为

${\boldsymbol{x}}^{'}=g\left({\boldsymbol{W}}_{{{2}}}{\boldsymbol{y}}+{\boldsymbol{b}}_{{2}}\right).$

式中: $ g $为输出层激活函数, $ {\boldsymbol{W}}_{{2}} $$ {d}_{\mathrm{i}\mathrm{n}}\times {d}_{\mathrm{o}\mathrm{u}\mathrm{t}} $的权重矩阵, $ {\boldsymbol{b}}_{{2}} $$ {d}_{\mathrm{i}\mathrm{n}} $维的偏置向量. 训练最小化目标函数为

$J\left({\boldsymbol{x}},{\boldsymbol{x}}^{'}\right)={||{\boldsymbol{x}}-{\boldsymbol{x}}^{'}||}_{2}^{2}.$

通过隐含层的非线性激活函数(如ReLu、tanh等),自编码器神经网络可以学习到非线性变换;主成分分析仅可作线性变换,特征提取能力受限.

图 2

图 2   自编码器的结构

Fig.2   Structure of autoencoder


1.3. AE MTS-HI方法的技术路线

AE MTS-HI方法可以分为3大模块:健康指标建立、相似性匹配和RUL预测,流程如图3所示. 采用自编码器代替传统降维方法,建立一维健康指标,构建参考退化轨迹信息库. 与单一时间尺度方法直接截取固定长度的轨迹片段不同,该方法根据测试轨迹长度选取多个时间尺度下的轨迹片段,与退化信息库中的参考退化轨迹进行相似性匹配,获得不同时间尺度下测试轨迹与每一参考轨迹间的最似位置与最似距离. 在一个时间尺度下,可以由相应的最似位置计算基于单一参考轨迹的RUL预测值;根据最似距离进行加权求和,得到该时间尺度下基于所有参考轨迹的RUL预测值. 取所有时间尺度下预测值的平均值为最终RUL预测值.

图 3

图 3   AE MTS-HI方法的流程图

Fig.3   Framework of AE MTS-HI


2. AE MTS-HI预测方法

2.1. 健康指标建立

构建健康指标需要将高维的状态监测数据压缩至一维. 采用具有较强非线性特征融合能力的自编码器代替传统线性降维方法,以减少非线性信息的损失,使得健康指标能够更好地表征涡扇发动机的退化情况. 为了加强自编码器的映射能力,设置3个全连接的隐含层. 隐含层2既作为编码器的输出层,又作为解码器的输入层,神经元数等于降维维度,自编码的具体结构如表1所示.

表 1   自编码器的参数设置

Tab.1  Parameters setting of autoencoder

神经元数 激活函数
输入层 $ {d}_{\mathrm{i}\mathrm{n}} $
隐含层1 $ {d}_{\mathrm{i}\mathrm{n}}/2 $ ReLU函数
隐含层2 $ {d}_{\mathrm{o}\mathrm{u}\mathrm{t}} $ 线性激活函数
隐含层3 $ {d}_{\mathrm{i}\mathrm{n}}/2 $ ReLU函数
输出层 $ {d}_{\mathrm{i}\mathrm{n}} $ tanh函数

新窗口打开| 下载CSV


隐含层1和隐含层3使用ReLU函数作为激活函数,有利于实现网络的稀疏连接,且训练速度较快,如下所示:

${\rm{ReLU}}\left(x\right)={\max}\;\{0,x\}.$

输出层使用tanh函数,如下所示:

$\begin{array}{*{20}{c}} {{\rm{tanh}}\left( x \right) = \dfrac{{{{\rm{e}}^x} - {{\rm{e}}^{ - x}}}}{{{{\rm{e}}^x} + {{\rm{e}}^{ - x}}}}.} \end{array}$

优化器选择适应性动量估计法(adaptive moment estimation,Adam),Adam在训练降维模型时收敛速度快且效果佳[17].

为了降低信号振动对相似性匹配的干扰,对由健康指标组成的退化轨迹采用移动平均法进行平滑化处理. 假设对时间序列数据 ${\boldsymbol{Y}}=\{{Y}_{1},{Y}_{2}, \cdots , $ $ {Y}_{n}\}$进行处理,过程如下:

$Y_j^{'} = \left\{ {\begin{array}{*{20}{c}} {{{N^{ - 1}}}\displaystyle\mathop \sum \nolimits_{i = {\rm{max}}\;\{1,j - \left( {N - 1} \right)/2\}}^{{\rm{min}}\;\left\{ {n,j + \left( {N - 1} \right)/2} \right\}} {Y_i},\;N为奇数;}\\ {{{N^{ - 1}}}\displaystyle\mathop \sum \nolimits_{i = {\rm{max}}\;\{ {1,j - N/2 + 1} \}}^{{\rm{min}}\; {\{n,j + N/2\}} } {Y_i},\;N为偶数.} \end{array}} \right.$

式中:n为时间序列长度, $ {Y}_{j}^{'} $为平滑后数据,N为平滑因子.

2.2. 相似性匹配

相似性匹配是依据健康指标衡量退化轨迹间的相似性,计算测试退化轨迹与参考退化轨迹间最似距离和最似位置的过程. 测试样本i的健康指标可以表示为 ${\boldsymbol{Z}}^{\boldsymbol{i}}=\left[{Z}_{1}^{i},{Z}_{2}^{i}, \cdots ,{Z}_{{t}_{i}}^{i}\right]$$ \mathrm{其}\mathrm{中}{t}_{i} $为设备i的运行周期. 参考轨迹j的健康指标可以表示为 ${\boldsymbol{X}}^{{j}}=\left[{X}_{1}^{j},{X}_{2}^{j}, \cdots ,{X}_{{T}_{j}}^{j}\right]$$ {\mathrm{其}\mathrm{中}T}_{j} $为设备j的寿命周期.

由于退化轨迹长度不同,需要截取相同时间尺度的片段进行比较,设时间尺度为L. 因为预测RUL所需考察的是设备当前退化情况,对于测试样本,选择最后一个片段 $ {\boldsymbol{Z}}_{{L}}^{{i}}=\left[{Z}_{{t}_{i}-L+1}^{i},{Z}_{{t}_{i}-L+2}^{i}, \cdots ,{Z}_{{t}_{i}}^{i}\right] $匹配相似性. 对于长度为 $ {T}_{j} $的参考轨迹,在时间尺度 $ L $下可以转换为 $ {T}_{j}-L+1 $个长度为 $ L $的轨迹片段,表示为 $ {\boldsymbol{X}}_{{L}\_{{k}}}^{{j}}=\left[{X}_{k}^{j},{X}_{k+1}^{j}, \cdots ,{X}_{k+L-1}^{j}\right]$,其中 $ k=1, $ $ 2, \cdots ,{T}_{j}-L+1 $. 采用欧几里得距离衡量轨迹间的相似性,测试轨迹片段 $ {\boldsymbol{Z}}_{{L}}^{{i}} $和参考轨迹片段 $ {\boldsymbol{X}}_{{L}\_{{k}}}^{{j}} $间的相似性,可以表示为

${D}_{L\_k}^{i,j}=\sqrt{\sum {\left({\boldsymbol{Z}}_{{L}}^{{i}}-{\boldsymbol{X}}_{{L}\_{{k}}}^{{j}}\right)}^{2}}.$

测试轨迹i和参考轨迹j间的最似距离和最似位置可以分别表示为

${D}_{L}^{i,j}=\underset{k=1,2, \cdots ,{T}_{j}-L+1}{\mathrm{min}}\left({D}_{L\_k}^{i,j}\right),$

${C}_{L}^{i,j}=\underset{k=1,2, \cdots ,{T}_{j}-L+1}{\mathrm{arg}\mathrm{min}}\left({D}_{L\_k}^{i,j}\right).$

通过相似性匹配可知,参考轨迹j的寿命周期内与测试轨迹i最相似的是第 $ {C}_{L}^{i,j} $个片段,这个片段将用于RUL的预测.

2.3. RUL预测

图4所示,h为健康指标,t为设备运行时间,根据测试轨迹与每一参考轨迹间的最似位置,可以求得测试样本的RUL预测值. 由参考轨迹j计算得到的测试样本i的RUL为

${R}_{L}^{i,j}={T}_{j}-\left({C}_{L}^{i,j}+L-1\right).$

在集成不同参考轨迹的RUL预测值前,对参考轨迹依照最似距离进行排序,选取最似距离较小的m个参考轨迹用于预测,m称为最似参考轨迹数. 记m个轨迹的序号集合为 $ M,\left|M\right|=m $.

集成权重由最似距离决定:

${W}_{L}^{i,j}=\dfrac{\dfrac{1}{{D}_{L}^{i,j}}}{\displaystyle\sum _{s\in M}\dfrac{1}{{D}_{L}^{i,s}}},j\in M.$

单时间尺度下的RUL预测值为

${\rm{RUL}}_L^i = \sum\limits_{j \in M} {\left( {W_L^{i,j} R_L^{i,j}} \right)} .$

图 4

图 4   相似性匹配与RUL预测的示意图

Fig.4   Schematic diagram of similarity matching and RUL prediction


2.4. 多时间尺度

针对传统单一时间尺度匹配导致的RUL预测精度限制,提出多时间尺度下的相似性匹配方法. 在单时间尺度方法中,时间尺度不得大于退化轨迹的最短长度. 由于测试轨迹长度等于测试设备运行周期,参考轨迹长度等于训练设备寿命周期,测试轨迹的长度一般较短. 受限于长度最短的测试轨迹,时间尺度通常偏小,导致退化信息利用不充分. 多时间尺度方法针对不同长度的测试退化轨迹,采用不同时间尺度的健康指标进行相似性匹配,综合多尺度下的RUL预测值为最终预测值. 建模时,确定备选时间尺度 $ \left\{{L}_{1},{L}_{2},\cdots {,L}_{n}\right\} $,其中n为时间尺度规模,时间尺度可在一定内范围内选择. 对于测试轨迹i,选择满足 $ L\leqslant {t}_{i} $的时间尺度子组 $ \left\{{L}_{1},{L}_{2},\cdots {,L}_{u}\right\} $进行预测, $ \left\{{L}_{1},{L}_{2},\cdots {,L}_{u}\right\}\subseteq $ $ \left\{{L}_{1},{L}_{2},\cdots {,L}_{n}\right\} $,其中u为测试轨迹选用的时间尺度数.

若测试轨迹选用时间尺度多于1个,则须分别在多个时间尺度下进行匹配与预测,再取预测平均值为最终RUL预测值.

${\mathrm{R}\mathrm{U}\mathrm{L}}^{i}=\frac{1}{u}{\sum }_{v=1}^{u}{\mathrm{R}\mathrm{U}\mathrm{L}}_{{L}_{v}}^{i}.$

多时间尺度方法主要有以下两方面的优势. 1)有效解决了时间尺度偏小的问题,对于较长的测试样本,能够更加充分地利用退化轨迹信息,不再受其他测试样本的限制. 2)避免了时间尺度选择的困难,仅需选定合理的尺度范围,无须寻找最优时间尺度. 通过综合多时间尺度下的预测结果进一步提升预测效果,能够适应不同退化阶段的RUL预测.

3. 案例研究

3.1. 数据集介绍

为了验证所提方法的性能,使用C-MAPSS仿真数据集[22]的一号子集(FD001)进行案例分析. 训练集记录了发动机整个寿命周期的数据,测试集只包含从开始运行至失效前某个时刻的数据. 如表2所示,FD001训练集和测试集各有100个发动机,运行状态和故障模式都仅有一种.

表 2   FD001数据规模

Tab.2  Detailed descriptions of FD001

数据集 样本个数 数据总量 最小运行周期数 最大运行周期数
训练集 100 20631 128 362
测试集 100 13096 31 303

新窗口打开| 下载CSV


数据集的样本长度分布如图5所示. 可知,样本长度具有不一致性,测试集数据普遍短于训练集数据. 若在单时间尺度方法下时间尺度最大仅能设为31,则将导致大量的退化轨迹信息无法被利用.

图 5

图 5   FD001样本长度分布

Fig.5   Distributions of running cycles in FD001


3.2. 预处理

由于传感信号种类较多,在建立健康指标前须进行预处理. 归一化可以消除数据量纲带来的影响,本文所选用的归一化方法为最小-最大值标准化,如下所示:

${{X}}_i^{s,{\rm{N}}} = \frac{{{{X}}_i^s - \mathop {{\rm{min}}}\limits_{x \in {{\boldsymbol{X}}^s}} x}}{{\mathop {{\rm{max}}}\limits_{x \in {{\boldsymbol{X}}^s}} x - \mathop {{\rm{min}}}\limits_{x \in {{\boldsymbol{X}}^s}} x}}.$

式中:Xs为传感器s的数据集, ${{{X}}_i^s}$为传感器s的数据集i时刻的值, ${{X}}_{{i}}^{{s,{\rm{N}}}}$为归一化后的 ${{{X}}_i^s}$.

初步特征选择主要是为了剔除与设备退化无关的特征,以提升降维的效果. FD001仅包含一种运行状态,因此3个运行状态参数可不纳入考虑. 对21个实时状态信号进行归一化处理后可发现,信号的趋势可以分为3类,包括增长型、衰减型和固定型. 增长型与衰减型信号数值总体上随着设备的退化而增大和减小,如图6(a)、(b)所示. 固定型信号数值保持不变或仅在2个数值上波动,无法为建立健康指标提供有效信息. 仅选择增长型和衰减型信号进行降维,总计14个信号,如表3所示.

图 6

图 6   信号趋势分类

Fig.6   Classification based on tendency of signals


表 3   传感器信号趋势分类

Tab.3  Classification of sensor signals

分类 传感器编号
增长型 2,3,4,8,9,11,13,14,15,17
衰减型 7,12,20,21
固定型 1,5,6,10,16,18,19

新窗口打开| 下载CSV


涡扇发动机在运行初期的损耗可以忽略不计,因此可以认为发动机在开始退化前的RUL保持不变. 若直接使用总运行周期数减去当前运行周期数来设置训练集RUL标签,则会导致RUL的预测值偏大. 通过设置阈值,对训练集的RUL标签进行修正. 研究表明,在C-MAPSS数据集中,将RUL的阈值设置为130是较合理的[23],RUL的修正如图7所示.

图 7

图 7   RUL标签修正的示意图

Fig.7   Schematic diagram of RUL rectification


3.3. 参数设置

在该方法中,须设定的参数包括自编码器的训练批次尺寸b和训练周期数k、健康指标的平滑因子N、用于计算RUL的最似参考轨迹数m以及健康指标时间尺度. 其中,时间尺度的选择是该方法的关键,因此设定备选时间尺度后对其他参数进行调整.

测试样本的最小长度为31,由于最小时间尺度不得大于样本最小长度,设定最小时间尺度为30. 根据健康指标显著增长阶段的时间长度,设定最大时间尺度为70. 为了使多时间尺度的效果更显著,等距设置3个时间尺度. 综上所述,设定的时间尺度组为{30,50,70},预测时选用其中不大于测试样本运行长度的时间尺度,如表4所示.

表 4   相似性匹配的时间尺度设定

Tab.4  Time scales for similarity matching

测试样本运行长度 测试样本数量 选用时间尺度
$30\leqslant {t}_{i} < 50$ 7 30
$50\leqslant {t}_{i} < 70$ 7 30,50
$70\leqslant {t}_{i}$ 86 30,50,70

新窗口打开| 下载CSV


除时间尺度外的4个待设定参数间的相互作用对参数寻优结果的影响较小,因此通过逐一改变参数迭代寻找最优值,过程如图8所示. 根据实验结果,设定b为128,k为40,N为15,m为10.

图 8

图 8   自编码器参数迭代的实验结果

Fig.8   Experimental results of parameter tuning of autoencoder


3.4. 预测实现

在使用训练集对自编码器进行训练后,提取编码器作为降维模型并构建退化信息库. 如图9所示,平滑化处理后的健康指标较好地表征了发动机的退化规律. 对测试集进行相应处理后,在多时间尺度下将测试样本输入退化信息库进行相似性匹配. 如图10所示,RUL预测结果和实际值非常接近.

图 9

图 9   退化信息库

Fig.9   Degradation model reference library


图 10

图 10   RUL预测结果

Fig.10   RUL prediction results


4. 分析与讨论

4.1. 预测效果分析

若在失效前没有对涡扇发动机进行合理的维护,则将引发严重的安全事故和经济损失. 引入2个评价指标均方根误差(root mean square error,RMSE)和评分函数(scoring function)[22],以更加全面地定量评价RUL预测效果.

RMSE的计算如下所示:

$\begin{split}\\ {\rm{RMSE}}\sqrt {{n^{ - 1}}\sum\limits_{i = 1}^n {{{\left( {{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i} \right)}^2}} } . \end{split}$

式中: $ {\mathrm{R}\mathrm{U}\mathrm{L}}^{i} $为测试样本i的RUL预测值, $ {\mathrm{R}\mathrm{U}\mathrm{L}}_{\mathrm{r}\mathrm{e}\mathrm{a}\mathrm{l}}^{i} $为测试样本i的实际RUL,共有 $ n $个测试样本.

Scoring Function考虑了高估RUL可能带来更大的损失,对于高估给予了一定的惩罚. 函数为

$\begin{array}{*{20}{c}} {{\rm{Scor}}{{\rm{e}}_i} = \left\{ {\begin{array}{*{20}{c}} {\exp\;\left[{ - \left( {\dfrac{{{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i}}{{13}}} \right)}\right] - 1,\;{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i < 0};\\ {{\exp\;{\left( {\dfrac{{{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i}}{{10}}} \right)}} - 1,\;{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i \geqslant 0}. \end{array}} \right.} \end{array}$

Score越小,表示预测效果越好.

为了消除自编码器训练随机性的影响,将20次实验结果的平均值作为最终评价指标. 将实验结果与现有研究中的支持向量机(support vector machine,SVM)、神经网络方法及其他基于相似性的方法进行对比,结果如表5所示. 从RMSE和Score来衡量,AE MTS-HI方法在预测准确性上都优于上述方法,证明该方法具有较强的竞争力.

表 5   不同预测方法的结果对比

Tab.5  Comparison results with methods proposed by other researchers

方法 RMSE Score
SVM[24] 29.822
CNN[9] 18.448 1 286.7
LSTM[10] 16.14 338
Similarity-based[16] 19.87
Similarity-based with SVR[25] 388
Similarity-based with KTST[15] 16.87 377.08
AE MTS-HI 14.07 291.67

新窗口打开| 下载CSV


4.2. 自编码器效应分析

选取多元线性回归、等距特征映射、主成分分析3种方式,与自编码器降维进行对比. 当进行多元线性回归时,以实时状态信号为自变量,归一化后的运行周期为标签. 等距特征映射是经典的非线性流形学习方法,降维时须定义空间内各点的近邻点数量,经参数寻优,将其设为10. 当采用主成分分析降维时,提取第一主成分作为健康指标. 除降维方法不同外,预测算法其他环节的设置均与所提的AE MTS-HI方法一致.

表6所示,通过多元线性回归建立健康指标,预测误差较大. 采用等距特征映射和主成分分析方法进行降维,预测效果有所提升. 采用自编码器降维后,预测结果的RMSE和Score皆低于其他3种方法,说明自编码器的降维效果最佳. 利用非线性激活函数,自编码器实现了非线性关系的学习. 压缩后的数据可以通过解码器重构至原有维度,最大程度上减少了信息的损失,使得建立的健康指标能够更加准确地表征设备退化状态.

表 6   不同降维方法预测的结果对比

Tab.6  Comparison results with other dimensionality reduction methods

降维方法 RMSE Score
多元线性回归 16.32 486.50
等距特征映射 14.50 339.95
主成分分析 14.29 302.95
自编码器 14.07 291.67

新窗口打开| 下载CSV


为了分析自编码器结构设计对算法精度的影响,在算法其他环节不变的条件下,调整隐含层个数及神经元数,开展自编码器训练参数寻优. 如表7所示,当自编码器隐含层个数为3或5时,RUL预测的准确性较高,隐含层神经元数对预测效果的影响相对较小.

表 7   不同自编码器结构与参数预测结果的对比

Tab.7  Comparison results with other autoencoder structures and parameters

隐含层个数 隐含层神经元数 RMSE
1 1 14.31
3 4,1,4 14.17
3 7,1,7 14.07
3 10,1,10 14.12
5 10,6,1,6,10 14.13
5 7,7,1,7,7 14.09

新窗口打开| 下载CSV


4.3. 多尺度健康指标效应分析

多时间尺度方法突破了单一时间尺度偏小且无法适应不同信息捕捉要求的限制. 在算法其他环节设置一致的条件下,比较单一时间尺度方法与多时间尺度方法的预测结果,如表8所示. 对于不同长度区间的测试样本,多时间尺度下的预测Score值都低于单一时间尺度下的预测Score值. 从整个测试集来看,多时间尺度方法的Score较单一时间尺度方法降低了22%,预测准确性提升显著.

表 8   多时间尺度对预测结果的影响

Tab.8  Effects of multiple time scales on predicting results

样本长度 样本数量 Score
L=30 L=50 L=70 多时间尺度
$30\leqslant {t}_{i} < 50$ 7 26.30 26.30
$50\leqslant {t}_{i} < 70$ 7 8.41 8.86 6.56
$70\leqslant {t}_{i}$ 86 337.70 276.23 284.35 258.81
所有样本 100 372.41 291.67

新窗口打开| 下载CSV


为了探究时间尺度对预测效果的影响,将测试集依照样本长度分为6个子集,样本长度范围分别为[30,60)、[60,90)、[90,120)、[120,150)、[150,180)、[180、303]. 如图11所示为6个子集在不同单一时间尺度下预测的RMSE,选用的时间尺度不大于该子集样本的最短长度. RMSE最小的时间尺度为对应子集的最优时间尺度,总体趋势上最优时间尺度随着样本长度先增大后减小. 最优时间尺度随样本长度增大是因为更长的退化轨迹为预测提供了更丰富的信息. 当样本长度增大到一定范围时,最优时间尺度减小,是因为发动机进入了加速退化阶段,如图9所示,发动机寿命末期健康指标显著增大. 此时,只需通过较短轨迹,可以准确预测发动机的RUL. 若选用较大的时间尺度,则会引入干扰信息,不利于预测. 难以通过样本长度直接选择最优时间尺度用以预测,因为最优时间尺度减小本质上是由RUL减小到一定程度引起的,由样本长度无法推知RUL.

图 11

图 11   单一时间尺度对预测效果的影响

Fig.11   Effects of single time scale size on predicting results


为了更加直观地分析多时间尺度的优势,选取测试集中编号为23、49、60、61、76的发动机为例,不同时间尺度下RUL预测值与真实值的差值e表9所示.

表 9   典例概况及预测误差

Tab.9  Description and prediction error of typical instances

样本编号 样本长度 RUL e
L=30 L=50 L=70 多时间尺度
23 130 113 4.40 4.99 −2.77 2.21
60 147 100 4.81 1.61 −7.17 −0.25
61 159 21 2.32 5.88 4.69 4.30
76 205 10 0.12 −1.80 −1.83 −1.17
49 303 21 −2.36 −3.82 −4.08 −3.42

新窗口打开| 下载CSV


比较编号为23、60、61的发动机可知,3个样本都属于中等数据长度,但最优时间尺度不同. 如图12所示,61号发动机已处于加速退化阶段,实际RUL为21,最优时间尺度为30. 23和60号发动机的实际RUL较大,需要较长的退化轨迹捕捉更多信息,最优时间尺度分别为70和50. 在多时间尺度方法下,61号发动机的RUL预测误差小于2个固定时间尺度,23和60号发动机的RUL预测误差小于3个固定时间尺度. 综合多个时间尺度的预测结果可知,多时间尺度方法化解了仅依靠样本长度无法确定最优时间尺度的难题.

图 12

图 12   中等长度样本的健康指标

Fig.12   Health indexes of medium-length instances


比较编号为49、61、76的发动机可知,3个样本数据的长度差异较大,但是实际RUL较小. 如图13所示,发动机的健康指标变化十分显著,仅需较短片段便可判断当前状态. 由实验结果可知,3个样本的最优时间尺度都为30,通过综合多时间尺度健康指标可以削弱较长退化轨迹引入的干扰因素的影响.

图 13

图 13   寿命末期样本的健康指标

Fig.13   Health indexes of end-of-life instances


综上所述,采用自编码器提取健康指标减少了信息损失,多时间尺度下的相似性匹配加强了对退化信息的综合利用,因此利用AE MTS-HI方法提高了RUL预测的准确性.

5. 结 语

本文针对涡扇发动机状态监测数据维度高、非线性的特点以及单一时间尺度方法对退化信息利用不足的问题,提出结合自编码器的基于多时间尺度健康指标相似性的剩余使用寿命预测方法. 该方法采用编码器构建健康指标,减少了非线性信息的损失. 考虑到样本长度的不一致性,运用多时间尺度健康指标进行相似性匹配,更加充分地利用退化信息,解决了最优时间尺度选择的难题. 在公开数据集上开展实验,与其他研究的预测效果进行对比. 结果表明,利用该方法能够显著地提高涡扇发动机剩余使用寿命的预测精度,可以为维护策略的制定提供有力支撑,降低发动机的维护成本. 此外,该方法具有改进的空间,未来将对不同时间尺度下预测结果的综合方式进行优化,以进一步提升RUL预测精度;探索多工况、多故障模式下的RUL预测,以概率形式表达RUL预测结果,从而提升算法的工程使用价值.

参考文献

TAHAN M, TSOUTSANIS E, MUHAMMAD M, et al

Performance-based health monitoring, diagnostics and prognostics for condition-based maintenance of gas turbines: a review

[J]. Applied Energy, 2017, 198: 122- 144

DOI:10.1016/j.apenergy.2017.04.048      [本文引用: 1]

XIA T, DONG Y, XIAO L, et al

Recent advances in prognostics and health management for advanced manufacturing paradigms

[J]. Reliability Engineering and System Safety, 2018, 178: 255- 268

DOI:10.1016/j.ress.2018.06.021      [本文引用: 1]

LIU Y, HU X, ZHANG W

Remaining useful life prediction based on health index similarity

[J]. Reliability Engineering and System Safety, 2019, 185: 502- 510

DOI:10.1016/j.ress.2019.02.002      [本文引用: 2]

JAVED K, GOURIVEAU R, ZERHOUNI N

State of the art and taxonomy of prognostics approaches, trends of prognostics applications and open issues towards maturity at different technology readiness levels

[J]. Mechanical Systems and Signal Processing, 2016, 94: 214- 236

[本文引用: 1]

WANG H, MA X, ZHAO Y

An improved Wiener process model with adaptive drift and diffusion for online remaining useful life prediction

[J]. Mechanical Systems and Signal Processing, 2019, 127: 370- 387

DOI:10.1016/j.ymssp.2019.03.019      [本文引用: 1]

王浩伟, 徐廷学, 刘勇

基于随机参数Gamma过程的剩余寿命预测方法

[J]. 浙江大学学报:工学版, 2015, 49 (4): 699- 704

URL     [本文引用: 1]

WANG Hao-wei, XU Ting-xue, LIU Yong

Remaining useful life prediction method based on Gamma processes with random parameters

[J]. Journal of Zhejiang University: Engineering Science, 2015, 49 (4): 699- 704

URL     [本文引用: 1]

ZHANG H, MIAO Q, ZHANG X, et al

An improved unscented particle filter approach for lithium-ion battery remaining useful life prediction

[J]. Microelectronics Reliability, 2018, 81: 288- 298

DOI:10.1016/j.microrel.2017.12.036      [本文引用: 1]

CHEN Z, LI Y, XIA T, et al

Hidden Markov model with auto-correlated observations for remaining useful life prediction and optimal maintenance policy

[J]. Reliability Engineering and System Safety, 2019, 184: 123- 136

DOI:10.1016/j.ress.2017.09.002      [本文引用: 1]

BABU G S, ZHAO P, LI X. Deep convolutional neural network based regression approach for estimation of remaining useful life [C]// Proceedings of the International Conference on Database Systems for Advanced Applications. Berlin: Springer, 2016: 214-228.

[本文引用: 2]

ZHENG S, RISTOVSKI K, FARAHAT A, et al. Long short-term memory network for remaining useful life estimation [C]// Proceedings of the International Conference on Prognostics and Health Management. Washington, D. C.: IEEE, 2017: 88-95.

[本文引用: 2]

WANG T, YU J, SIEGEL D, et al. A similarity-based prognostics approach for remaining useful life estimation of engineered systems [C]// International Conference on Prognostics and Health Management. Washington, D. C.: IEEE, 2008: 1-6.

[本文引用: 2]

ZIO E, DI MAIO F

A data-driven fuzzy approach for predicting the remaining useful life in dynamic failure scenarios of a nuclear system

[J]. Reliability Engineering and System Safety, 2010, 95 (1): 49- 57

DOI:10.1016/j.ress.2009.08.001      [本文引用: 1]

YOU M Y, MENG G

A generalized similarity measure for similarity-based residual life prediction

[J]. Proceedings of the Institution of Mechanical Engineers, Part E:Journal of Process Mechanical Engineering, 2011, 225 (3): 151- 160

DOI:10.1177/0954408911399832      [本文引用: 1]

谷梦瑶, 陈友玲, 王新龙

多退化变量下基于实时健康度的相似性寿命预测方法

[J]. 计算机集成制造系统, 2017, 23 (2): 362- 372

URL     [本文引用: 2]

GU Meng-yao, CHEN You-ling, WANG Xin-long

Multi-index modeling for similarity-based residual life estimation based on real-time health degree

[J]. Computer Integrated Manufacturing Systems, 2017, 23 (2): 362- 372

URL     [本文引用: 2]

CAI H, JIA X, FENG J, et al

A similarity based methodology for machine prognostics by using kernel two sample test

[J]. ISA Transactions, 2020, 103: 112- 121

DOI:10.1016/j.isatra.2020.03.007      [本文引用: 2]

AZEVEDO D, RIBEIRO B, CARDOSO A. Online simulation of methods to predict the remaining useful lifetime of aircraft components [C]// Proceedings of Experiment International Conference. Washington, D. C.: IEEE, 2019: 199-203.

[本文引用: 2]

CHARTE D, CHARTE F, GARCÍA S, et al

A practical tutorial on autoencoders for nonlinear feature fusion: taxonomy, models, software and guidelines

[J]. Information Fusion, 2018, 44: 78- 96

DOI:10.1016/j.inffus.2017.12.007      [本文引用: 2]

REN L, SUN Y, CUI J, et al

Bearing remaining useful life prediction based on deep autoencoder and deep neural networks

[J]. Journal of Manufacturing Systems, 2018, 48 (Part C): 71- 77

URL    

MA J, SU H, ZHAO W, et al

Predicting the remaining useful life of an aircraft engine using a stacked sparse autoencoder with multilayer self-learning

[J]. Complexity, 2018, 2018: 1- 13

URL     [本文引用: 1]

CHEN C, LEU J, PRAKOSA S W. Using autoencoder to facilitate information retention for data dimension reduction [C]// 3rd International Conference on Intelligent Green Building and Smart Grid. Washington, D. C.: IEEE, 2018: 1-5.

[本文引用: 1]

XIA T, SONG Y, ZHENG Y, et al

An ensemble framework based on convolutional bi-directional LSTM with multiple time windows for remaining useful life estimation

[J]. Computers in Industry, 2020, 115: 103182

DOI:10.1016/j.compind.2019.103182      [本文引用: 1]

SAXENA A, GOEBEL K, SIMON D, et al. Damage propagation modeling for aircraft engine run-to-failure simulation [C]// International Conference on Prognostics and Health Management. Washington, D. C.: IEEE, 2008: 1-9.

[本文引用: 3]

HEIMES F O. Recurrent neural networks for remaining useful life estimation [C]// International Conference on Prognostics and Health Management. Washington, D. C.: IEEE, 2008: 1-6.

[本文引用: 1]

LOUEN C, DING S X, KANDLER C. A new framework for remaining useful life estimation using support vector machine classifier [C]// Proceedings of Conference on Control and Fault-Tolerant Systems. Washington, D. C.: IEEE, 2013: 228-233.

[本文引用: 1]

KHELIF R, CHEBEL-MORELLO B, MALINOWSKI S, et al

Direct remaining useful life estimation based on support vector regression

[J]. IEEE Transactions on Industrial Electronics, 2017, 64 (3): 2276- 2285

DOI:10.1109/TIE.2016.2623260      [本文引用: 1]

/