<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 状态监测参数的示意图

Fig.1 Schematic diagram of condition monitoring parameters

由于传感器数量众多，同时发动机退化过程中存在诸多的非线性因素与模式，状态监测数据具有维度高、非线性的特点. 构建健康指标时，需要将数据从高维压缩至一维，因此要求降维方法有较强的非线性特征融合能力. 退化轨迹的长度具有不一致性，如果采用单一时间尺度进行相似性匹配，那么进行匹配的这段轨迹不得大于最短的退化轨迹，这将导致匹配的退化轨迹长度受限. 考虑到涡扇发动机运行周期较长，各阶段的退化规律不同，在寿命末期存在显著的加速退化，预测方法需要有良好的鲁棒性，能够适应不同寿命阶段的退化特点.

1.2. 自编码器

自编码器具有对称结构，由编码器和解码器组成，输入层和输出层神经元数相同. 训练时以输入数据作为输出目标，训练后编码器可以输出原始信号的压缩表示.

如图2所示为仅含一个隐含层的自编码器，输入数据的维度为 $ {d}_{\mathrm{i}\mathrm{n}} $，单隐含层的维度为 $ {d}_{\mathrm{o}\mathrm{u}\mathrm{t}} $. 编码过程可以表示为

(1) ${\boldsymbol{y}} = f\left( {{{\boldsymbol{W}}_{{1}}}{\boldsymbol{x}} + {{\boldsymbol{b}}_{{1}}}} \right).$

式中： $ f $为隐含层激活函数， $ {\boldsymbol{W}}_{{{1}}} $为 $ {d}_{\mathrm{o}\mathrm{u}\mathrm{t}}\times {d}_{\mathrm{i}\mathrm{n}} $的权重矩阵， $ {\boldsymbol{b}}_{{1}} $为 $ {d}_{\mathrm{o}\mathrm{u}\mathrm{t}} $维的偏置向量. 解码过程可以表示为

(2) ${\boldsymbol{x}}^{'}=g\left({\boldsymbol{W}}_{{{2}}}{\boldsymbol{y}}+{\boldsymbol{b}}_{{2}}\right).$

式中： $ g $为输出层激活函数， $ {\boldsymbol{W}}_{{2}} $为 $ {d}_{\mathrm{i}\mathrm{n}}\times {d}_{\mathrm{o}\mathrm{u}\mathrm{t}} $的权重矩阵， $ {\boldsymbol{b}}_{{2}} $为 $ {d}_{\mathrm{i}\mathrm{n}} $维的偏置向量. 训练最小化目标函数为

(3) $J\left({\boldsymbol{x}},{\boldsymbol{x}}^{'}\right)={||{\boldsymbol{x}}-{\boldsymbol{x}}^{'}||}_{2}^{2}.$

通过隐含层的非线性激活函数（如ReLu、tanh等），自编码器神经网络可以学习到非线性变换；主成分分析仅可作线性变换，特征提取能力受限.

图 2

图 2 自编码器的结构

Fig.2 Structure of autoencoder

1.3. AE MTS-HI方法的技术路线

AE MTS-HI方法可以分为3大模块：健康指标建立、相似性匹配和RUL预测，流程如图3所示. 采用自编码器代替传统降维方法，建立一维健康指标，构建参考退化轨迹信息库. 与单一时间尺度方法直接截取固定长度的轨迹片段不同，该方法根据测试轨迹长度选取多个时间尺度下的轨迹片段，与退化信息库中的参考退化轨迹进行相似性匹配，获得不同时间尺度下测试轨迹与每一参考轨迹间的最似位置与最似距离. 在一个时间尺度下，可以由相应的最似位置计算基于单一参考轨迹的RUL预测值；根据最似距离进行加权求和，得到该时间尺度下基于所有参考轨迹的RUL预测值. 取所有时间尺度下预测值的平均值为最终RUL预测值.

图 3

图 3 AE MTS-HI方法的流程图

Fig.3 Framework of AE MTS-HI

2. AE MTS-HI预测方法

2.1. 健康指标建立

构建健康指标需要将高维的状态监测数据压缩至一维. 采用具有较强非线性特征融合能力的自编码器代替传统线性降维方法，以减少非线性信息的损失，使得健康指标能够更好地表征涡扇发动机的退化情况. 为了加强自编码器的映射能力，设置3个全连接的隐含层. 隐含层2既作为编码器的输出层，又作为解码器的输入层，神经元数等于降维维度，自编码的具体结构如表1所示.

表 1 自编码器的参数设置

Tab.1 Parameters setting of autoencoder

层	神经元数	激活函数
输入层	$ {d}_{\mathrm{i}\mathrm{n}} $	—
隐含层1	$ {d}_{\mathrm{i}\mathrm{n}}/2 $	ReLU函数
隐含层2	$ {d}_{\mathrm{o}\mathrm{u}\mathrm{t}} $	线性激活函数
隐含层3	$ {d}_{\mathrm{i}\mathrm{n}}/2 $	ReLU函数
输出层	$ {d}_{\mathrm{i}\mathrm{n}} $	tanh函数

隐含层1和隐含层3使用ReLU函数作为激活函数，有利于实现网络的稀疏连接，且训练速度较快，如下所示：

(4) ${\rm{ReLU}}\left(x\right)={\max}\;\{0,x\}.$

输出层使用tanh函数，如下所示：

(5) $\begin{array}{*{20}{c}} {{\rm{tanh}}\left( x \right) = \dfrac{{{{\rm{e}}^x} - {{\rm{e}}^{ - x}}}}{{{{\rm{e}}^x} + {{\rm{e}}^{ - x}}}}.} \end{array}$

优化器选择适应性动量估计法（adaptive moment estimation，Adam），Adam在训练降维模型时收敛速度快且效果佳^[17].

为了降低信号振动对相似性匹配的干扰，对由健康指标组成的退化轨迹采用移动平均法进行平滑化处理. 假设对时间序列数据 ${\boldsymbol{Y}}=\{{Y}_{1},{Y}_{2}, \cdots , $ $ {Y}_{n}\}$进行处理，过程如下：

(6) $Y_j^{'} = \left\{ {\begin{array}{*{20}{c}} {{{N^{ - 1}}}\displaystyle\mathop \sum \nolimits_{i = {\rm{max}}\;\{1,j - \left( {N - 1} \right)/2\}}^{{\rm{min}}\;\left\{ {n,j + \left( {N - 1} \right)/2} \right\}} {Y_i},\;N为奇数;}\\ {{{N^{ - 1}}}\displaystyle\mathop \sum \nolimits_{i = {\rm{max}}\;\{ {1,j - N/2 + 1} \}}^{{\rm{min}}\; {\{n,j + N/2\}} } {Y_i},\;N为偶数.} \end{array}} \right.$

式中：n为时间序列长度， $ {Y}_{j}^{'} $为平滑后数据，N为平滑因子.

2.2. 相似性匹配

相似性匹配是依据健康指标衡量退化轨迹间的相似性，计算测试退化轨迹与参考退化轨迹间最似距离和最似位置的过程. 测试样本i的健康指标可以表示为 ${\boldsymbol{Z}}^{\boldsymbol{i}}=\left[{Z}_{1}^{i},{Z}_{2}^{i}, \cdots ,{Z}_{{t}_{i}}^{i}\right]$， $ \mathrm{其}\mathrm{中}{t}_{i} $为设备i的运行周期. 参考轨迹j的健康指标可以表示为 ${\boldsymbol{X}}^{{j}}=\left[{X}_{1}^{j},{X}_{2}^{j}, \cdots ,{X}_{{T}_{j}}^{j}\right]$， $ {\mathrm{其}\mathrm{中}T}_{j} $为设备j的寿命周期.

由于退化轨迹长度不同，需要截取相同时间尺度的片段进行比较，设时间尺度为L. 因为预测RUL所需考察的是设备当前退化情况，对于测试样本，选择最后一个片段 $ {\boldsymbol{Z}}_{{L}}^{{i}}=\left[{Z}_{{t}_{i}-L+1}^{i},{Z}_{{t}_{i}-L+2}^{i}, \cdots ,{Z}_{{t}_{i}}^{i}\right] $匹配相似性. 对于长度为 $ {T}_{j} $的参考轨迹，在时间尺度 $ L $下可以转换为 $ {T}_{j}-L+1 $个长度为 $ L $的轨迹片段，表示为 $ {\boldsymbol{X}}_{{L}\_{{k}}}^{{j}}=\left[{X}_{k}^{j},{X}_{k+1}^{j}, \cdots ,{X}_{k+L-1}^{j}\right]$，其中 $ k=1, $ $ 2, \cdots ,{T}_{j}-L+1 $. 采用欧几里得距离衡量轨迹间的相似性，测试轨迹片段 $ {\boldsymbol{Z}}_{{L}}^{{i}} $和参考轨迹片段 $ {\boldsymbol{X}}_{{L}\_{{k}}}^{{j}} $间的相似性，可以表示为

(7) ${D}_{L\_k}^{i,j}=\sqrt{\sum {\left({\boldsymbol{Z}}_{{L}}^{{i}}-{\boldsymbol{X}}_{{L}\_{{k}}}^{{j}}\right)}^{2}}.$

测试轨迹i和参考轨迹j间的最似距离和最似位置可以分别表示为

(8) ${D}_{L}^{i,j}=\underset{k=1,2, \cdots ,{T}_{j}-L+1}{\mathrm{min}}\left({D}_{L\_k}^{i,j}\right),$

(9) ${C}_{L}^{i,j}=\underset{k=1,2, \cdots ,{T}_{j}-L+1}{\mathrm{arg}\mathrm{min}}\left({D}_{L\_k}^{i,j}\right).$

通过相似性匹配可知，参考轨迹j的寿命周期内与测试轨迹i最相似的是第 $ {C}_{L}^{i,j} $个片段，这个片段将用于RUL的预测.

2.3. RUL预测

如图4所示，h为健康指标，t为设备运行时间，根据测试轨迹与每一参考轨迹间的最似位置，可以求得测试样本的RUL预测值. 由参考轨迹j计算得到的测试样本i的RUL为

(10) ${R}_{L}^{i,j}={T}_{j}-\left({C}_{L}^{i,j}+L-1\right).$

在集成不同参考轨迹的RUL预测值前，对参考轨迹依照最似距离进行排序，选取最似距离较小的m个参考轨迹用于预测，m称为最似参考轨迹数. 记m个轨迹的序号集合为 $ M，\left|M\right|=m $.

集成权重由最似距离决定：

(11) ${W}_{L}^{i,j}=\dfrac{\dfrac{1}{{D}_{L}^{i,j}}}{\displaystyle\sum _{s\in M}\dfrac{1}{{D}_{L}^{i,s}}}，j\in M.$

单时间尺度下的RUL预测值为

(12) ${\rm{RUL}}_L^i = \sum\limits_{j \in M} {\left( {W_L^{i,j} R_L^{i,j}} \right)} .$

图 4

图 4 相似性匹配与RUL预测的示意图

Fig.4 Schematic diagram of similarity matching and RUL prediction

2.4. 多时间尺度

针对传统单一时间尺度匹配导致的RUL预测精度限制，提出多时间尺度下的相似性匹配方法. 在单时间尺度方法中，时间尺度不得大于退化轨迹的最短长度. 由于测试轨迹长度等于测试设备运行周期，参考轨迹长度等于训练设备寿命周期，测试轨迹的长度一般较短. 受限于长度最短的测试轨迹，时间尺度通常偏小，导致退化信息利用不充分. 多时间尺度方法针对不同长度的测试退化轨迹，采用不同时间尺度的健康指标进行相似性匹配，综合多尺度下的RUL预测值为最终预测值. 建模时，确定备选时间尺度 $ \left\{{L}_{1},{L}_{2},\cdots {,L}_{n}\right\} $，其中n为时间尺度规模，时间尺度可在一定内范围内选择. 对于测试轨迹i，选择满足 $ L\leqslant {t}_{i} $的时间尺度子组 $ \left\{{L}_{1},{L}_{2},\cdots {,L}_{u}\right\} $进行预测， $ \left\{{L}_{1},{L}_{2},\cdots {,L}_{u}\right\}\subseteq $ $ \left\{{L}_{1},{L}_{2},\cdots {,L}_{n}\right\} $，其中u为测试轨迹选用的时间尺度数.

若测试轨迹选用时间尺度多于1个，则须分别在多个时间尺度下进行匹配与预测，再取预测平均值为最终RUL预测值.

(13) ${\mathrm{R}\mathrm{U}\mathrm{L}}^{i}=\frac{1}{u}{\sum }_{v=1}^{u}{\mathrm{R}\mathrm{U}\mathrm{L}}_{{L}_{v}}^{i}.$

多时间尺度方法主要有以下两方面的优势. 1）有效解决了时间尺度偏小的问题，对于较长的测试样本，能够更加充分地利用退化轨迹信息，不再受其他测试样本的限制. 2）避免了时间尺度选择的困难，仅需选定合理的尺度范围，无须寻找最优时间尺度. 通过综合多时间尺度下的预测结果进一步提升预测效果，能够适应不同退化阶段的RUL预测.

3. 案例研究

3.1. 数据集介绍

为了验证所提方法的性能，使用C-MAPSS仿真数据集^[22]的一号子集（FD001）进行案例分析. 训练集记录了发动机整个寿命周期的数据，测试集只包含从开始运行至失效前某个时刻的数据. 如表2所示，FD001训练集和测试集各有100个发动机，运行状态和故障模式都仅有一种.

表 2 FD001数据规模

Tab.2 Detailed descriptions of FD001

数据集	样本个数	数据总量	最小运行周期数	最大运行周期数
训练集	100	20631	128	362
测试集	100	13096	31	303

数据集的样本长度分布如图5所示. 可知，样本长度具有不一致性，测试集数据普遍短于训练集数据. 若在单时间尺度方法下时间尺度最大仅能设为31，则将导致大量的退化轨迹信息无法被利用.

图 5

图 5 FD001样本长度分布

Fig.5 Distributions of running cycles in FD001

3.2. 预处理

由于传感信号种类较多，在建立健康指标前须进行预处理. 归一化可以消除数据量纲带来的影响，本文所选用的归一化方法为最小-最大值标准化，如下所示：

(14) ${{X}}_i^{s,{\rm{N}}} = \frac{{{{X}}_i^s - \mathop {{\rm{min}}}\limits_{x \in {{\boldsymbol{X}}^s}} x}}{{\mathop {{\rm{max}}}\limits_{x \in {{\boldsymbol{X}}^s}} x - \mathop {{\rm{min}}}\limits_{x \in {{\boldsymbol{X}}^s}} x}}.$

式中：X^s为传感器s的数据集， ${{{X}}_i^s}$为传感器s的数据集i时刻的值， ${{X}}_{{i}}^{{s,{\rm{N}}}}$为归一化后的 ${{{X}}_i^s}$.

初步特征选择主要是为了剔除与设备退化无关的特征，以提升降维的效果. FD001仅包含一种运行状态，因此3个运行状态参数可不纳入考虑. 对21个实时状态信号进行归一化处理后可发现，信号的趋势可以分为3类，包括增长型、衰减型和固定型. 增长型与衰减型信号数值总体上随着设备的退化而增大和减小，如图6（a）、（b）所示. 固定型信号数值保持不变或仅在2个数值上波动，无法为建立健康指标提供有效信息. 仅选择增长型和衰减型信号进行降维，总计14个信号，如表3所示.

图 6

图 6 信号趋势分类

Fig.6 Classification based on tendency of signals

表 3 传感器信号趋势分类

Tab.3 Classification of sensor signals

分类	传感器编号
增长型	2，3，4，8，9，11，13，14，15，17
衰减型	7，12，20，21
固定型	1，5，6，10，16，18，19

涡扇发动机在运行初期的损耗可以忽略不计，因此可以认为发动机在开始退化前的RUL保持不变. 若直接使用总运行周期数减去当前运行周期数来设置训练集RUL标签，则会导致RUL的预测值偏大. 通过设置阈值，对训练集的RUL标签进行修正. 研究表明，在C-MAPSS数据集中，将RUL的阈值设置为130是较合理的^[23]，RUL的修正如图7所示.

图 7

图 7 RUL标签修正的示意图

Fig.7 Schematic diagram of RUL rectification

3.3. 参数设置

在该方法中，须设定的参数包括自编码器的训练批次尺寸b和训练周期数k、健康指标的平滑因子N、用于计算RUL的最似参考轨迹数m以及健康指标时间尺度. 其中，时间尺度的选择是该方法的关键，因此设定备选时间尺度后对其他参数进行调整.

测试样本的最小长度为31，由于最小时间尺度不得大于样本最小长度，设定最小时间尺度为30. 根据健康指标显著增长阶段的时间长度，设定最大时间尺度为70. 为了使多时间尺度的效果更显著，等距设置3个时间尺度. 综上所述，设定的时间尺度组为{30，50，70}，预测时选用其中不大于测试样本运行长度的时间尺度，如表4所示.

表 4 相似性匹配的时间尺度设定

Tab.4 Time scales for similarity matching

测试样本运行长度	测试样本数量	选用时间尺度
$30\leqslant {t}_{i} < 50$	7	30
$50\leqslant {t}_{i} < 70$	7	30,50
$70\leqslant {t}_{i}$	86	30,50,70

除时间尺度外的4个待设定参数间的相互作用对参数寻优结果的影响较小，因此通过逐一改变参数迭代寻找最优值，过程如图8所示. 根据实验结果，设定b为128，k为40，N为15，m为10.

图 8

图 8 自编码器参数迭代的实验结果

Fig.8 Experimental results of parameter tuning of autoencoder

3.4. 预测实现

在使用训练集对自编码器进行训练后，提取编码器作为降维模型并构建退化信息库. 如图9所示，平滑化处理后的健康指标较好地表征了发动机的退化规律. 对测试集进行相应处理后，在多时间尺度下将测试样本输入退化信息库进行相似性匹配. 如图10所示，RUL预测结果和实际值非常接近.

图 9

图 9 退化信息库

Fig.9 Degradation model reference library

图 10

图 10 RUL预测结果

Fig.10 RUL prediction results

4. 分析与讨论

4.1. 预测效果分析

若在失效前没有对涡扇发动机进行合理的维护，则将引发严重的安全事故和经济损失. 引入2个评价指标均方根误差（root mean square error，RMSE）和评分函数（scoring function）^[22]，以更加全面地定量评价RUL预测效果.

RMSE的计算如下所示：

(15) $\begin{split}\\ {\rm{RMSE}}\sqrt {{n^{ - 1}}\sum\limits_{i = 1}^n {{{\left( {{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i} \right)}^2}} } . \end{split}$

式中： $ {\mathrm{R}\mathrm{U}\mathrm{L}}^{i} $为测试样本i的RUL预测值， $ {\mathrm{R}\mathrm{U}\mathrm{L}}_{\mathrm{r}\mathrm{e}\mathrm{a}\mathrm{l}}^{i} $为测试样本i的实际RUL，共有 $ n $个测试样本.

Scoring Function考虑了高估RUL可能带来更大的损失，对于高估给予了一定的惩罚. 函数为

(16) $\begin{array}{*{20}{c}} {{\rm{Scor}}{{\rm{e}}_i} = \left\{ {\begin{array}{*{20}{c}} {\exp\;\left[{ - \left( {\dfrac{{{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i}}{{13}}} \right)}\right] - 1,\;{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i < 0};\\ {{\exp\;{\left( {\dfrac{{{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i}}{{10}}} \right)}} - 1,\;{\rm{RU}}{{\rm{L}}^i} - {\rm{RUL}}_{{\rm{real}}}^i \geqslant 0}. \end{array}} \right.} \end{array}$

Score越小，表示预测效果越好.

为了消除自编码器训练随机性的影响，将20次实验结果的平均值作为最终评价指标. 将实验结果与现有研究中的支持向量机（support vector machine，SVM）、神经网络方法及其他基于相似性的方法进行对比，结果如表5所示. 从RMSE和Score来衡量，AE MTS-HI方法在预测准确性上都优于上述方法，证明该方法具有较强的竞争力.

表 5 不同预测方法的结果对比

Tab.5 Comparison results with methods proposed by other researchers

方法	RMSE	Score
SVM^[24]	29.822	—
CNN^[9]	18.448	1 286.7
LSTM^[10]	16.14	338
Similarity-based^[16]	19.87	—
Similarity-based with SVR^[25]	—	388
Similarity-based with KTST^[15]	16.87	377.08
AE MTS-HI	14.07	291.67

4.2. 自编码器效应分析

选取多元线性回归、等距特征映射、主成分分析3种方式，与自编码器降维进行对比. 当进行多元线性回归时，以实时状态信号为自变量，归一化后的运行周期为标签. 等距特征映射是经典的非线性流形学习方法，降维时须定义空间内各点的近邻点数量，经参数寻优，将其设为10. 当采用主成分分析降维时，提取第一主成分作为健康指标. 除降维方法不同外，预测算法其他环节的设置均与所提的AE MTS-HI方法一致.

如表6所示，通过多元线性回归建立健康指标，预测误差较大. 采用等距特征映射和主成分分析方法进行降维，预测效果有所提升. 采用自编码器降维后，预测结果的RMSE和Score皆低于其他3种方法，说明自编码器的降维效果最佳. 利用非线性激活函数，自编码器实现了非线性关系的学习. 压缩后的数据可以通过解码器重构至原有维度，最大程度上减少了信息的损失，使得建立的健康指标能够更加准确地表征设备退化状态.

表 6 不同降维方法预测的结果对比

Tab.6 Comparison results with other dimensionality reduction methods

降维方法	RMSE	Score
多元线性回归	16.32	486.50
等距特征映射	14.50	339.95
主成分分析	14.29	302.95
自编码器	14.07	291.67

为了分析自编码器结构设计对算法精度的影响，在算法其他环节不变的条件下，调整隐含层个数及神经元数，开展自编码器训练参数寻优. 如表7所示，当自编码器隐含层个数为3或5时，RUL预测的准确性较高，隐含层神经元数对预测效果的影响相对较小.

表 7 不同自编码器结构与参数预测结果的对比

Tab.7 Comparison results with other autoencoder structures and parameters

隐含层个数	隐含层神经元数	RMSE
1	1	14.31
3	4，1，4	14.17
3	7，1，7	14.07
3	10，1，10	14.12
5	10，6，1，6，10	14.13
5	7，7，1，7，7	14.09

4.3. 多尺度健康指标效应分析

多时间尺度方法突破了单一时间尺度偏小且无法适应不同信息捕捉要求的限制. 在算法其他环节设置一致的条件下，比较单一时间尺度方法与多时间尺度方法的预测结果，如表8所示. 对于不同长度区间的测试样本，多时间尺度下的预测Score值都低于单一时间尺度下的预测Score值. 从整个测试集来看，多时间尺度方法的Score较单一时间尺度方法降低了22%，预测准确性提升显著.

表 8 多时间尺度对预测结果的影响

Tab.8 Effects of multiple time scales on predicting results

样本长度	样本数量	Score
样本长度	样本数量	L=30	L=50	L=70	多时间尺度
$30\leqslant {t}_{i} < 50$	7	26.30	—	—	26.30
$50\leqslant {t}_{i} < 70$	7	8.41	8.86	—	6.56
$70\leqslant {t}_{i}$	86	337.70	276.23	284.35	258.81
所有样本	100	372.41	—	—	291.67

为了探究时间尺度对预测效果的影响，将测试集依照样本长度分为6个子集，样本长度范围分别为[30，60）、[60，90）、[90，120）、[120，150）、[150，180）、[180、303]. 如图11所示为6个子集在不同单一时间尺度下预测的RMSE，选用的时间尺度不大于该子集样本的最短长度. RMSE最小的时间尺度为对应子集的最优时间尺度，总体趋势上最优时间尺度随着样本长度先增大后减小. 最优时间尺度随样本长度增大是因为更长的退化轨迹为预测提供了更丰富的信息. 当样本长度增大到一定范围时，最优时间尺度减小，是因为发动机进入了加速退化阶段，如图9所示，发动机寿命末期健康指标显著增大. 此时，只需通过较短轨迹，可以准确预测发动机的RUL. 若选用较大的时间尺度，则会引入干扰信息，不利于预测. 难以通过样本长度直接选择最优时间尺度用以预测，因为最优时间尺度减小本质上是由RUL减小到一定程度引起的，由样本长度无法推知RUL.

图 11

图 11 单一时间尺度对预测效果的影响

Fig.11 Effects of single time scale size on predicting results

为了更加直观地分析多时间尺度的优势，选取测试集中编号为23、49、60、61、76的发动机为例，不同时间尺度下RUL预测值与真实值的差值e如表9所示.

表 9 典例概况及预测误差

Tab.9 Description and prediction error of typical instances

样本编号	样本长度	RUL	e
样本编号	样本长度	RUL	L=30	L=50	L=70	多时间尺度
23	130	113	4.40	4.99	−2.77	2.21
60	147	100	4.81	1.61	−7.17	−0.25
61	159	21	2.32	5.88	4.69	4.30
76	205	10	0.12	−1.80	−1.83	−1.17
49	303	21	−2.36	−3.82	−4.08	−3.42

比较编号为23、60、61的发动机可知，3个样本都属于中等数据长度，但最优时间尺度不同. 如图12所示，61号发动机已处于加速退化阶段，实际RUL为21，最优时间尺度为30. 23和60号发动机的实际RUL较大，需要较长的退化轨迹捕捉更多信息，最优时间尺度分别为70和50. 在多时间尺度方法下，61号发动机的RUL预测误差小于2个固定时间尺度，23和60号发动机的RUL预测误差小于3个固定时间尺度. 综合多个时间尺度的预测结果可知，多时间尺度方法化解了仅依靠样本长度无法确定最优时间尺度的难题.

图 12

图 12 中等长度样本的健康指标

Fig.12 Health indexes of medium-length instances

比较编号为49、61、76的发动机可知，3个样本数据的长度差异较大，但是实际RUL较小. 如图13所示，发动机的健康指标变化十分显著，仅需较短片段便可判断当前状态. 由实验结果可知，3个样本的最优时间尺度都为30，通过综合多时间尺度健康指标可以削弱较长退化轨迹引入的干扰因素的影响.

图 13

DOI:10.1016/j.apenergy.2017.04.048 [本文引用: 1]

图 13 寿命末期样本的健康指标

Fig.13 Health indexes of end-of-life instances

综上所述，采用自编码器提取健康指标减少了信息损失，多时间尺度下的相似性匹配加强了对退化信息的综合利用，因此利用AE MTS-HI方法提高了RUL预测的准确性.

5. 结　语

本文针对涡扇发动机状态监测数据维度高、非线性的特点以及单一时间尺度方法对退化信息利用不足的问题，提出结合自编码器的基于多时间尺度健康指标相似性的剩余使用寿命预测方法. 该方法采用编码器构建健康指标，减少了非线性信息的损失. 考虑到样本长度的不一致性，运用多时间尺度健康指标进行相似性匹配，更加充分地利用退化信息，解决了最优时间尺度选择的难题. 在公开数据集上开展实验，与其他研究的预测效果进行对比. 结果表明，利用该方法能够显著地提高涡扇发动机剩余使用寿命的预测精度，可以为维护策略的制定提供有力支撑，降低发动机的维护成本. 此外，该方法具有改进的空间，未来将对不同时间尺度下预测结果的综合方式进行优化，以进一步提升RUL预测精度；探索多工况、多故障模式下的RUL预测，以概率形式表达RUL预测结果，从而提升算法的工程使用价值.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

TAHAN M, TSOUTSANIS E, MUHAMMAD M, et al

Performance-based health monitoring, diagnostics and prognostics for condition-based maintenance of gas turbines: a review

[J]. Applied Energy, 2017, 198: 122- 144

[2]

XIA T, DONG Y, XIAO L, et al

Recent advances in prognostics and health management for advanced manufacturing paradigms

[J]. Reliability Engineering and System Safety, 2018, 178: 255- 268

DOI:10.1016/j.ress.2018.06.021 [本文引用: 1]

[3]

LIU Y, HU X, ZHANG W

Remaining useful life prediction based on health index similarity

[J]. Reliability Engineering and System Safety, 2019, 185: 502- 510

DOI:10.1016/j.ress.2019.02.002 [本文引用: 2]

[4]

JAVED K, GOURIVEAU R, ZERHOUNI N

State of the art and taxonomy of prognostics approaches, trends of prognostics applications and open issues towards maturity at different technology readiness levels

[J]. Mechanical Systems and Signal Processing, 2016, 94: 214- 236

DOI:10.1016/j.microrel.2017.12.036 [本文引用: 1]

[5]

WANG H, MA X, ZHAO Y

An improved Wiener process model with adaptive drift and diffusion for online remaining useful life prediction

[J]. Mechanical Systems and Signal Processing, 2019, 127: 370- 387

DOI:10.1016/j.ymssp.2019.03.019 [本文引用: 1]

[6]

王浩伟, 徐廷学, 刘勇

基于随机参数Gamma过程的剩余寿命预测方法

[J]. 浙江大学学报:工学版, 2015, 49 (4): 699- 704

URL [本文引用: 1]

WANG Hao-wei, XU Ting-xue, LIU Yong

Remaining useful life prediction method based on Gamma processes with random parameters

[J]. Journal of Zhejiang University: Engineering Science, 2015, 49 (4): 699- 704

URL [本文引用: 1]

[7]

ZHANG H, MIAO Q, ZHANG X, et al

An improved unscented particle filter approach for lithium-ion battery remaining useful life prediction

[J]. Microelectronics Reliability, 2018, 81: 288- 298

[8]

CHEN Z, LI Y, XIA T, et al

Hidden Markov model with auto-correlated observations for remaining useful life prediction and optimal maintenance policy

[J]. Reliability Engineering and System Safety, 2019, 184: 123- 136

DOI:10.1016/j.ress.2017.09.002 [本文引用: 1]

[9]

BABU G S, ZHAO P, LI X. Deep convolutional neural network based regression approach for estimation of remaining useful life [C]// Proceedings of the International Conference on Database Systems for Advanced Applications. Berlin: Springer, 2016: 214-228.

[10]

ZHENG S, RISTOVSKI K, FARAHAT A, et al. Long short-term memory network for remaining useful life estimation [C]// Proceedings of the International Conference on Prognostics and Health Management. Washington, D. C.: IEEE, 2017: 88-95.

[11]

WANG T, YU J, SIEGEL D, et al. A similarity-based prognostics approach for remaining useful life estimation of engineered systems [C]// International Conference on Prognostics and Health Management. Washington, D. C.: IEEE, 2008: 1-6.

DOI:10.1016/j.isatra.2020.03.007 [本文引用: 2]

[12]

ZIO E, DI MAIO F

A data-driven fuzzy approach for predicting the remaining useful life in dynamic failure scenarios of a nuclear system

[J]. Reliability Engineering and System Safety, 2010, 95 (1): 49- 57

DOI:10.1016/j.ress.2009.08.001 [本文引用: 1]

[13]

YOU M Y, MENG G

A generalized similarity measure for similarity-based residual life prediction

[J]. Proceedings of the Institution of Mechanical Engineers, Part E:Journal of Process Mechanical Engineering, 2011, 225 (3): 151- 160

DOI:10.1177/0954408911399832 [本文引用: 1]

[14]

谷梦瑶, 陈友玲, 王新龙

多退化变量下基于实时健康度的相似性寿命预测方法

[J]. 计算机集成制造系统, 2017, 23 (2): 362- 372

URL [本文引用: 2]

GU Meng-yao, CHEN You-ling, WANG Xin-long

Multi-index modeling for similarity-based residual life estimation based on real-time health degree

[J]. Computer Integrated Manufacturing Systems, 2017, 23 (2): 362- 372

URL [本文引用: 2]

[15]

CAI H, JIA X, FENG J, et al

A similarity based methodology for machine prognostics by using kernel two sample test

[J]. ISA Transactions, 2020, 103: 112- 121

[16]

AZEVEDO D, RIBEIRO B, CARDOSO A. Online simulation of methods to predict the remaining useful lifetime of aircraft components [C]// Proceedings of Experiment International Conference. Washington, D. C.: IEEE, 2019: 199-203.

DOI:10.1016/j.inffus.2017.12.007 [本文引用: 2]

[17]

CHARTE D, CHARTE F, GARCÍA S, et al

A practical tutorial on autoencoders for nonlinear feature fusion: taxonomy, models, software and guidelines

[J]. Information Fusion, 2018, 44: 78- 96

[18]

REN L, SUN Y, CUI J, et al

Bearing remaining useful life prediction based on deep autoencoder and deep neural networks

[J]. Journal of Manufacturing Systems, 2018, 48 (Part C): 71- 77

URL

[19]

MA J, SU H, ZHAO W, et al

Predicting the remaining useful life of an aircraft engine using a stacked sparse autoencoder with multilayer self-learning

[J]. Complexity, 2018, 2018: 1- 13

URL [本文引用: 1]

[20]

CHEN C, LEU J, PRAKOSA S W. Using autoencoder to facilitate information retention for data dimension reduction [C]// 3rd International Conference on Intelligent Green Building and Smart Grid. Washington, D. C.: IEEE, 2018: 1-5.

DOI:10.1016/j.compind.2019.103182 [本文引用: 1]

[21]

XIA T, SONG Y, ZHENG Y, et al

An ensemble framework based on convolutional bi-directional LSTM with multiple time windows for remaining useful life estimation

[J]. Computers in Industry, 2020, 115: 103182

[22]

SAXENA A, GOEBEL K, SIMON D, et al. Damage propagation modeling for aircraft engine run-to-failure simulation [C]// International Conference on Prognostics and Health Management. Washington, D. C.: IEEE, 2008: 1-9.

[本文引用: 3]

[23]

HEIMES F O. Recurrent neural networks for remaining useful life estimation [C]// International Conference on Prognostics and Health Management. Washington, D. C.: IEEE, 2008: 1-6.

[24]

LOUEN C, DING S X, KANDLER C. A new framework for remaining useful life estimation using support vector machine classifier [C]// Proceedings of Conference on Control and Fault-Tolerant Systems. Washington, D. C.: IEEE, 2013: 228-233.