基于多时间尺度相似性的涡扇发动机寿命预测
Remaining useful life prediction of turbofan engine based on similarity in multiple time scales
通讯作者:
收稿日期: 2020-11-3
基金资助: |
|
Received: 2020-11-3
Fund supported: | 国家自然科学基金资助项目(51875359);上海市自然科学基金资助项目(20ZR1428600);上海商用飞机系统工程科创中心联合研究基金资助项目(FASE-2021-M7);教育部-中国移动联合基金建设项目(MCM20180703) |
作者简介 About authors
许昱晖(1999—),男,硕士生,从事机器学习和装备健康预测的研究.orcid.org/0000-0001-5035-9466.E-mail:
针对传统相似性方法在提取健康指标和相似性匹配上存在的不足,提出结合自编码器神经网络的基于多时间尺度健康指标相似性的预测方法(AE MTS-HI). 采用自编码器从状态监测数据中提取表征发动机退化状态的健康指标,降低提取过程非线性信息的损失. 将测试退化轨迹长度的波动纳入考量,针对性地设计多时间尺度的健康指标进行相似性匹配. 这不仅可以克服单一时间尺度匹配导致的精度限制,而且可以提高预测的鲁棒性. 在涡扇发动机的公开数据集上验证所提方法的性能. 结果表明,利用该方法能够显著提升剩余使用寿命(RUL)的预测精度,为预知维护提供有力支撑.
关键词:
A novel method based on health index similarity in multiple time scales with autoencoder (AE MTS-HI) was proposed aiming at the shortage of the traditional similarity-based method in extracting health index and similarity matching. Autoencoder was applied to construct the health index based on monitoring data, which can minimize the loss of nonlinear information. The health index in multiple time scales was developed for similarity matching by considering the fluctuation of the length of test degradation trajectories. The method can remove the accuracy limitation caused by fixed time scales and enhance the prediction robustness. Performance of the proposed method was evaluated on public turbofan engines datasets. Results demonstrate that the method can improve the remaining useful life (RUL) prediction accuracy and provide stable support for predictive maintenance.
Keywords:
本文引用格式
许昱晖, 舒俊清, 宋亚, 郑宇, 夏唐斌.
XU Yu-hui, SHU Jun-qing, SONG Ya, ZHENG Yu, XIA Tang-bin.
涡扇发动机是飞行器的核心动力来源,可靠性要求极高. 传统的涡扇发动机维护模式以高频率、全方位的检修来保障发动机的可靠性,维护成本高昂. 提升涡扇发动机剩余使用寿命(remaining useful life, RUL)预测的准确性以优化维护策略,不仅可以避免因发动机故障引发的经济损失和安全风险,而且可以减少不必要的维护,降低维护成本[1].
基于相似性的RUL预测的准确性受到两方面的限制. 1)学者多采用多元线性回归[11, 16]或主成分分析[3, 14]从状态监测数据中提取健康指标,但二者皆为线性方法,在降维过程中会造成非线性信息的损失. 自编码器(autoencoder)是非监督式神经网络,被广泛运用于高维数据的降维操作[17-19]. Chen等[20]证明了当降维前、后维度差异较大时,运用自编码器降维能够减少信息损失. 本文采用自编码器代替传统线性降维方法,以降低数据压缩过程中非线性信息的损失. 2)学者通常采用单一时间尺度的健康指标进行相似性匹配,这种设置忽视了退化轨迹长度的不一致性. 选用的时间尺度不得大于最短退化轨迹的长度,导致用以匹配的健康指标较短,对退化信息的利用不足[21]. 本文设计多时间尺度的健康指标,在多个时间尺度下进行相似性匹配.
综上所述,针对传统相似性方法在降维和时间尺度方面存在的不足,本文提出结合自编码器神的基于多时间尺度健康指标相似性的预测方法(health index similarity in multiple time scales with autoencoder,AE MTS-HI),利用自编码器降维和多时间尺度下的相似性匹配,提升RUL预测的准确性.
1. 预测方法建模
1.1. 问题描述
图 1
由于传感器数量众多,同时发动机退化过程中存在诸多的非线性因素与模式,状态监测数据具有维度高、非线性的特点. 构建健康指标时,需要将数据从高维压缩至一维,因此要求降维方法有较强的非线性特征融合能力. 退化轨迹的长度具有不一致性,如果采用单一时间尺度进行相似性匹配,那么进行匹配的这段轨迹不得大于最短的退化轨迹,这将导致匹配的退化轨迹长度受限. 考虑到涡扇发动机运行周期较长,各阶段的退化规律不同,在寿命末期存在显著的加速退化,预测方法需要有良好的鲁棒性,能够适应不同寿命阶段的退化特点.
1.2. 自编码器
自编码器具有对称结构,由编码器和解码器组成,输入层和输出层神经元数相同. 训练时以输入数据作为输出目标,训练后编码器可以输出原始信号的压缩表示.
如图2所示为仅含一个隐含层的自编码器,输入数据的维度为
式中:
式中:
通过隐含层的非线性激活函数(如ReLu、tanh等),自编码器神经网络可以学习到非线性变换;主成分分析仅可作线性变换,特征提取能力受限.
图 2
1.3. AE MTS-HI方法的技术路线
AE MTS-HI方法可以分为3大模块:健康指标建立、相似性匹配和RUL预测,流程如图3所示. 采用自编码器代替传统降维方法,建立一维健康指标,构建参考退化轨迹信息库. 与单一时间尺度方法直接截取固定长度的轨迹片段不同,该方法根据测试轨迹长度选取多个时间尺度下的轨迹片段,与退化信息库中的参考退化轨迹进行相似性匹配,获得不同时间尺度下测试轨迹与每一参考轨迹间的最似位置与最似距离. 在一个时间尺度下,可以由相应的最似位置计算基于单一参考轨迹的RUL预测值;根据最似距离进行加权求和,得到该时间尺度下基于所有参考轨迹的RUL预测值. 取所有时间尺度下预测值的平均值为最终RUL预测值.
图 3
2. AE MTS-HI预测方法
2.1. 健康指标建立
构建健康指标需要将高维的状态监测数据压缩至一维. 采用具有较强非线性特征融合能力的自编码器代替传统线性降维方法,以减少非线性信息的损失,使得健康指标能够更好地表征涡扇发动机的退化情况. 为了加强自编码器的映射能力,设置3个全连接的隐含层. 隐含层2既作为编码器的输出层,又作为解码器的输入层,神经元数等于降维维度,自编码的具体结构如表1所示.
表 1 自编码器的参数设置
Tab.1
层 | 神经元数 | 激活函数 |
输入层 | | — |
隐含层1 | | ReLU函数 |
隐含层2 | | 线性激活函数 |
隐含层3 | | ReLU函数 |
输出层 | | tanh函数 |
隐含层1和隐含层3使用ReLU函数作为激活函数,有利于实现网络的稀疏连接,且训练速度较快,如下所示:
输出层使用tanh函数,如下所示:
优化器选择适应性动量估计法(adaptive moment estimation,Adam),Adam在训练降维模型时收敛速度快且效果佳[17].
为了降低信号振动对相似性匹配的干扰,对由健康指标组成的退化轨迹采用移动平均法进行平滑化处理. 假设对时间序列数据
式中:n为时间序列长度,
2.2. 相似性匹配
相似性匹配是依据健康指标衡量退化轨迹间的相似性,计算测试退化轨迹与参考退化轨迹间最似距离和最似位置的过程. 测试样本i的健康指标可以表示为
由于退化轨迹长度不同,需要截取相同时间尺度的片段进行比较,设时间尺度为L. 因为预测RUL所需考察的是设备当前退化情况,对于测试样本,选择最后一个片段
测试轨迹i和参考轨迹j间的最似距离和最似位置可以分别表示为
通过相似性匹配可知,参考轨迹j的寿命周期内与测试轨迹i最相似的是第
2.3. RUL预测
如图4所示,h为健康指标,t为设备运行时间,根据测试轨迹与每一参考轨迹间的最似位置,可以求得测试样本的RUL预测值. 由参考轨迹j计算得到的测试样本i的RUL为
在集成不同参考轨迹的RUL预测值前,对参考轨迹依照最似距离进行排序,选取最似距离较小的m个参考轨迹用于预测,m称为最似参考轨迹数. 记m个轨迹的序号集合为
集成权重由最似距离决定:
单时间尺度下的RUL预测值为
图 4
图 4 相似性匹配与RUL预测的示意图
Fig.4 Schematic diagram of similarity matching and RUL prediction
2.4. 多时间尺度
针对传统单一时间尺度匹配导致的RUL预测精度限制,提出多时间尺度下的相似性匹配方法. 在单时间尺度方法中,时间尺度不得大于退化轨迹的最短长度. 由于测试轨迹长度等于测试设备运行周期,参考轨迹长度等于训练设备寿命周期,测试轨迹的长度一般较短. 受限于长度最短的测试轨迹,时间尺度通常偏小,导致退化信息利用不充分. 多时间尺度方法针对不同长度的测试退化轨迹,采用不同时间尺度的健康指标进行相似性匹配,综合多尺度下的RUL预测值为最终预测值. 建模时,确定备选时间尺度
若测试轨迹选用时间尺度多于1个,则须分别在多个时间尺度下进行匹配与预测,再取预测平均值为最终RUL预测值.
多时间尺度方法主要有以下两方面的优势. 1)有效解决了时间尺度偏小的问题,对于较长的测试样本,能够更加充分地利用退化轨迹信息,不再受其他测试样本的限制. 2)避免了时间尺度选择的困难,仅需选定合理的尺度范围,无须寻找最优时间尺度. 通过综合多时间尺度下的预测结果进一步提升预测效果,能够适应不同退化阶段的RUL预测.
3. 案例研究
3.1. 数据集介绍
表 2 FD001数据规模
Tab.2
数据集 | 样本个数 | 数据总量 | 最小运行周期数 | 最大运行周期数 |
训练集 | 100 | 20631 | 128 | 362 |
测试集 | 100 | 13096 | 31 | 303 |
数据集的样本长度分布如图5所示. 可知,样本长度具有不一致性,测试集数据普遍短于训练集数据. 若在单时间尺度方法下时间尺度最大仅能设为31,则将导致大量的退化轨迹信息无法被利用.
图 5
3.2. 预处理
由于传感信号种类较多,在建立健康指标前须进行预处理. 归一化可以消除数据量纲带来的影响,本文所选用的归一化方法为最小-最大值标准化,如下所示:
式中:Xs为传感器s的数据集,
图 6
表 3 传感器信号趋势分类
Tab.3
分类 | 传感器编号 |
增长型 | 2,3,4,8,9,11,13,14,15,17 |
衰减型 | 7,12,20,21 |
固定型 | 1,5,6,10,16,18,19 |
图 7
3.3. 参数设置
在该方法中,须设定的参数包括自编码器的训练批次尺寸b和训练周期数k、健康指标的平滑因子N、用于计算RUL的最似参考轨迹数m以及健康指标时间尺度. 其中,时间尺度的选择是该方法的关键,因此设定备选时间尺度后对其他参数进行调整.
测试样本的最小长度为31,由于最小时间尺度不得大于样本最小长度,设定最小时间尺度为30. 根据健康指标显著增长阶段的时间长度,设定最大时间尺度为70. 为了使多时间尺度的效果更显著,等距设置3个时间尺度. 综上所述,设定的时间尺度组为{30,50,70},预测时选用其中不大于测试样本运行长度的时间尺度,如表4所示.
表 4 相似性匹配的时间尺度设定
Tab.4
测试样本运行长度 | 测试样本数量 | 选用时间尺度 |
| 7 | 30 |
| 7 | 30,50 |
| 86 | 30,50,70 |
除时间尺度外的4个待设定参数间的相互作用对参数寻优结果的影响较小,因此通过逐一改变参数迭代寻找最优值,过程如图8所示. 根据实验结果,设定b为128,k为40,N为15,m为10.
图 8
图 8 自编码器参数迭代的实验结果
Fig.8 Experimental results of parameter tuning of autoencoder
3.4. 预测实现
图 9
图 10
4. 分析与讨论
4.1. 预测效果分析
若在失效前没有对涡扇发动机进行合理的维护,则将引发严重的安全事故和经济损失. 引入2个评价指标均方根误差(root mean square error,RMSE)和评分函数(scoring function)[22],以更加全面地定量评价RUL预测效果.
RMSE的计算如下所示:
式中:
Scoring Function考虑了高估RUL可能带来更大的损失,对于高估给予了一定的惩罚. 函数为
Score越小,表示预测效果越好.
为了消除自编码器训练随机性的影响,将20次实验结果的平均值作为最终评价指标. 将实验结果与现有研究中的支持向量机(support vector machine,SVM)、神经网络方法及其他基于相似性的方法进行对比,结果如表5所示. 从RMSE和Score来衡量,AE MTS-HI方法在预测准确性上都优于上述方法,证明该方法具有较强的竞争力.
表 5 不同预测方法的结果对比
Tab.5
4.2. 自编码器效应分析
选取多元线性回归、等距特征映射、主成分分析3种方式,与自编码器降维进行对比. 当进行多元线性回归时,以实时状态信号为自变量,归一化后的运行周期为标签. 等距特征映射是经典的非线性流形学习方法,降维时须定义空间内各点的近邻点数量,经参数寻优,将其设为10. 当采用主成分分析降维时,提取第一主成分作为健康指标. 除降维方法不同外,预测算法其他环节的设置均与所提的AE MTS-HI方法一致.
如表6所示,通过多元线性回归建立健康指标,预测误差较大. 采用等距特征映射和主成分分析方法进行降维,预测效果有所提升. 采用自编码器降维后,预测结果的RMSE和Score皆低于其他3种方法,说明自编码器的降维效果最佳. 利用非线性激活函数,自编码器实现了非线性关系的学习. 压缩后的数据可以通过解码器重构至原有维度,最大程度上减少了信息的损失,使得建立的健康指标能够更加准确地表征设备退化状态.
表 6 不同降维方法预测的结果对比
Tab.6
降维方法 | RMSE | Score |
多元线性回归 | 16.32 | 486.50 |
等距特征映射 | 14.50 | 339.95 |
主成分分析 | 14.29 | 302.95 |
自编码器 | 14.07 | 291.67 |
为了分析自编码器结构设计对算法精度的影响,在算法其他环节不变的条件下,调整隐含层个数及神经元数,开展自编码器训练参数寻优. 如表7所示,当自编码器隐含层个数为3或5时,RUL预测的准确性较高,隐含层神经元数对预测效果的影响相对较小.
表 7 不同自编码器结构与参数预测结果的对比
Tab.7
隐含层个数 | 隐含层神经元数 | RMSE |
1 | 1 | 14.31 |
3 | 4,1,4 | 14.17 |
3 | 7,1,7 | 14.07 |
3 | 10,1,10 | 14.12 |
5 | 10,6,1,6,10 | 14.13 |
5 | 7,7,1,7,7 | 14.09 |
4.3. 多尺度健康指标效应分析
多时间尺度方法突破了单一时间尺度偏小且无法适应不同信息捕捉要求的限制. 在算法其他环节设置一致的条件下,比较单一时间尺度方法与多时间尺度方法的预测结果,如表8所示. 对于不同长度区间的测试样本,多时间尺度下的预测Score值都低于单一时间尺度下的预测Score值. 从整个测试集来看,多时间尺度方法的Score较单一时间尺度方法降低了22%,预测准确性提升显著.
表 8 多时间尺度对预测结果的影响
Tab.8
样本长度 | 样本数量 | Score | |||
L=30 | L=50 | L=70 | 多时间尺度 | ||
| 7 | 26.30 | — | — | 26.30 |
| 7 | 8.41 | 8.86 | — | 6.56 |
| 86 | 337.70 | 276.23 | 284.35 | 258.81 |
所有样本 | 100 | 372.41 | — | — | 291.67 |
为了探究时间尺度对预测效果的影响,将测试集依照样本长度分为6个子集,样本长度范围分别为[30,60)、[60,90)、[90,120)、[120,150)、[150,180)、[180、303]. 如图11所示为6个子集在不同单一时间尺度下预测的RMSE,选用的时间尺度不大于该子集样本的最短长度. RMSE最小的时间尺度为对应子集的最优时间尺度,总体趋势上最优时间尺度随着样本长度先增大后减小. 最优时间尺度随样本长度增大是因为更长的退化轨迹为预测提供了更丰富的信息. 当样本长度增大到一定范围时,最优时间尺度减小,是因为发动机进入了加速退化阶段,如图9所示,发动机寿命末期健康指标显著增大. 此时,只需通过较短轨迹,可以准确预测发动机的RUL. 若选用较大的时间尺度,则会引入干扰信息,不利于预测. 难以通过样本长度直接选择最优时间尺度用以预测,因为最优时间尺度减小本质上是由RUL减小到一定程度引起的,由样本长度无法推知RUL.
图 11
图 11 单一时间尺度对预测效果的影响
Fig.11 Effects of single time scale size on predicting results
为了更加直观地分析多时间尺度的优势,选取测试集中编号为23、49、60、61、76的发动机为例,不同时间尺度下RUL预测值与真实值的差值e如表9所示.
表 9 典例概况及预测误差
Tab.9
样本编号 | 样本长度 | RUL | e | |||
L=30 | L=50 | L=70 | 多时间尺度 | |||
23 | 130 | 113 | 4.40 | 4.99 | −2.77 | 2.21 |
60 | 147 | 100 | 4.81 | 1.61 | −7.17 | −0.25 |
61 | 159 | 21 | 2.32 | 5.88 | 4.69 | 4.30 |
76 | 205 | 10 | 0.12 | −1.80 | −1.83 | −1.17 |
49 | 303 | 21 | −2.36 | −3.82 | −4.08 | −3.42 |
比较编号为23、60、61的发动机可知,3个样本都属于中等数据长度,但最优时间尺度不同. 如图12所示,61号发动机已处于加速退化阶段,实际RUL为21,最优时间尺度为30. 23和60号发动机的实际RUL较大,需要较长的退化轨迹捕捉更多信息,最优时间尺度分别为70和50. 在多时间尺度方法下,61号发动机的RUL预测误差小于2个固定时间尺度,23和60号发动机的RUL预测误差小于3个固定时间尺度. 综合多个时间尺度的预测结果可知,多时间尺度方法化解了仅依靠样本长度无法确定最优时间尺度的难题.
图 12
比较编号为49、61、76的发动机可知,3个样本数据的长度差异较大,但是实际RUL较小. 如图13所示,发动机的健康指标变化十分显著,仅需较短片段便可判断当前状态. 由实验结果可知,3个样本的最优时间尺度都为30,通过综合多时间尺度健康指标可以削弱较长退化轨迹引入的干扰因素的影响.
图 13
综上所述,采用自编码器提取健康指标减少了信息损失,多时间尺度下的相似性匹配加强了对退化信息的综合利用,因此利用AE MTS-HI方法提高了RUL预测的准确性.
5. 结 语
本文针对涡扇发动机状态监测数据维度高、非线性的特点以及单一时间尺度方法对退化信息利用不足的问题,提出结合自编码器的基于多时间尺度健康指标相似性的剩余使用寿命预测方法. 该方法采用编码器构建健康指标,减少了非线性信息的损失. 考虑到样本长度的不一致性,运用多时间尺度健康指标进行相似性匹配,更加充分地利用退化信息,解决了最优时间尺度选择的难题. 在公开数据集上开展实验,与其他研究的预测效果进行对比. 结果表明,利用该方法能够显著地提高涡扇发动机剩余使用寿命的预测精度,可以为维护策略的制定提供有力支撑,降低发动机的维护成本. 此外,该方法具有改进的空间,未来将对不同时间尺度下预测结果的综合方式进行优化,以进一步提升RUL预测精度;探索多工况、多故障模式下的RUL预测,以概率形式表达RUL预测结果,从而提升算法的工程使用价值.
参考文献
Performance-based health monitoring, diagnostics and prognostics for condition-based maintenance of gas turbines: a review
[J].DOI:10.1016/j.apenergy.2017.04.048 [本文引用: 1]
Recent advances in prognostics and health management for advanced manufacturing paradigms
[J].DOI:10.1016/j.ress.2018.06.021 [本文引用: 1]
Remaining useful life prediction based on health index similarity
[J].DOI:10.1016/j.ress.2019.02.002 [本文引用: 2]
State of the art and taxonomy of prognostics approaches, trends of prognostics applications and open issues towards maturity at different technology readiness levels
[J].
An improved Wiener process model with adaptive drift and diffusion for online remaining useful life prediction
[J].DOI:10.1016/j.ymssp.2019.03.019 [本文引用: 1]
基于随机参数Gamma过程的剩余寿命预测方法
[J].
Remaining useful life prediction method based on Gamma processes with random parameters
[J].
An improved unscented particle filter approach for lithium-ion battery remaining useful life prediction
[J].DOI:10.1016/j.microrel.2017.12.036 [本文引用: 1]
Hidden Markov model with auto-correlated observations for remaining useful life prediction and optimal maintenance policy
[J].DOI:10.1016/j.ress.2017.09.002 [本文引用: 1]
A data-driven fuzzy approach for predicting the remaining useful life in dynamic failure scenarios of a nuclear system
[J].DOI:10.1016/j.ress.2009.08.001 [本文引用: 1]
A generalized similarity measure for similarity-based residual life prediction
[J].DOI:10.1177/0954408911399832 [本文引用: 1]
多退化变量下基于实时健康度的相似性寿命预测方法
[J].
Multi-index modeling for similarity-based residual life estimation based on real-time health degree
[J].
A similarity based methodology for machine prognostics by using kernel two sample test
[J].DOI:10.1016/j.isatra.2020.03.007 [本文引用: 2]
A practical tutorial on autoencoders for nonlinear feature fusion: taxonomy, models, software and guidelines
[J].DOI:10.1016/j.inffus.2017.12.007 [本文引用: 2]
Bearing remaining useful life prediction based on deep autoencoder and deep neural networks
[J].
Predicting the remaining useful life of an aircraft engine using a stacked sparse autoencoder with multilayer self-learning
[J].
An ensemble framework based on convolutional bi-directional LSTM with multiple time windows for remaining useful life estimation
[J].DOI:10.1016/j.compind.2019.103182 [本文引用: 1]
Direct remaining useful life estimation based on support vector regression
[J].DOI:10.1109/TIE.2016.2623260 [本文引用: 1]
/
〈 |
|
〉 |
