浙江大学学报(工学版), 2026, 60(1): 127-137 doi: 10.3785/j.issn.1008-973X.2026.01.012

机械工程

联邦协作框架下的跨工况半监督剩余使用寿命预测

李琦媛,, 程鑫, 马文清, 张开淦, 夏唐斌,, 奚立峰

1. 上海交通大学 机械与动力工程学院 工业工程与管理系,上海 200240

2. 特殊环境数字制造装备技术创新中心,四川 绵阳 621900

Federated collaborative framework-based semi-supervised remaining useful life prediction under cross-operating conditions

LI Qiyuan,, CHENG Xin, MA Wenqing, ZHANG Kaigan, XIA Tangbin,, XI Lifeng

1. Department of Industrial Engineering and Management, School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China

2. Special Environment Digital Manufacturing Equipment Technology Innovation Center, Mianyang 621900, China

通讯作者: 夏唐斌,男,教授. orcid.org/0000-0001-9121-1716. E-mail:xtbxtb@sjtu.edu.cn

收稿日期: 2025-02-28  

基金资助: 国家重点研发计划资助项目(2022YFF0605700);上海市自然科学基金资助项目(25ZR1401196).

Received: 2025-02-28  

Fund supported: 国家重点研发计划资助项目(2022YFF0605700);上海市自然科学基金资助项目(25ZR1401196).

作者简介 About authors

李琦媛(2001—),女,硕士生,从事智能预测与健康管理研究.orcid.org/0009-0000-8641-6012.E-mail:communicate@sjtu.edu.cn , E-mail:communicate@sjtu.edu.cn

摘要

针对不同工况下信号数据分布的差异性与隐私保护限制,设计半监督域对抗联邦协作模型(SAFCM),实现数据跨工况和隐私保护下机械设备的剩余寿命预测. 设计双向注意力时序卷积网络,从通道注意力和自注意力机制2个方向进行域不变特征提取;以该卷积网络作为特征提取器,构建跨工况半监督域对抗模型(COCSAM),通过域对抗学习和域距离度量在不平衡域之间实现高鲁棒性的域适应;将COCSAM集成到联邦协作框架中,搭建SAFCM,通过子模型的差异化分布和动态加权更新,实现数据隐私保护下的网络异步更新,促进数据的充分利用和高效域适应. 采用2个不同应用场景下的数据集进行解释性分析和鲁棒性研究,结果证明所提模型在真实工业场景中具有稳健性和优越性.

关键词: 剩余使用寿命 ; 半监督 ; 域适应 ; 跨工况 ; 联邦学习

Abstract

In response to the distribution differences under different operating conditions and the privacy protection constraints of signal data, a semi-supervised domain adversarial federated collaborative model (SAFCM) was designed to realize the remaining useful life prediction of mechanical equipment under cross-operating conditions and privacy preservation. A bidirectional attention temporal convolutional network was designed to extract domain-invariant features through two directions of channel attention mechanism and self-attention mechanism. By using this convolutional network as a feature extractor, a cross-operating-condition semi-supervised domain adversarial model (COCSAM) was constructed to achieve highly robust domain adaptation between imbalanced domains through domain adversarial learning and domain distance measurement. The COCSAM was integrated into the federated collaborative framework to build the SAFCM. Through differentiated distribution and dynamic weighted updates of the sub-models, asynchronous network updates were achieved under data privacy protection, promoting the full utilization of data and efficient domain adaptation. Two datasets from different application scenarios were utilized to conduct the interpretability analysis and robustness study, the results of which demonstrated the robustness and superiority of the proposed SAFCM in real industrial scenarios.

Keywords: remaining useful life ; semi-supervision ; domain adaptation ; cross-operating condition ; federated learning

PDF (1854KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

李琦媛, 程鑫, 马文清, 张开淦, 夏唐斌, 奚立峰. 联邦协作框架下的跨工况半监督剩余使用寿命预测. 浙江大学学报(工学版)[J], 2026, 60(1): 127-137 doi:10.3785/j.issn.1008-973X.2026.01.012

LI Qiyuan, CHENG Xin, MA Wenqing, ZHANG Kaigan, XIA Tangbin, XI Lifeng. Federated collaborative framework-based semi-supervised remaining useful life prediction under cross-operating conditions. Journal of Zhejiang University(Engineering Science)[J], 2026, 60(1): 127-137 doi:10.3785/j.issn.1008-973X.2026.01.012

随着机械设备结构设计的日益复杂以及功能配置的不断增强,准确预测设备的剩余使用寿命(remaining useful life, RUL)已成为预测和健康管理(prognostics and health management, PHM)应用部署的重大挑战[1-3]. 数据驱动的RUL预测方法,比如卷积神经网络(CNN)和循环神经网络(RNN)等深度学习模型,已成为当前研究的焦点. 其中,时序卷积网络[4-5]和自注意力机制[6-8]等变体拥有更大的感受野,可以有效捕获长期时序特征,因而被广泛研究. 在工业场景中,同类设备或相似设备在不同的工作条件和服役环境下的退化过程存在差异,产生了具有多种退化特征的异构工况数据. 如何利用退化信息完整的旧工况数据(源域数据)构建高精度预测网络,并将其有效迁移至退化信息稀疏的新工况数据(目标域数据)以实现RUL预测,是跨工况寿命预测的核心问题. 传统的RUL预测模型难以解决数据分布偏移的跨工况预测问题;虽然域适应技术可以提供一定的解决方案[9-10],但是仍然面临着数据难以被充分利用和受限于隐私保护的挑战.

常见的域适应方法包括域距离度量方法和域对抗方法,分别用于减少源数据和目标数据之间的域距离,以及提取域不变特征. 王昊等[11]建立轴承故障迁移诊断模型,综合利用最大均值差异(maximum mean discrepancy, MMD)和距离方差衡量不同分布的差异,并改进膨胀卷积神经网络以提取信号中的多尺度泛化特征. Wu等[12]提出用于跨域RUL预测的加权对抗损失函数,使对抗模型不同域中具有相似RUL的样本对齐. 蔡伟立等[13]提出基于动态对抗域适应的迁移学习方法,该方法能够快速搭建新加工工艺条件下的刀具剩余寿命预测模型. 这些域适应方法大多聚焦于无监督域适应,其中目标域完全无标记,只有源域有完整标签. 但是在工业场景中,工厂在试运行或前期运行时已经积累少量目标域标签数据,无监督方法难以利用目标域的标签数据实现预测精度的提升. 而半监督域适应方法在使用源域的完整标签数据的基础上,能够充分利用目标域的稀疏标签数据辅助域适应,显著提升了域适应效率和目标域预测精度.

在工业生产中,与传感信号耦合的实际设备通常分布在相互独立的不同工厂中. 目前研究通常假设传感数据可以被同时获取,但是由于数据安全和隐私保护方面的要求,各工厂不愿直接共享传感器数据,因此当前域适应研究中假设的数据集中训练范式和各工厂无限通信模式,在实际应用中难以实现. 联邦学习的提出为解决该隐私保护问题提供了有效途径[14-15]. 在联邦学习中,中央服务器对来自不同客户端、在本地训练的模型执行平均操作以获得全局优化模型,在确保预测精度的同时实现了数据不出本地的隐私保护. Zhang等[16]将联邦迁移学习方法用于表面肌电手势识别,以提高识别准确性,同时保护隐私. 刘翀赫等[17]通过将去中心化学习和分层联邦学习相结合,构建基于无线设备直通网络的分层联邦学习框架,在降低全局聚合频率的同时减少训练时间,以提高模型性能. 然而,在设备的半监督RUL预测领域,目前较少有联邦学习框架能够在数据共享下的隐私保护与本地多域可用数据的域适应之间取得平衡.

针对上述问题,设计半监督域对抗联邦协作模型(semi-supervised domain adversarial federated collaborative model, SAFCM). 在联邦框架各端差异化部署预测子模型,通过域对抗机制提取有效退化特征,利用域距离度量方法对齐不同域的标签空间,实时传输模型参数并进行动态联合加权,实现模型的异步训练与更新,最终搭建高精度隐私保护的域适应预测模型.

1. 问题描述

由于服役设备的隐私限制以及多样化工作条件,现有方法缺乏安全协作机制,难以兼顾跨工况信号的安全通信与半监督RUL预测的准确性. 域适应技术和联邦框架的集成可以克服高价值敏感信号的分布偏移,提高跨工况下隐私保护、域适应和寿命评估性能. 因此,设计SAFCM,用于实现隐私保护下高精度、高鲁棒性的跨工况半监督RUL预测,具体结构如图1所示.

图 1

图 1   半监督域对抗联邦协作模型模型整体框架图

Fig.1   Overall framework diagram of semi-supervised domain adversarial federated collaborative model


针对域数据分布偏移和数据利用不充分的挑战,构建跨工况半监督域对抗模型(cross-operating-condition semi-supervised domain adversarial model, COCSAM),实现半监督域适应. 该模型主要包含基于双向注意力时序卷积网络的特征提取器、回归预测器和域判别器3个子模型. 针对数据隐私保护需求,构建联邦协作框架以承担中央服务端和客户端之间的通讯任务,将数据处理模式从单一数据来源扩展到协作多源聚合. 最后,以COCSAM作为训练基模型,将各子模型部署在联邦协作框架各端进行多端异步更新与聚合,实现基模型COCSAM和联邦协作框架的集成,得到整体模型SAFCM.

2. 基于COCSAM的跨工况RUL预测方法

2.1. 基于双向注意力时序卷积网络的退化特征提取器

为了增强模型对退化时变特征的提取能力,将高效通道注意力机制(efficient channel attention, ECA)[18]和自注意力机制[19]作为2个并行的方向,设计双向注意力时序卷积网络作为退化特征提取器. 将设备在时间点$t$$M$个传感器采集到的信号表示为${\boldsymbol{D}}\left( t \right) = \left[ {{d_1}\left( t \right),{d_2}\left( t \right), \cdots ,{d_M}\left( t \right)} \right]$.${\boldsymbol{D}}\left( t \right)\left( {t \in \left[ {0,Y} \right]} \right)$上滑动长度h来连续获得信号序列$ {{\boldsymbol{D}}_t} = [ {\boldsymbol{D}}\left( {t - h+1} \right), {\boldsymbol{D}}\left( {t - h+2} \right), \cdots ,{\boldsymbol{D}}\left( t \right) ] $,其中$Y$为设备的最大运行时长.

对于特征提取的ECA方向,将${{\boldsymbol{D}}_t}$输入集成了ECA的模块${\varphi ^{\text{E}}}$,得到增强信号${{\boldsymbol{X}}_t}$. 将扩张因果卷积层${\varphi ^{\text{L}}}$添加到${\varphi ^{\text{E}}}$,以扩大感受野并捕获时间耦合关系. ${\varphi ^{\text{L}}}$${{\boldsymbol{X}}_t}$进行扩张卷积运算后得到${{\boldsymbol{O}}^{{\varphi _k}}}\left( {k = 1,2, \cdots ,K} \right)$,即第$k$个滤波器输出的时间特征. 在${{\boldsymbol{O}}^{{\varphi _k}}}$的基础上,设置权重归一化、激活函数以及dropout操作,并加入短路连接. 最终,将ECA方向上从原始信号${{\boldsymbol{D}}_t}$中提取到的传感器通道间退化特征表示为$ {\boldsymbol{\psi}} _t^{\mathrm{c}} $.

对于特征提取的自注意力方向,主要通过3个不同的查询(Q)、键(K)和值(V)分支提高模型对各传感器通道内特征的提取能力. 通过各分支平衡退化特征的粒度和维度,计算得到传感器通道内的注意力向量值:

$ \boldsymbol{S}_t^{\mathrm{E}}=\operatorname{ReLU}\left(\left(\boldsymbol{S}_t * \boldsymbol{V}_t\right)+\boldsymbol{V}_t\right) . $

式中:注意力分数矩阵$\boldsymbol{S}_t$QK的点积经缩放后得到,*表示逐元素相乘. 第2个方向上的退化特征表示为$\boldsymbol{\psi} _t^{\mathrm{i}}$$\boldsymbol{\psi }_t^{\mathrm{i}} = \boldsymbol{S}_t^{\text{E}}$.

最后,将ECA方向的退化特征$\boldsymbol{\psi }_t^{\mathrm{c}}$和自注意力方向的退化特征$\boldsymbol{\psi} _t^{\mathrm{i}}$合并为总退化特征${\boldsymbol{\psi} _t}$

$ {\boldsymbol{\psi} _t} = [\boldsymbol{\psi }_t^{\mathrm{c}},\boldsymbol{\psi} _t^{\mathrm{i}}]. $

2.2. 跨工况COCSAM建立

对于在跨工况下服役的设备,部分设备可能拥有大量标记信号$[\boldsymbol{D}_t^{\rm{S}},\boldsymbol{Y}_t^{\rm{S}}] \in {{\bf{DS}}^{\rm{S}}}$,而另一些设备可能仅拥有稀疏标记信号$[\boldsymbol{D}_t^{\rm{T}},\boldsymbol{Y}_t^{{\rm{T}}'}] \in {{\bf{DS}}^{\rm{T}}}$. 为了在域不变特征空间内有效测量域距离并减少域差异,集成域对抗和域距离度量2种域适应方法. 对于域对抗结构,COCSAM将特征提取器、联合域判别器和RUL回归预测器作为1个整体. 对于域距离度量,利用MMD距离量化并对齐跨工况下源域数据集${{\bf{DS}}^{\rm{S}}}$和目标域数据集${{\bf{DS}}^{\rm{T}}}$之间的域距离. 模型的核心组件如下.

1) 基于双向注意力时序卷积网络的特征提取器. 将构建的卷积网络模块$F$作为COCSAM的特征提取器,$ {\theta ^F} $F的所有可训练参数. F对来自${{\bf{DS}}^{\rm{S}}}$${{\bf{DS}}^{\rm{T}}}$的所有原始信号序列进行相同的处理,从统一的尺度中提取时间相关性和耦合关系,从而提取出跨工况下的域不变特征分布.

2) 半监督联合域判别器. 域判别器D由多层感知(multi-layer perceptron, MLP)层和全连接层组成,旨在区分半监督联合分布,其所有可训练参数的集合定义为$ {\theta ^D} $. MLP层确保退化特征可以与其相应的标签匹配[20],全连接层根据预测标签${P_{\rm{S}}}\left( {\boldsymbol{D}_t^{\rm{S}},\boldsymbol{Y}_t^{\rm{S}}} \right)$$ {P_{\rm{S}}}\left( {\boldsymbol{D}_t^{\rm{T}},\boldsymbol{Y}_t^{{\rm{T}}'}} \right) $进行域标签分类. 将预测域标签和实际域标签与${{\bf{DS}}^{\rm{S}}}$${{\bf{DS}}^{\rm{T}}}$数据配对,得到${{\bf{DX}}^{\rm{S}}}$${{\bf{DX}}^{\rm{T}}}$数据集以便于计算域混淆损失和域判别损失.

3) 域不变RUL回归预测器. 回归预测器R以特征提取器的输出特征作为输入,其输出结果作为域判别器的输入数据;整体由多个全连接层组成,所有训练参数的集合定义为${\theta ^R}$. 该模块中的预测器将带标签的源域数据集$[\boldsymbol{D}_t^{\rm{S}},\boldsymbol{Y}_t^{\rm{S}}]$和带稀疏标签的目标域数据集$[\boldsymbol{D}_t^{\rm{T}},\boldsymbol{Y}_t^{{\rm{T}}'}]$输入到全连接层进行训练和参数更新. ${{\bf{DS}}^{\rm{T}}}$中部分$\boldsymbol{D}_t^{\rm{T}}$数据的标签值缺失,导致${{\bf{DX}}^{\rm{T}}}$的标签不完整,因此完成训练的预测器会输出对应的伪标签$\boldsymbol{Y}_t^{{{\rm{T}}^*}}$,以保障${{\bf{DX}}^{\rm{T}}}$$[\boldsymbol{D}_t^{\rm{T}},\boldsymbol{Y}_t^{{\rm{T}}'},\boldsymbol{Y}_t^{{{\rm{T}}^*}}]$的数据标签完整性. 同时,由$[\boldsymbol{D}_t^{\rm{T}},\boldsymbol{Y}_t^{{\rm{T}}'},\boldsymbol{Y}_t^{{{\rm{T}}^*}}]$构成的联合域分布能够有效提升域判别器的性能.

2.3. COCSAM多目标平衡优化

COCSAM的多目标优化过程见图2. 首先,剩余寿命预测损失函数为

图 2

图 2   COCSAM中域适应多目标平衡优化框架

Fig.2   Domain adaptation multi-objective balanced optimization framework in COCSAM


$ L_R=\dfrac{1}{n_{\mathrm{S}}} \displaystyle\sum_{j=1}^{n_{\mathrm{S}}}\left|{{Y}}_{j, t}^{\mathrm{S}}-\hat{{Y}}_{j, t}^{\mathrm{S}}\right|^2+\dfrac{1}{n_{\mathrm{T}^{\prime}}} \displaystyle\sum_{q=1}^{n_{\mathrm{T}^{\prime}}}\left|{{Y}}_{q, t}^{\mathrm{T}^{\prime}}-\hat{{Y}}_{q, t}^{\mathrm{T}^{\prime}}\right|^2 . $

式中:${n_{\rm{S}}}$${{\bf{DS}}^{\rm{S}}}$中源域训练数据的数量,所有源域训练数据均有标签;${n_{{\rm{T}}'}}$${{\bf{DS}}^{\rm{T}}}$中有标签的目标域训练数据的数量,占目标域训练数据总量${n_{\rm{T}}}$的比例为$\eta $,且${n_{{\rm{T}}'}} \ll {n_{\mathrm{S}}}$${{Y}}_{j,t}^{\rm{S}}$${{Y}}_{q,t}^{{\rm{T}}'}$分别为各自数据中第$j$个和第$q$个实际RUL标签;$\hat {{Y}}_{j,t}^{\text{S}}$$\hat {{Y}}_{q,t}^{{\mathrm{T}}'}$分别为经过训练后预测器预测的RUL值. 根据损失函数$ {L_R} $,计算预测RUL与实际RUL标签之间的均方误差(mean square error, MSE),实现提取器和预测器的更新.

考虑到跨工况预测任务的连续性和复杂性,进一步计算${\boldsymbol{D}}_t^{\rm{S}}$${\boldsymbol{D}}_t^{\rm{T}}$的RUL输出之间的MMD值,以减少不同域的特征分布距离. 域混淆损失${L_{{\text{MMD}}}}$

$ {L_{{\mathrm{MMD}}}} = \left\| {E\left[ {R\left( {F\left( {{\boldsymbol{D}}_t^{\rm{S}}} \right)} \right)} \right] - E\left[ {R\left( {F\left( {{\boldsymbol{D}}_t^{\rm{T}}} \right)} \right)} \right]} \right\|_{{H_k}}^2. $

式中:$E\left( \cdot \right)$为期望函数,${H_k}$表示再生核希尔伯特空间,$F\left( {{\boldsymbol{D}}_t^{\rm{S}}} \right) = {\boldsymbol{\psi}}_t^{\rm{S}}$$F\left( {{\boldsymbol{D}}_t^{\rm{T}}} \right) = {\boldsymbol{\psi}}_t^{\rm{T}}$为提取器F提取的原始信号${\boldsymbol{D}}_t^{\rm{S}}$${\boldsymbol{D}}_t^{\rm{T}}$的特征.

最后,为了对齐域联合分布,将提取的特征$ \left({\boldsymbol{\psi}}_{t}^{\rm{S}}, {\boldsymbol{\psi}}_{t}^{{\rm{T}}}\right) $和RUL标签$ \left( {{\boldsymbol{Y}}_t^{\rm{S}},{\boldsymbol{Y}}_t^{\rm{T}^{\prime}},{\boldsymbol{Y}}_t^{{{\rm{T}}^*}}} \right) $通过MLP层进行线性组合,传递到判别器中计算域判别损失${L_D}$,确保判别器的有效性.

$ {L_D} = - \dfrac{1}{(n_{\mathrm{S}}+n_{\mathrm{T}})}\mathop \sum \limits_{p = 1}^{{n_{\rm{S}}}+{n_{\rm{T}}}} \left[ {{T_p}{\mathrm{ln}}\;{{\hat T}_p}+\left( {1 - {T_p}} \right){\mathrm{ln}}\;\left( {1 - {{\hat T}_p}} \right)} \right]. $

式中:${\hat T_p}$${T_p}$分别为${{\bf{DX}}^{\rm{S}}}$${{\bf{DX}}^{\rm{T}}}$的第$p$个数据的预测域标签和实际域标签;${T_p}$设置为0-1二进制变量以指示域归属情况,对于${{\bf{DX}}^{\rm{S}}}$指定为0,对于${{\bf{DX}}^{\rm{T}}}$指定为1. 值得注意的是,由于使用了梯度反转层(gradient reversal layer, GRL),${L_D}$的优化方向与${L_R}$${L_{{\mathrm{MMD}}}}$相反,在反向传播到特征提取器F之前自动反转${L_D}$的梯度.

最终,COCSAM多目标优化总损失函数为

$ {L_{\rm{T}}} = {L_R}+\gamma {L_{{\mathrm{MMD}}}}+\delta {L_D}. $

式中:$\gamma $$\delta $为可调损失权重,用于实现域适应和域混淆的平衡优化. 在COCSAM中,特征提取器与域判别器持续进行对抗训练,提取域不变特征并拉近域联合分布,同时与RUL回归预测器联合更新,指导预测结果与真实RUL值对齐,最终实现全局半监督域适应的对抗优化.

3. 基于联邦学习的SAFCM预测框架

3.1. 联邦协作框架

实际工业场景中,每个独立工厂在联邦学习框架中被称为客户端. 客户端记为${C_i}\left( {i \in \left[ {1,{n_C}} \right]} \right)$,其中${n_C}$为SAFCM中总的客户端数量. 客户端${C_i}$拥有私有的源域旧工况数据${\boldsymbol{S}}_{{C_i}}^{\rm{S}}$和目标域新工况数据${\boldsymbol{S}}_{{C_i}}^{\rm{T}}$${{\bf{DS}}^{\rm{S}}} = \bigcup\nolimits_{i = 1}^{{n_C}} {{\boldsymbol{S}}_{{C_i}}^{\rm{S}}} $${{\bf{DS}}^{\rm{T}}} = \bigcup\nolimits_{i = 1}^{{n_C}} {{\boldsymbol{S}}_{{C_i}}^{\rm{T}}} $. 考虑到数据隐私安全,各客户不愿意彼此共享${\boldsymbol{S}}_{{C_i}}^{\rm{S}}$${\boldsymbol{S}}_{{C_i}}^{\rm{T}}$. 同时,单客户端的训练数据量较为有限,难以有效构建高精度半监督预测器. 因此,引入中央服务器来构建联邦协同框架,并将其与COCSAM基模型结合,最终搭建SAFCM. 该模型能够在保证数据隐私的同时,实现跨工况半监督RUL预测.

在SAFCM中,联邦协同框架的核心是全局参数聚合,由本地训练和协同训练2个阶段组成. 本地训练时,每个客户端${C_i}$将其源域工况数据${\boldsymbol{S}}_{{C_i}}^{\rm{S}}$和目标域工况数${\boldsymbol{S}}_{{C_i}}^{\rm{T}}$输入COCSAM,得到其本地基模型. 其中,只有特征提取器F和回归预测器R进行本地更新,域判别器D的可训练参数保持原始设置. 将公式(6)中的总优化损失函数转换为下式,以表示客户端${C_i}$的局部损失:

$ L_{{{\text{T}}_{\text{1}}}}^{{C_i}} = L_{{R_{{C_i}}}}^{{C_i}}+{{\gamma }}L_{{\text{MMD}}}^{{C_i}};{\text{ }}i \in \left[ {1,{n_C}} \right]. $

式中:局部损失$L_{{{\text{T}}_{\text{1}}}}^{{C_i}}$通过梯度下降进行优化,以逼近最小值. 特征提取器${F_{{C_i}}}$和回归预测器${R_{{C_i}}}$的相关参数计算如下:

$ \hat \theta _{{C_i}}^F = {\mathop {\arg \min }\limits_{\theta _{{C_i}}^F} }\; E\left[ {L_{{{\rm{T}}_1}}^{{C_i}}(\theta _{{C_i}}^F,\theta _{{C_i}}^R,\theta _{{C_i}}^D)} \right], $

$ \hat \theta _{{C_i}}^R = {\mathop {\arg \min }\limits_{\theta _{{C_i}}^R} } \;E\left[ {L_{{{\rm{T}}_1}}^{{C_i}}(\theta _{{C_i}}^F,\theta _{{C_i}}^R,\theta _{{C_i}}^D)} \right]. $

式中:$\hat \theta _{{C_i}}^F$$\hat \theta _{{C_i}}^R$分别为参数$\theta _{{C_i}}^F$$\theta _{{C_i}}^R$的估计值. 在每一轮局部训练中,参数$\theta _{{C_i}}^F $$\theta _{{C_i}}^R$的更新公式为

$ \theta _{{C_i}}^F = \theta _{{C_i}}^F - {\alpha _{{C_i}}}\frac{{\partial L_{{{\rm{T}}_1}}^{{C_i}}(\theta _{{C_i}}^F,\theta _{{C_i}}^R,\theta _{{C_i}}^D)}}{{\theta _{{C_i}}^F}}, $

$ \theta _{{C_i}}^R = \theta _{{C_i}}^R - {\alpha _{{C_i}}}\frac{{\partial L_{{{\rm{T}}_1}}^{{C_i}}(\theta _{{C_i}}^F,\theta _{{C_i}}^R,\theta _{{C_i}}^D)}}{{\theta _{{C_i}}^R}}. $

式中:${\alpha _{{C_i}}}$${C_i}$的学习率. 经局部训练后,以提取的特征(${\boldsymbol{\psi}}_{{C_i},t}^{\rm{S}},{\boldsymbol{\psi}}_{{C_i},t}^{\rm{T}}$)为输入,可以在不同的局部跨工况下获得初步的特征提取器和回归预测器更新值.

协同训练时,考虑到域判别器对半监督域对抗的重要性,将其设置在中央服务器端进行联邦训练更新,以整合更多的域分布信息,同时最大限度地避免额外的计算和通信成本. 作为式(6)、(8)的补充部分,域判别器的对抗性损失函数为

$ L_{{{\rm{T}}_2}}^C = \delta L_D^C, $

$ \hat \theta _C^D = \arg \mathop {\min }\; E\left[ {L_{{{\rm{T}}_2}}^C\left( {\theta _C^F,\theta _C^R,\theta _C^D} \right)} \right]. $

式中:$L_{{{\rm{T}}_2}}^C$为所有客户端$\left\{ {{C_i}} \right\}_{i = 1}^{{n_C}}$域混淆损失函数$L_{D}^C$的全局加权损失. $\theta _C^D$的更新公式为

$ \theta _C^D = \theta _C^D - \alpha \frac{{\partial L_{{{\rm{T}}_2}}^C\left( {\theta _C^F,\theta _C^R,\theta _C^D} \right)}}{{\theta _C^D}}. $

在每轮训练结束后,将$\theta _C^D$的更新值赋给所有$\theta _{{C_i}}^D\left( {i \in \left[ {1,{n_C}} \right]} \right)$以支持${F_{{C_i}}}$${R_{{C_i}}}$的本地训练.

在协同训练中,需要对各客户上传的参数进行聚合加权,因此设计多维协同加权公式,通过平衡可用数据量和实时优化损失来确定每个客户端的全局交互权重系数$w_i^{\mathrm{G}}\left( {i \in \left[ {1,{n_C}} \right]} \right)$. 将每个客户端中数据数量表示为${n_{{C_i}}}, \displaystyle{\sum}_{i = 1}^{{n_C}} {n_{{C_i}}} = {n_{\rm{S}}}+{n_{\rm{T}}}$$w_i^{\mathrm{G}}$表示为

$ w_i^{\mathrm{G}} = \dfrac{{\lambda{n_{{C_i}}}}}{{ \displaystyle{\sum}_{i = 1}^{{n_C}} {n_{{C_i}}}}}+\left( {1 - \lambda } \right)\dfrac{{1 - {{L_{{{\rm{T}}_1}}^{{C_i}}} \mathord{\left/ {\vphantom {{L_{{{\rm{T}}_1}}^{{C_i}}} { \displaystyle{\sum} _{i = 1}^{{n_C}} L_{{{\rm{T}}_1}}^{{C_i}}}}} \right. } { \displaystyle{\sum}_{i = 1}^{{n_C}} L_{{{\rm{T}}_1}}^{{C_i}}}}}}{{{n_C} - 1}};\;i \in \left[ {1,{n_C}} \right]. $

式中:$\lambda $为全局权重的可调参数,旨在平衡数据量和损失值. 考虑到每个客户端本地模型的数据支撑量和潜在有效性,全局参数估计值$\tilde \theta _C^F$$\tilde \theta _C^R$表示为

$ \tilde \theta _C^F = \mathop \sum \limits_{i = 1}^{{n_C}} w_i^{\mathrm{G}}\theta _{{C_i}}^F, $

$ \tilde \theta _C^R = \mathop \sum \limits_{i = 1}^{{n_C}} w_i^{\mathrm{G}}\theta _{{C_i}}^R. $

因此,特征提取器和回归预测器在每轮通信后更新为$\theta _{{C_i}}^F = \tilde \theta _C^F$$\theta _{{C_i}}^R = \tilde \theta _C^R$$i \in \left[ {1,{n_C}} \right]$. 最终的损失函数可以近似地估计为COCSAM中的全局函数:

$ {L_{\rm{T}}} \approx \mathop \sum \limits_{i = 1}^{{n_C}} L_{{{\rm{T}}_1}}^{{C_i}}+L_{{{\rm{T}}_2}}^C, $

$ {L}_{R}+\gamma {L}_{{\mathrm{MMD}}}+\delta {L}_{D}\approx \displaystyle\sum _{i=1}^{{n}_{C}}{L}_{{R}_{{C}_{i}}}^{{C}_{i}}+\gamma \displaystyle\sum _{i=1}^{{n}_{C}}{L}_{{\mathrm{MMD}}}^{{C}_{i}}+\delta {L}_{D}^{C} . $

3.2. 总体流程

SAFCM的总体流程如图3所示,共有3个过程. 1)预训练过程,主要对域判别器进行预训练. 2)训练过程,中央服务器随机选择比例$r$的客户参与当前轮次的训练,实现3.1节中的全局参数聚合. 在本地训练阶段,客户端利用基模型COCSAM进行${e_{\mathrm{l}}}$轮的本地域适应训练,增强模型半监督域适应的鲁棒性,之后客户端将本地训练的模型参数和相关特征信息传回中央服务器进行汇总,同时在本地保留重要的原始数据,确保数据隐私安全. 在协同训练阶段,服务器整合这些信息以进行${e_{\mathrm{c}}}$轮的域判别器训练,确保其能够有效区分跨工况多域数据. 在聚合加权之后,当前轮次的新模型参数被发送回客户端,并再次启动本地训练. 重复本地训练和协同训练的循环通讯,直到模型收敛或达到最大轮次${e_{\mathrm{M}}}$. SAFCM的安全通信框架能够充分利用局部参数来增强全局泛化能力并降低过拟合风险,实现了客户端和中央服务器之间的稳健通信,并保护了信号隐私. 3)测试过程,客户将私有在线退化数据直接输入最终的特征提取器模型中,并通过回归预测器进行RUL预测.

图 3

图 3   SAFCM联邦通讯流程图

Fig.3   Federated communication flow of SAFCM


4. 实例分析

4.1. 实例一:C-MAPSS涡扇发动机数据集

4.1.1. 参数设置

实例一采用C-MAPSS涡扇发动机数据集[21],划分各客户端与中央服务器并搭建联邦通讯框架,实现基于SAFCM的RUL预测. 该数据集由4个不同的子数据集组成,包括FD001、FD002、FD003和FD004. 每个子数据集对应不同的工况条件,数据分布均不相同. 依次选取各子数据集作为源域,其余子数据集作为目标域,共形成12个源-目标对. 将所有数据划分为${n_{{C}}}$份,将其随机均匀分布在${n_{{C}}}$个客户端中;每个客户端有2个不同的域数据,而每个域数据都包含训练和测试样本. 其中,源域训练数据有标签,但是目标域训练数据只有比例为$\eta $的标签. 数据集的处理包括以下步骤.

1)传感器选取与数据标准化:选取前2个运行状态监测传感器和14个性能监测传感器获取的数据为原始特征[22]. 考虑到不同的运行条件,用K均值聚类和归一化方法将数据转换为统一范围.

2)时间窗口处理:采用大小为$h$的时间窗口,以步长为1沿着每个传感器数据滑动,将包含当前时间点和前几个时间点的子序列作为1个数据样本.

3)RUL定义:基于分段函数为每个运行至故障的时间序列构建实际的RUL序列[23].

$ \mathrm{RUL}= \begin{cases}r_{\max }, & 0 \leqslant t \leqslant R-r_{\max }; \\R-t, & R-r_{\max } \leqslant t \leqslant R.\end{cases} $

式中:$R$为设备运行至故障时的寿命;${r_{{\mathrm{max}}}}$为最大剩余寿命阈值,设为130;$t$为运行时间. 由于测试集包含许多在发生故障之前就结束的不完整序列,选取目标域中每个测试序列的最后1个滑动窗口作为输入数据,输出预测的RUL值. C-MAPSS数据集上常用的预测性能指标是均方根误差(root mean square error, RMSE)和Score. RMSE对高估和低估误差给予一致的惩罚,而Score函数对高估误差施加更大的惩罚,因为RUL预测的高估误差可能会导致更严重的后果. 定义${n_{\rm{T}}}$为目标域测试数据总数,${e_k}$为误差. RMSE和Score的计算公式为

$ {\mathrm{RMSE}} = \sqrt {\frac{1}{{{n_{\rm{T}}}}}\mathop \sum \limits_{k = 1}^{{n_{\rm{T}}}} e_k^2} . $

$ {{\mathrm{Score}}}= \left\{\begin{array}{ll}\displaystyle\sum_{k=1}^{n_{\mathrm{T}}}\left(\exp\; \left(-e_k / 13\right)-1\right), & e_k \leqslant 0 ; \\ \displaystyle\sum_{k=1}^{n_{\mathrm{T}}}\left(\exp \;\left(e_k / 10\right)-1\right), & e_k>0 .\end{array}\right. $

将处理后的训练数据按9∶1的比例随机分为训练集和验证集,利用上述指标评估不同超参数下SAFCM对每个源-目标对的预测结果,从中选取在验证集上平均效果最好的模型设置,对每轮结果运行10次取平均值,以减少随机误差的影响. SAFCM网络结构的超参数如表1所示,其中结构和层数根据数值实验结果确定,$ {k_{{\mathrm{size}}}} $$ {p_{{\mathrm{drop}}}} $$ {h_{{\mathrm{hid}}}} $分别为核大小、Dropout率和神经元数量.

表 1   SAFCM网络结构超参数

Tab.1  SAFCM network structure hyperparameters

子模型$ {k_{{\mathrm{size}}}} $$ {p_{{\mathrm{drop}}}} $$ {h_{{\mathrm{hid}}}} $
特征提取器方向一(5, 2)(0.2, 0)
特征提取器方向二(3, 7)
域判别器(0.2, 0.2, 0.2)(64, 32, 2)
回归预测器(0.2, 0.2, 0, 0)(64, 32, 16, 1)

新窗口打开| 下载CSV


4.1.2. 效果分析

为了对COCSAM开展域适应机理研究,挖掘高维特征对目标域预测的潜在影响,对实例结果进行解释性分析. 图4展示了2组实验中高维特征值在域适应前后的概率密度分布,$s_{\mathrm{f}}$为特征数值,$f(s_{\mathrm{f}})$为概率密度. 开始时不同工况下的高维特征主要表现为分散性和无规律性,经域适应处理后呈现出明显的特征趋势且分布集中,证明了COCSAM可以有效提取不同分布数据的共同特征,拉近不同域的高维空间表示并减少负迁移现象.

图 4

图 4   不同域特征在域适应前后的概率密度分布

Fig.4   Distribution of probability density for different domain features before and after domain adaptation


进一步地,用沙普利加性解释(Shapley additive explanations, SHAP)方法展示了不同传感器特征对COCSAM域适应影响的解释性分析,见图5,其中SHAP为衡量传感器对模型输出影响的SHAP值. 由图可知,传感器特征s11、s4、s17对预测结果的影响最大. 在其他特征中,影响最大的s3所占的影响比例不足s11的50%. 而且,排名靠前的特征同时表现出较大的正效应和负效应,说明其在不同观测值下对模型预测结果的影响差别较大且无明显规律.

图 5

图 5   基于不同传感器特征对域适应结果的解释性分析

Fig.5   Interpretative analysis of domain adaptation results based on different sensor features


对双向注意力时序卷积网络进行消融实验,验证每个方向对特征提取的有效性,见图6. 结果表明,COCSAM的RMSE相较于单方向特征提取器D1、D2的RMSE明显降低. 例如,对于FD001-FD003,COCSAM双向网络能够比单向网络获得高达46.24%的性能改进. 此外,在所有比较实验中,COCSAM的性能表现比单向注意力方法更加稳定,有更强的鲁棒性.

图 6

图 6   双向注意力时序卷积网络及其不同方向的变体的预测性能比较

Fig.6   Prediction performance comparison of bidirectional attention temporal convolutional network and its directional variants


将COCSAM与联邦协作框架结合并构建SAFCM后,为了验证联邦协作和域适应的有效性,将其与作为基线的源域模型和作为上限的目标域模型进行比较. 源域模型仅基于源域数据训练,而目标域模型仅基于目标域数据训练,其余设置和SAFCM相同. 跨工况适应的训练参数由网格搜索优化得到,见表2. 其中,$\alpha $为所有客户的学习率,${b_{\text{T}}}$为每个批次中源域和目标域的训练数据量,$h$为每个子数据集的时间窗口大小.

表 2   SAFCM网络的域适应训练超参数

Tab.2  Training hyperparameters for domain adaptation in SAFCM network

参数数值参数数值
$\eta $0.15${e_{\mathrm{l}}}$10
$\delta $1${e_{\mathrm{c}}}$10
$\gamma $0.8${b_{\rm{T}}}$125
$\lambda $0.8${n_{\mathrm{c}}}$5
$r$0.8$\alpha $0.01
${e_{\mathrm{M}}}$40$h$(30, 20, 30, 15)

新窗口打开| 下载CSV


为了方便展示,图7中高于20 000的预测Score值被统一表示为20 000,源-目标对FD001-FD002等被简化表示为1→2等. 结果显示,SAFCM在目标域上的预测结果均明显优于源域模型,且与目标域模型接近. 其中,由于FD001的故障模式较为简单,FD001作为源域的预测难度较高,但是SAFCM仍然取得了良好的预测效果,对FD004的域适应结果甚至优于目标域模型. 由于FD004数据复杂度高,仅使用其自身数据难以挖掘复杂的耦合关系,而通过域适应方法,可以借助更为简单的源域衰退模式来增强对复杂目标域的预测能力. 图7结果证明了SAFCM在联邦学习框架下具有优异的跨工况RUL预测性能.

图 7

图 7   跨工况条件下不同预测模式的RUL预测结果

Fig.7   RUL prediction results of different prediction modes under cross-operating conditions


在FD003-FD001任务中,不同模型对每台发动机的最后1个测试数据的RUL预测结果如图8所示,其中id表示发动机编号. 由图可知,与真实值最接近的是目标域模型的预测结果,其次为SAFCM. 源域模型的预测结果与真实值的差距最大. 选取FD001的部分发动机的全测试数据,如图9所示. 相较于图8中的单点预测,全测试数据预测更能体现模型对不同衰退程度的预测效果. 结果显示,源域模型难以捕捉完整退化趋势,而所提方法和目标域模型的预测结果接近,都能够反映发动机不同的退化情况,进一步证明了SAFCM在域适应方面的有效性.

图 8

图 8   FD003-FD001任务中域适应RUL预测结果

Fig.8   Domain adaptation RUL prediction results in FD003-FD001 task


图 9

图 9   跨工况条件下采用不同发动机时的预测结果对比

Fig.9   Comparison of prediction results when adopting different engines under cross-operating conditions


为了验证模型的鲁棒性,对损失权重参数$ \gamma 和\delta $进行敏感性分析. 从FD001到FD003的域适应结果如图10(a)所示. 虽然损失权重的改变会影响结果,但是整体稳定且波动很小,表明预测性能不会被模型参数显著影响,SAFCM的域适应具有较高的鲁棒性.

图 10

图 10   不同超参数取值下域适应结果的鲁棒性对比

Fig.10   Comparison of robustness of domain adaptation results under different hyperparameter values


通过提供不同比例$\eta $的目标域样本标签,进一步探讨半监督学习相对于无监督学习对域适应的影响. 改变3个不同难度的域适应任务FD001-FD003、FD001-FD004和FD002-FD004的标签比例,结果如图10(b)所示. 在联邦协作框架中,与$\eta $=0的无监督学习相比,半监督学习利用稀疏的目标域标签,使RMSE平均降低了36.16%,Score平均降低了66.12%,预测精度显著提高. 随着标签比例的增大,SAFCM的预测性能继续提高,但是在某个阈值之后,预测性能达到稳定的状态. 该实验结果说明仅使用少量标记样本即可大幅提高目标域预测准确率,证明了半监督学习在联邦协作域适应方面的有效性,且所提模型在用户的不同标签比例下都能够保持域适应的有效性和高鲁棒性.

4.1.3. 性能对比

进一步地,将SAFCM与代表性的域适应方法进行比较,包括DANN[24]、CORAL[25]、CADA[26]和MCDA[27],结果如表3所示. 其中,RMSE1、RMSE2、RMSE3、RMSE4和Score1、Score2、Score3、Score4分别表示当源域为FD001、FD002、FD003、FD004时模型在不同目标域上的RMSE和Score值. 由于这些先进方法采用无监督学习并且忽略隐私保护需求,将数据集中训练,其理论结果会优于所提联邦框架的隐私保护训练模式. 为了公平比较,在这些方法的基础上加入半监督训练损失并应用到联邦协作框架中,同时确保所有方法的参数设置一致. 结果表明,SAFCM的RMSE始终表现优异;尽管Score呈指数级增长,不同方法的Score值差异较大,但是SAFCM的表现仍然良好,在相同的参数配置下表现出卓越的稳定性和预测性能. 提出的SAFCM在保证预测准确性和数据隐私保护的同时,实现了不同客户间跨工况数据的安全通信,为实际应用中的RUL预测提供了高可靠性的保障.

表 3   SAFCM与其他先进方法的域适应预测性能比较

Tab.3  Comparison of domain adaptation prediction performance of SAFCM and other state-of-the-art methods

方法RMSE1/cyclesRMSE2/cyclesScore1Score2
FD002FD003FD004FD001FD003FD004FD002FD003FD004FD001FD003FD004
DANN[24]31.2124.0727.2322.7122.4124.1812 415.324 005.819 016.182 289.483 700.225 349.81
CORAL[25]39.9742.0138.3535.4736.4037.2637 600.0746 826.0928 640.649 321.0513 314.3419 782.51
CADA[26]33.4317.9029.3717.4220.5524.8919 996.121 694.2811 581.88822.353 008.265 511.68
MCDA[27]42.1939.3734.5737.9636.4437.9640 147.2625 641.775 382.3811 059.267 686.8917 670.28
SAFCM20.3917.8921.8117.7321.2722.474 386.661 445.384 506.43863.152 626.984 372.02
方法RMSE3/cyclesRMSE4/cyclesScore3Score4
FD001FD002FD004FD001FD002FD003FD001FD002FD004FD001FD002FD003
DANN[24]22.2628.8625.4819.5122.8522.125 082.157 540.779 888.571 000.346 214.723 324.13
CORAL[25]35.6340.1038.5835.7338.3535.149 446.8135 069.4529 449.8010 294.3636 487.919 525.98
CADA[26]20.2528.6930.3225.5123.4220.341 341.1011 864.9612 018.762 780.707 204.243 323.91
MCDA[27]35.1840.8740.0239.3340.1637.085 334.8142 708.9045 589.3517 057.2452 331.2011 804.43
SAFCM18.0621.7022.6420.1021.4319.541 086.965 133.467 608.821 350.913 622.501 745.91

新窗口打开| 下载CSV


4.2. 实例二:某制造系统数控机床数据集

为了进一步验证SAFCM在不同操作条件、应用场景及数据集特征下的有效性,选取某制造系统的数控机床数据集进行实例验证. 该实例基于某个发动机曲轴制造系统中的6台数控机床,分别为数控铣削中心${M_1}$、数控车床${M_2}$、数控铣床${M_3}$、数控打孔机${M_4}$、数控随动磨床${M_5}$和数控抛光机${M_6}$. 在每台数控机床的主轴前端安装加速度传感器进行信号收集,实现对机床健康状态的实时监测. 所有传感器的采样频率设置为1 000 Hz,采样间隔为1 h,采样长度为0.5 s,每个采样窗口内的信号平均值用于表示机床在相应时刻的实时状态.

从机床收集的退化信号序列的总体设置见表4N1N2分别为训练集和测试集的样本数目,$ l_1^{\max }/l_1^{\min } $为最大/最小的训练样本长度,$ l_2^{\max }/l_2^{\min } $为最大/最小的测试样本长度. 序列包含机床退化相关信息与随机噪声干扰项. 通过200次随机重复拟合,构建每台机器的退化信号序列子数据集. 在每个子数据集中,从完整的序列中随机选择100个退化序列,并将其均匀分配给各分布式客户端作为训练集,其余100个退化序列用作测试集. 每台机床的子数据集对应不同的工况条件,两两配对可以得到30个源-目标对. 其余实验设计和参数选择与C-MAPSS数据集相同.

表 4   制造系统场景中传感器信号的总体设置

Tab.4  Overall setting of sensor signals in manufacturing system scenario

子数据集机床类型${N_1}$${N_2}$$ l_1^{\max }/{\mathrm{h}} $$ l_1^{\min } /{\mathrm{h}}$$ l_2^{\max } /{\mathrm{h}}$$ l_2^{\min }/{\mathrm{h}} $
${M_1}$数控铣削中心1001003 6332 4643 6912 356
${M_2}$数控车床1001004 1551 5524 4691 715
${M_3}$数控铣床1001002 1031 0391 9391 007
${M_4}$数控打孔机1001002 279692 29026
${M_5}$数控随动磨床1001002 4111 5532 4331 587
${M_6}$数控抛光机1001004 9784085 543554

新窗口打开| 下载CSV


考虑到C-MAPSS数据集是在不同操作条件下对同一类型的设备进行寿命预测而获得的,本实例重点研究不同操作条件下不同类型设备的寿命预测. 表5展示了最终全数据的预测均值RMSEa和最小特征距离均值dmin,并展示了其中部分域适应对的RMSE值. 其中,RMSE1、RMSE2、RMSE3、RMSE4、RMSE5和RMSE6分别表示当源域为M1~M6时在不同目标域上的RMSE值. 结果显示SAFCM提取的特征更集中、有效,RMSE预测结果优于其他先进方法,说明SAFCM可以在保护传感器信号隐私的同时,有效地减少不同操作条件下的分布偏移,实现了跨工况下多设备类型的RUL预测.

表 5   数控机床数据集的RUL预测结果

Tab.5  RUL prediction results of computer numerical control machine tool dataset

方法RMSE1/cyclesRMSE2/cyclesRMSE3/cycles${{\mathrm{RMSE}}_{\mathrm{a}}}$/cycles
${M_2}$${M_4}$${M_6}$${M_4}$${M_5}$${M_6}$${M_1}$${M_6}$
DANN[24]24.9423.9111.4946.475.9526.0220.3628.9231.79
CORAL[25]28.6125.2516.0651.4513.6615.6716.3827.1727.95
CADA[26]27.4521.4917.8845.685.4214.8720.3425.6530.39
MCDA[27]24.6324.9917.7043.8910.8112.9522.3227.4729.79
SAFCM14.4720.879.6627.995.177.8016.0821.3526.45
方法RMSE4/cyclesRMSE5/cyclesRMSE6/cycles${d_{\min }}$
${M_1}$${M_2}$${M_6}$${M_4}$${M_6}$${M_1}$${M_5}$
DANN[24]32.9466.8825.7848.9132.7418.1517.30223.83
CORAL[25]26.0369.5327.8244.0131.1016.3211.37140.67
CADA[26]25.8368.5028.3141.9229.8417.9214.11214.08
MCDA[27]25.6868.1027.1442.7724.7617.6113.51179.29
SAFCM20.3066.3125.2938.5419.4616.2610.6686.49

新窗口打开| 下载CSV


5. 结 语

面对实际工业场景中分布式设备的多样化工作条件和隐私保护需求对RUL预测的限制,提出寿命预测模型SAFCM. 其中,COCSAM框架采用域对抗和域距离度量双重机制,以减少负迁移并增强模型对目标域的预测能力. 特征提取器采用双向注意力时序卷积网络,可以改善稀疏时间序列数据的特征表示并深度挖掘时间耦合关系;域判别器对齐跨域的联合分布,以实现跨工况数据的域适应. 为了促进设备隐私保护和实时数据传输,将COCSAM与联邦协作框架相结合,将域判别器配置在服务器端更新,而提取器和预测器在客户端本地更新. 这种半监督的异步更新方法利用有限的目标域标签显著地提高了预测准确性和域适应效率,同时实现了数据安全通讯. 在C-MAPSS数据集和制造系统机床数据集上的验证结果表明,所提方法的效果优于其他先进方法,为隐私保护下的跨工况RUL预测提供了高可靠性和可拓展的网络结构. 未来将进一步考虑设备用户数据量分布不均衡的问题,以实现更灵活的框架结构. 此外,可以基于同态加密或差分隐私算法实现加密方案的优化设计,进一步研究并降低联邦通讯的计算开销.

参考文献

FERREIRA C, GONÇALVES G

Remaining useful life prediction and challenges: a literature review on the use of machine learning methods

[J]. Journal of Manufacturing Systems, 2022, 63: 550- 562

DOI:10.1016/j.jmsy.2022.05.010      [本文引用: 1]

许昱晖, 舒俊清, 宋亚, 等

基于多时间尺度相似性的涡扇发动机寿命预测

[J]. 浙江大学学报: 工学版, 2021, 55 (10): 1937- 1947

XU Yuhui, SHU Junqing, SONG Ya, et al

Remaining useful life prediction of turbofan engine based on similarity in multiple time scales

[J]. Journal of Zhejiang University: Engineering Science, 2021, 55 (10): 1937- 1947

SANZ-GORRACHATEGUI I, PASTOR-FLORES P, PAJOVIC M, et al

Remaining useful life estimation for LFP cells in second-life applications

[J]. IEEE Transactions on Instrumentation and Measurement, 2021, 70: 1- 10

[本文引用: 1]

JIANG Y, ZHAO M, ZHAO W, et al

Prediction of sea temperature using temporal convolutional network and LSTM-GRU network

[J]. Complex Engineering Systems, 2021, 1: 6

[本文引用: 1]

GUO B, QIAO Z, DONG H, et al

Temporal convolutional approach with residual multi-head attention mechanism for remaining useful life of manufacturing tools

[J]. Engineering Applications of Artificial Intelligence, 2024, 128: 107538

DOI:10.1016/j.engappai.2023.107538      [本文引用: 1]

ZHANG Z, SONG W, LI Q

Dual-aspect self-attention based on Transformer for remaining useful life prediction

[J]. IEEE Transactions on Instrumentation and Measurement, 2022, 71: 2505711

[本文引用: 1]

LIAO X, CHEN S, WEN P, et al

Remaining useful life with self-attention assisted physics-informed neural network

[J]. Advanced Engineering Informatics, 2023, 58: 102195

DOI:10.1016/j.aei.2023.102195     

ZHAO K, JIA Z, JIA F, et al

Multi-scale integrated deep self-attention network for predicting remaining useful life of aero-engine

[J]. Engineering Applications of Artificial Intelligence, 2023, 120: 105860

DOI:10.1016/j.engappai.2023.105860      [本文引用: 1]

ZHU Y, ZI Y, XU J, et al

An unsupervised dual-regression domain adversarial adaption network for tool wear prediction in multi-working conditions

[J]. Measurement, 2022, 200: 111644

DOI:10.1016/j.measurement.2022.111644      [本文引用: 1]

MIAO M, YU J, ZHAO Z

A sparse domain adaption network for remaining useful life prediction of rolling bearings under different working conditions

[J]. Reliability Engineering & System Safety, 2022, 219: 108259

[本文引用: 1]

王昊, 肖慧灵, 王丽亚, 等

一种基于改进迁移策略与膨胀卷积神经网络的轴承故障诊断方法

[J]. 工业工程与管理, 2022, 27 (1): 94- 101

[本文引用: 1]

WANG Hao, XIAO Huiling, WANG Liya, et al

Bearing fault diagnosis based on improved transfer strategy and dilated convolutional neural network

[J]. Industrial Engineering and Management, 2022, 27 (1): 94- 101

[本文引用: 1]

WU K, LI J, ZUO L, et al

Weighted adversarial domain adaptation for machine remaining useful life prediction

[J]. IEEE Transactions on Instrumentation and Measurement, 2022, 71: 3526511

[本文引用: 1]

蔡伟立, 胡小锋, 刘梦湘

基于迁移学习的刀具剩余寿命预测方法

[J]. 计算机集成制造系统, 2021, 27 (6): 1541- 1549

[本文引用: 1]

CAI Weili, HU Xiaofeng, LIU Mengxiang

Prediction method of tool remaining useful life based on transfer learning

[J]. Computer Integrated Manufacturing Systems, 2021, 27 (6): 1541- 1549

[本文引用: 1]

MCMAHAN B, MOORE E, RAMAGE D, et al. Communication-efficient learning of deep networks from decentralized data [C]// Proceedings of the 20th International Conference on Artificial Intelligence and Statistics. Fort Lauderdale: PMLR, 2017: 1273–1282.

[本文引用: 1]

ZHOU F, ZHANG Z, LI S

Research on federated learning method for fault diagnosis in multiple working conditions

[J]. Complex Engineering Systems, 2021, 1: 7

[本文引用: 1]

ZHANG Z, MING Y, WANG Y

A federated transfer learning approach for surface electromyographic hand gesture recognition with emphasis on privacy preservation

[J]. Engineering Applications of Artificial Intelligence, 2024, 136: 108952

DOI:10.1016/j.engappai.2024.108952      [本文引用: 1]

刘翀赫, 余官定, 刘胜利

基于无线D2D网络的分层联邦学习

[J]. 浙江大学学报: 工学版, 2023, 57 (5): 892- 899

[本文引用: 1]

LIU Chonghe, YU Guanding, LIU Shengli

Hierarchical federated learning based on wireless D2D networks

[J]. Journal of Zhejiang University: Engineering Science, 2023, 57 (5): 892- 899

[本文引用: 1]

WANG Q, WU B, ZHU P, et al. ECA-Net: efficient channel attention for deep convolutional neural networks [C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle: IEEE, 2020: 11531–11539.

[本文引用: 1]

VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need [C]// Proceedings of the International Conference on Neural Information Processing Systems. Long Beach: Curran Associates Inc, 2017: 6000–6010.

[本文引用: 1]

SILVA F M, ALMEIDA L B. Acceleration techniques for the backpropagation algorithm [C]// European Association for Signal Processing Workshop. Barcelona: EURASIP, 1990: 110–119.

[本文引用: 1]

SAXENA A, GOEBEL K, SIMON D, et al. Damage propagation modeling for aircraft engine run-to-failure simulation [C]// Proceedings of the International Conference on Prognostics and Health Management. Denver: IEEE, 2008: 1–9.

[本文引用: 1]

LI X, DING Q, SUN J Q

Remaining useful life estimation in prognostics using deep convolution neural networks

[J]. Reliability Engineering & System Safety, 2018, 172: 1- 11

[本文引用: 1]

韩冬阳, 林泽宇, 郑宇, 等

基于选择性深度神经网络集成的涡扇发动机剩余寿命预测

[J]. 浙江大学学报: 工学版, 2022, 56 (11): 2109- 2118

[本文引用: 1]

HAN Dongyang, LIN Zeyu, ZHENG Yu, et al

Remaining useful life estimation of turbofan engine based on selective ensemble of deep neural networks

[J]. Journal of Zhejiang University: Engineering Science, 2022, 56 (11): 2109- 2118

[本文引用: 1]

DE OLIVEIRA DA COSTA P R, AKÇAY A, ZHANG Y, et al

Remaining useful lifetime prediction via deep domain adaptation

[J]. Reliability Engineering & System Safety, 2020, 195: 106682

[本文引用: 5]

SUN B, FENG J, SAENKO K. Correlation alignment for unsupervised domain adaptation [M]// CSURKA G. Domain adaptation in computer vision applications. Cham: Springer, 2017: 153–171.

[本文引用: 5]

RAGAB M, CHEN Z, WU M, et al

Contrastive adversarial domain adaptation for machine remaining useful life prediction

[J]. IEEE Transactions on Industrial Informatics, 2021, 17 (8): 5239- 5249

DOI:10.1109/TII.2020.3032690      [本文引用: 5]

DONG X, ZHANG C, LIU H, et al

A multi-constrained domain adaptation network for remaining useful life prediction of bearings

[J]. Mechanical Systems and Signal Processing, 2024, 206: 110900

DOI:10.1016/j.ymssp.2023.110900      [本文引用: 5]

/