浙江大学学报(工学版), 2024, 58(6): 1285-1295 doi: 10.3785/j.issn.1008-973X.2024.06.018

机械工程

基于空洞卷积和增强型多尺度特征自适应融合的滚动轴承故障诊断

韩康,, 战洪飞,, 余军合, 王瑞

宁波大学 机械工程与力学学院,浙江 宁波 315211

Rolling bearing fault diagnosis based on dilated convolution and enhanced multi-scale feature adaptive fusion

HAN Kang,, ZHAN Hongfei,, YU Junhe, WANG Rui

Faculty of Mechanical Engineering and Mechanics, Ningbo University, Ningbo 315211, China

通讯作者: 战洪飞,男,教授. orcid.org/0000-0003-1905-583X. E-mail: zhanhongfei@nbu.edu.cn

收稿日期: 2023-06-10  

基金资助: 国家自然科学基金资助项目(71671097); 国家重点研发计划资助项目(2019YFB1707101, 2019YFB1707103); 浙江省省属高校基本科研业务费资助项目(SJLZ2023001); 浙江省公益技术应用研究计划资助项目(LGG20E050010).

Received: 2023-06-10  

Fund supported: 国家自然科学基金资助项目(71671097);国家重点研发计划资助项目(2019YFB1707101,2019YFB1707103);浙江省省属高校基本科研业务费资助项目(SJLZ2023001);浙江省公益技术应用研究计划资助项目(LGG20E050010).

作者简介 About authors

韩康(1997—),男,硕士生,从事数据挖掘研究.orcid.org/0009-0009-0174-0856.E-mail:846253284@qq.com , E-mail:846253284@qq.com

摘要

传统卷积神经网络(CNN)在识别故障类型时存在从原始振动信号中提取特征不足以及提取特征过程中需要更大的感受野以充分捕获信号的时间相关性的局限. 针对轴承振动信号固有的多尺度特征,提出基于空洞卷积和增强型多尺度自适应特征融合的模型(DC-MAFFM). 利用空洞卷积的大感受野提取信号特征,同时引入残差连接来减少卷积层上的信息损失,从而有效过滤信号中的噪声;设计改进的多尺度特征提取模块,在不同尺度上捕获互补的诊断特征,同时在各层都进行不同尺度特征融合,充分学习信号的高频和低频特征;利用提出的特征自适应融合模块对不同尺度的特征自适应赋予权重,增强判别特征学习的能力. 在2个轴承数据集上进行验证,结果表明所提模型在噪声和变工况下有较强的诊断能力. 在强噪声情况下,故障诊断准确率分别达到88.08%和75.56%,与其他方法相比有显著优势.

关键词: 故障诊断 ; 空洞卷积 ; 残差连接 ; 多尺度特征提取 ; 自适应融合

Abstract

The traditional convolutional neural network (CNN) has the limitations of insufficiently extracting features from the original vibration signals and requiring a larger sensory field to fully capture the temporal correlation of the signals in the process of extracting the features when recognizing the fault types. A dilated convolution and enhanced multi-scale adaptive feature fusion model (DC-MAFFM) was proposed considering the inherent multi-scale characteristics of bearing vibration signals. The signal features were extracted using the large receptive field of the dilated convolution, and the residual connection was introduced to reduce the information loss on the convolution layer, so as to effectively filter the noise in the signal. An improved multi-scale feature extraction module was designed to capture complementary diagnostic features at different scales, meanwhile, the different-scale feature fusion was performed at each layer to fully learn the high-frequency and low-frequency features of the signal. The proposed feature adaptive fusion module was used to adaptively assign weights to the features at different scales to enhance the ability of discriminative feature learning. Verification was carried out on two bearing datasets, and results showed that the proposed model had strong diagnostic ability under noise and variable working conditions. In the case of strong noise, the fault diagnosis accuracy reached 88.08% and 75.56%, respectively, which demonstrated that the DC-MAFFM had a significant advantage over other methods.

Keywords: fault diagnosis ; dilated convolution ; residual connection ; multi-scale feature extraction ; adaptive fusion

PDF (3215KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

韩康, 战洪飞, 余军合, 王瑞. 基于空洞卷积和增强型多尺度特征自适应融合的滚动轴承故障诊断. 浙江大学学报(工学版)[J], 2024, 58(6): 1285-1295 doi:10.3785/j.issn.1008-973X.2024.06.018

HAN Kang, ZHAN Hongfei, YU Junhe, WANG Rui. Rolling bearing fault diagnosis based on dilated convolution and enhanced multi-scale feature adaptive fusion. Journal of Zhejiang University(Engineering Science)[J], 2024, 58(6): 1285-1295 doi:10.3785/j.issn.1008-973X.2024.06.018

滚动轴承作为风电机组、大型机床和各种电动机等设备的关键部件,由于长期工作容易出现点蚀、磨损、剥落、擦伤、胶合等故障,如果发生故障会产生周期性脉冲冲击,对设备的安全性产生直接影响. 因此,稳定准确地检测到故障的存在至关重要. 由于复杂恶劣的工作环境,滚动轴承微小的故障尺寸难以直接观察,滚动轴承运行产生的振动信号与故障的类型、程度、位置密切相关,包含丰富的轴承状态信息. 因此,基于振动信号的诊断成为最有效的方法.

由于卷积神经网络(convolutional neural network, CNN)有强大的特征提取能力,在图像处理领域更有天然的优势,因此将振动信号编码为二维图像输入CNN进行故障诊断是近几年的研究热点. Pham等[1]提出基于GAN的方法进行数据增强,将增强后数据转换为二维频谱图表示,用于各种工况下的轴承故障诊断;肖雄等[2]提出基于二维灰度图数据增强和CNN的故障诊断方法,将数据增强后的灰度图输入CNN进行故障诊断. 上述学者都是将一维振动信号转换为二维图像,然后使用CNN进行故障诊断,虽然这种方法可以减少噪声的干扰,但相邻原始时间序列之间的关联关系被破坏,导致对振动信号特征之间的相位信息利用不足. 此外,在转换过程中选择不合适的参数和复杂的数学计算可能产生额外的误差. 一维CNN可以直接进行振动信号处理和分析,李世晓等[3]将信号输入到设计的一维卷积神经网络模型中,通过多层数据变换得到有效的特征表示,实现机电作动器端到端的故障诊断;Wu等[4]开发了一维卷积神经网络,直接从振动信号中提取特征用于行星齿轮箱故障诊断. 虽然使用一维CNN取得了不错的效果,但忽略了测得的滚动轴承振动信号通常是非线性的. 此外,轴承可能存在多种故障类型和故障严重程度,这些故障引起的特征频率变化较大,导致了故障特征在不同尺度上的分布. 多尺度特征提取[5]的核心思想是从不同的时间尺度上学习原始信号中互补的长短期特征,从而提高诊断性能. InceptionNets[6]使用多个具有不同核大小的分支,用于从振动信号中提取多尺度特征;Ravikumar等[7]提出多尺度深度残差学习和堆叠长短期记忆模型,其在轴承和齿轮箱上的故障分类准确率较好. 上述学者们利用多尺度信息来提高模型的泛化能力. 为了保证网络能够更多地关注于对当前任务更重要的特征,许多学者致力于开发深度网络的注意力机制. Xiao等[8]利用压缩和激励(squeeze-and-excitation, SE)注意力机制来根据不同尺度特征对模型整体性能的贡献赋予不同的重要性;Liang等[9]提出多尺度动态自适应卷积和残差连接构建的残差块,并使用多个这样的残差块构建网络. 上述方法仅校正了通道维度上的特征,而空间维度间的相关性也对分类性能有较大影响.

综上,针对普通CNN或循环神经网络(recurrent neural network, RNN)难以捕捉滚动轴承信号长时序列特征的问题,引入空洞卷积作为特征的初步提取阶段,加入池化层能有效过滤原始信号中的噪声,同时引入与常用残差连接不同的连接方式,提升模型的稳定性. 由于滚动轴承的多尺度特性,提出改进的多尺度特征提取模块,在提取互补特征后,不同层之间再进行特征融合,增加了特征的丰富性. 多尺度技术虽然可以获得不同尺度的特征信息,但也提取了一些噪声信息,因此提出自适应特征融合模块,不同于现有研究仅关注不同通道特征之间的关系,该模块可以分别从通道和空间特征中学习自适应权重,能在提取重要特征的同时抑制对重要特征过度赋予大的权重,并且过滤掉不重要信息. 针对滚动轴承的特性进行模型各模块的搭建,在2个轴承数据集上进行验证,分析所提模型的泛化性和稳定性.

1. 基于DC-MAFFM的滚动轴承故障诊断模型构建

变工况和高噪声下测得的滚动轴承振动信号具有显著的内部可变性,这为利用CNN简单提取单一故障特征的类别可分性带来了进一步挑战. 本研究认为须在多个时间尺度上对信号进行更全面、更广泛的理解. 此外,发生在轴承部件的故障会引入低频脉冲部分和解调成分,这些故障特征容易被那些固有的主导振幅的高频成分或那些强背景噪声所掩盖. 为了更好地提取故障特征并捕捉原始振动信号的多尺度特征,构建基于空洞卷积和增强型多尺度特征自适应融合的模型(dilated convolution and enhanced multi-scale adaptive feature fusion model, DC-MAFFM). 为了更好地提取故障特征并捕捉原始振动信号的多尺度特征,构建了DC-MAFFM模型,将改进的多尺度特征学习融入传统的CNN架构;同时引入自适应特征融合模块,自适应地选择重要特征. 所提出模型整体架构如图1所示. 该架构可以分为3个阶段:特征初步提取和噪声过滤阶段、改进多尺度特征提取和融合阶段、分类阶段.

图 1

图 1   基于空洞卷积和增强型多尺度特征自适应融合的模型

Fig.1   Model based on dilated convolution and enhanced multi-scale feature adaptive fusion


2. 基于DC-MAFFM的滚动轴承故障诊断方法

2.1. 空洞卷积模块

Borovykh等[10]提出基于空洞卷积的条件性时间序列预测方法. 与普通的CNN和RNN相比,空洞卷积支持感受野的指数级扩展,而不降低特征图的分辨率或增加参数的数量. 对于轴承振动信号,一些特征表现出长相关性,包括轴承固有工作信号、故障冲击激励、系统周期信号等. 不同的故障模式表现出不同的长程依赖性,增强与长程依赖相关的特征学习能力是提高轴承诊断效率的关键,一个有效的方法是采用空洞卷积来接受具有大量冗余信息的较长样本.

如果简单地将空洞卷积叠加多次,将会出现网格效应[11]. 因此在网络的第i层,如图2所示,为了保证较大的感受野同时减少模型的复杂度,设计了3个连续空洞卷积块的膨胀率$ d = {2^i}\left( i = 0,\right. \left.1,2 \right) $.

图 2

图 2   空洞卷积模块

Fig.2   Dilated convolution module


每个块由2个空洞卷积组成,以相同的膨胀率进行特征提取,所提出的空洞卷积块结构如图3所示. 在空洞卷积块后加入池化层可以降低原始信号中的噪声对特征的影响,为模型后阶段的特征提取与融合提供强有力的保障.

图 3

图 3   空洞卷积块(i=0, 1, 2)

Fig.3   Dilated convolution block (i=0, 1, 2)


由于感受野依赖于网络深度、膨胀率和卷积核大小,深度更大的空洞卷积块的稳定性非常重要. 残差连接提供了简单方法来进行更深层次的神经网络训练. 对每个空洞卷积块都采用残差连接,而不是对整个过程进行残差连接,残差连接的细节如图4所示.

图 4

图 4   残差连接示意图

Fig.4   Schematic diagram of residual connection


该方法的好处是在提取振动信号足够多特征的同时,减少原始振动信号信息的流失,该步骤提取的特征可以为下一步特征融合阶段做好准备;另一方面,添加多个残差连接能够增强模型实际噪声和变工况情景下的稳定性. 随着神经网络层数的增加,精度也会提高. 并且,根据输入层的残差函数简化神经网络层的重构,避免产生梯度消失问题[12].

2.2. 多尺度自适应特征融合模块

2.2.1. 改进的多尺度特征提取模块

当滚动轴承发生局部故障时,滚动体与局部故障接触会产生冲击信号,使得被测信号包含一系列准周期性指数衰减结构的脉冲信号. 由于实际工厂环境下载荷变化剧烈,其脉冲信号有较高的复杂性和耦合性. 因此,振动信号具有多尺度特性,在多个时间尺度上包含复杂的特征信息. 本研究提出改进的多尺度特征提取网络(improved multi-scale feature extraction network, IMFEN),使用多个具有不同卷积核的卷积层同时学习不同时间尺度上的信号特征,能够从振动信号中挖掘更深层、更丰富的多尺度特征. 所提出的改进多尺度特征提取模块如图5所示,它由3条平行路径和3层组成.

图 5

图 5   改进多尺度特征提取模块

Fig.5   Improved multi-scale feature extraction module


${{\boldsymbol{h}}_{s}^l} = f\left( {{\boldsymbol{w}}_s^l{\boldsymbol{x}}_s^l} \right)$表示第s层第l个路径的卷积层输出,其中,s=1,2,3,l=1,2,3,l=1表示1×m核大小的上路径,l=2表示1×n核大小的中路径,l=3表示1×k核大小的下路径,${\boldsymbol{x}}_s^l$为滚动轴承时序信号输入,$f$为激活函数,${\boldsymbol{w}}_s^l$为对应的权重矩阵. 该层各路径的融合表达式如下:

$ {\boldsymbol{H}}_s^l = \sum\nolimits_{i = 1}^l {{\boldsymbol{h}}_s^i} ;\;l = 1,2,3,\;\;s = 1,2,3. $

与现有的多尺度故障诊断方法相比,本研究在经过不同卷积核提取的多尺度特征后在每一层都融合上述特征. 由于大尺度卷积核能够获取更多的特征表示,能够使更大尺度特征在整个过程中反复指导跨路径的更小尺度特征提取(如图5中蓝色双点划线、绿色点划线、黄色虚线所示),进而从振动信号中挖掘更深层、更丰富的多个时间尺度的互补特征,增强对故障特征学习的鲁棒性,增强模型在实际情景下的泛化性和稳定性.

IMFEN的深度可以决定提取的特征的抽象程度,虽然从第1阶段中提取的低级特征过滤掉了部分噪声,但提取的低级特征还是会受到速度、负载变化和噪声的较大影响,故障特征的抽象程度对分类结果影响较大. 该模块堆叠3层网络的原因是低层可以提取振动信号中的单个峰值、峭度、脉冲指标等基本特征,高层可以获得序列信息抽象和稳定的特征如信号序列的长期趋势、周期性模式,中间层可以同时提取低层和高层之间的特征;同时,为了减少计算成本,在深度特征提取过程中选择了3层.

2.2.2. 自适应特征融合模块

改进多尺度特征提取模块通过在多个尺度上对输入信号进行特征提取,显著增强了整体特征的丰富性. 然而,各尺度对模型整体性能的贡献也须进一步考虑. 常用的多尺度特征融合方法特征按元素相加或特征拼接,这意味着每个待融合特征同等重要,从而忽略了多尺度特征的复杂特性. 因此,在3条并行路径的末端引入自适应特征融合模块(adaptive feature fusion module,AFFM),自适应地区分特征的重要性. AFFM由通道注意力模块(channel attention module, CAM)和空间注意力模块(spatial attention module,SAM)组成. 它可以对输入U的通道特征和时序特征赋予不同的权重. 因此输入特征U可由CAM和SAM从不同角度依次自适应优化.

1)通道注意力模块. 首先采用如图6所示的CAM提取通道间信息,CAM由1个全局平均池化(GAP)层、2个全连接层(FC1和FC2)、1个ReLU激活函数、1个Sigmoid激活函数和1个BN层组成. CAM并不改变输入特征图的形状,而只是将其每个通道的矩阵与一个缩放参数相乘,将输入U映射到输出$\tilde {\boldsymbol{U}}$. 采用一维振动信号作为输入,因此特征图的高度总是等于1. 假设输入特征图$ {{\boldsymbol{U}}}=\left[{{{\boldsymbol{u}}}}_{1},\;{{{\boldsymbol{u}}}}_{2},\;{{{\boldsymbol{u}}}}_{3},\;\cdots ,\;{{{\boldsymbol{u}}}}_{{C}}\right]\in {{{\bf{R}}}}^{{C}\times 1\times {W}} $,其中,CW分别表示U的通道数和宽度,${{\boldsymbol{u}}_C} \in {{\bf{R}}^{1 \times W}}$表示U的第C个通道. 当通道注意力机制被激活时,GAP层首先将U中的全局空间信息压缩为一个通道信息$ {\boldsymbol{Z}} = \left[ {{z_1},\;{z_2},\;{z_3},\;\cdots ,\;{z_C}} \right] \in {{\bf{R}}^C} $. Z为一维向量,可以由如下公式得到:

图 6

图 6   自适应特征融合模块

Fig.6   Adaptive feature fusion module


$ {z_C} = \frac{1}{W}\sum\nolimits_{i = 1}^W {{{u}_C}} \left( i \right). $

式中:${{{u}}_C}\left( i \right)$$ {{\boldsymbol{u}}_C} $的第i个元素. 为了利用Z中聚合信息来捕捉U中通道之间的依赖关系,利用FC1层、FC2层和ReLu激活函数对Z进行非线性变换得到$ {\boldsymbol{P}} = \left[ {{p_1},\;{p_2},\;{p_3}, \;\cdots ,\;{p_C}} \right] \in {{\bf{R}}^C} $,具体实现如下:

$ {\boldsymbol{P}} = {{\boldsymbol{W}}_2}\delta \left( {{{\boldsymbol{W}}_1}{\boldsymbol{Z}}} \right). $

式中:δ表示ReLU激活函数; W1W2分别表示FC1和FC2的权重矩阵,${{\boldsymbol{W}}_1} \in {{\bf{R}}^{\tfrac{C}{r} \times C}}$$ {\boldsymbol{W}}_2 \in {{\bf{R}}^{C \times \tfrac{C}{r}}} $r为缩减率. 文献[13]讨论了r的选择,比较结果表明,随着r的增大,性能并没有明显提高. 因此,为了平衡性能和复杂度,将r设置为2以进行降维,然后P经过Sigmoid函数处理将缩放参数向量${\boldsymbol{Q}} = \left[ {{q_1},\;{q_2},\;{q_3},\; \cdots,\; {q_C}} \right] \in {{\bf{R}}^C}$的元素取值限制在(0,1.0),以上过程可由如下公式得到:

$ {q_C} = \frac{1}{{1+{{\mathrm{exp}}\;\left({ - p_C}\right)}}}. $

最后,加入BN层以加快模型的收敛速度,输出特征图$\tilde {\boldsymbol{U}} = \left[ {{{\tilde {\boldsymbol{U}}}_1},\;{{\tilde {\boldsymbol{U}}}_2},\;{{\tilde {\boldsymbol{U}}}_3},\; \cdots ,\;{{\tilde {\boldsymbol{U}}}_C}} \right] \in {{\bf{R}}^{C \times 1 \times W}}$可由如下公式得到:

$ {\tilde {\boldsymbol{U}}_C} = {{{q}}_C} \times {{\boldsymbol{u}}_C}. $

缩放系数${{{q}}_C}$是通道级权重. 因此,通道注意力机制为不同尺度的特征分配通道级权重,特别是为噪声相关特征所在的通道自适应分配较低的权重,从而抑制其对组合特征整体性能的负面影响.

2)空间注意力模块. 当滚动轴承发生局部故障时,故障点对接触的滚动轴承的其他部位产生脉冲激励,并激励整个系统产生具有共振频率的高频衰减振动. 因此,振动信号中的故障激励信号段集中反映了故障的内在属性. 本研究提出如图6所示的SAM,卷积层中的激活图反映了不同时间信号片段的相对重要性,SAM通过卷积层将所有跨通道的激活图的特征信息汇总起来,以定位与故障相关的时间信号段. 假设输入特征$\tilde {\boldsymbol{U}}$表示为$\tilde {\boldsymbol{U}} = \left[ {{{\tilde {\boldsymbol{U}}}_1},\;{{\tilde {\boldsymbol{U}}}_2},\;{{\tilde {\boldsymbol{U}}}_3},\; \cdots ,\;{{\tilde {\boldsymbol{U}}}_C}} \right] \in {{\bf{R}}^{C \times 1 \times W}}$,其中${\tilde {\boldsymbol{U}}_C} \in {{\bf{R}}^{1 \times W}}$对应第C个时间信号位置. 首先,SAM通过一个1×1的单通道卷积层得到特征$\tilde {\boldsymbol{U}}$在时间信号上的投影,即${\boldsymbol{Y}} = F\left( {\tilde {\boldsymbol{U}}} \right)$. 然后,通过Sigmoid函数得到时间权重向量,即${\boldsymbol{Y}}' = \sigma \left( {\boldsymbol{Y}} \right),{\boldsymbol{Y}} \in {{\bf{R}}^{1 \times W}}$. $F\left( \cdot \right)$聚合了输入$\tilde {\boldsymbol{U}} $中所有激活图的跨通道特征,因此${\boldsymbol{Y}}^\prime _j$表示第j个时间序列点的重要性. 在重新校准$\tilde {\boldsymbol{U}}$之前,SAM使用空洞卷积${f_{\mathrm{d}}}\left( \cdot \right)$对局部时间信号段之间的特征信息进行编码,其感受野较大,能够提高效率和防止过度关注激励脉冲信号段. 最后,使用时间权重向量${\boldsymbol{Y}}'$将特征$\tilde {\boldsymbol{U}}$重新校准为S,实现过程如下:

$ {\boldsymbol{S}} = \left[ {{{\boldsymbol{s}}_1},\;{{\boldsymbol{s}}_2},\;{{\boldsymbol{s}}_3},\;\cdots,\;{{\boldsymbol{s}}_n}} \right] = {f_{\mathrm{d}}}\left( {\tilde {\boldsymbol{U}}} \right) \cdot {\boldsymbol{Y}}'. $

2.3. 分类阶段模块

为了能充分学习数据中的特征信息,须对振动信号进行多次特征提取和池化压缩,利用2个全连接层对特征进行逐级降维,以防止参数下降过快导致特征信息丢失的问题,同时在最后一层全连接层前插入Dropout层,能够在每次迭代过程中随机使部分神经节点在其网络结构中暂时性失活,以此降低全连接层的复杂度,防止过拟合现象发生.

3. 实例验证

3.1. 实验参数设置

所提方法在深度学习框架Pytorch 1.13.0、python 3.9上实现. 所有模型都是在NVIDIA GeForce RTX 4090 GPU和RAM 128 GB的服务器上进行训练和测试的. 对所有数据样本进行归一化,使模型的训练变得稳定. 在训练过程中,采用Adam优化算法,其具有计算效率快、内存需求小的优点. Adam还可以加快网络模型的收敛速度. 实验1、2的批量大小分别设置为32和64,学习率均设置为0.001.

DC-MAFFM的详细参数如表1所示. 表中,W为卷积核的大小,S为卷积或池化的滑动步长,C为通道数,mnk分别表示大、中、小卷积核的通道数,abc分别表示大、中、小卷积核的大小,v为空洞卷积核的大小,d为空洞卷积膨胀率,隐藏节点为全连接层的节点数.

表 1   DC-MAFFM模型各模块参数

Tab.1  Parameters of each module of DC-MAFFM model

结构参数
空洞卷积模块W=9,C=16
池化层S=2,C=16
多尺度特征提取模块m=11,n=7,k=3,a=32,b=16,c=8
自适应特征融合模块v=5,d=2
FC1输入节点数=8192,输出节点数=1024
FC2输入节点数=1024,输出节点数=10

新窗口打开| 下载CSV


3.2. 对比模型

为了验证所提DC-MAFFM模型的故障诊断能力,选取7种先进的故障诊断模型进行对比,模型包括MSCNN-LSTM[14]、 WDCNN[15]、 MSCNN[16]、Resnet[17]、DRSN-CS[18]、MA1DCNN[19]和空洞卷积( dilated convolution,DC).

3.3. 实例验证1

验证采用凯撒西储轴承数据[20],如图7所示,该数据集实验装置包括感应电动机、扭矩传感器、测试轴承、加速度计和负载电机. 该部分选取的研究对象为驱动端轴承(轴承类型为SKF6205)的振动信号,首先通过在电动机风扇端和驱动端的轴承座上方各放置一个加速度传感器来测得故障轴承的振动加速度信号,然后通过高带宽放大器和一个装有低通滤波器的每通道采样频率为12 kHz的数据记录仪采集,采集到的信号为二通道的一维时序信号. 电机在4种模式下工作:正常、外圈故障、内圈故障和滚动体故障. 损坏的轴承通过电火花加工在正常轴承上制造包含3种不同缺陷直径(0.0178、0.0356、0.0533 cm)的单点损伤. 从4种不同的电机负载(0、745.7、1491.4、2237.1 W)中收集数据,因此,在每种负载条件下,有9种故障状态和1个正常状态. 将振动信号每1024个数据点不重叠切出一个样本,具体数据描述如表2所示. 表中,D表示故障直径,NtrainNtest分别表示训练集样本数和验证集样本数.

图 7

图 7   轴承试验台及其示意图

Fig.7   Bearing test bench and schematic diagram


表 2   12 k驱动端轴承数据集

Tab.2  12 k drive end bearing datasets

故障类别D/cmNtrainNtest
正常0333142
外圈故障10.0178333142
外圈故障20.0356333142
外圈故障30.0533333142
内圈故障40.0178333142
内圈故障50.0356333142
内圈故障60.0533333142
滚动体故障70.0178333142
滚动体故障80.0356333142
滚动体故障90.0533333142

新窗口打开| 下载CSV


采集到的部分原始振动信号如图8(a)~(d)所示. 图中,N表示采样点数,a为振动加速度. 在大范围转速波动和变载荷情况下,振动信号幅值变化剧烈,振动信号在正常情况下没有出现明显的脉冲分量. 然而,在滚动体故障、内圈故障、外圈故障等损坏条件下,振动信号具有明显的故障冲击,但不能清晰地观察到脉冲间隔. 虽然不同健康状态下的振动信号之间存在一定的差异,但较难直接对不同的故障严重程度进行分类. 因此,采用基于深度学习的端到端故障诊断具有重大意义.

图 8

图 8   原始振动信号曲线

Fig.8   Original vibration signal curve


3.3.1. 各模型抗噪声的鲁棒性分析

在滚动轴承的实际工作环境中,各部件之间的振动和摩擦产生的噪声是不可避免的. 噪声会破坏振动数据,降低故障诊断的准确率. 为了模拟实际工业中的噪声环境,在原始振动信号中加入高斯白噪声,构造不同信噪比的噪声信号. 信噪比(SNR)定义如下:

$ {\rm{SNR}} = 10 \times {\mathrm{lg}}\;\frac{{{{{P}}_{{\rm{sig}}}}}}{{{{{P}}_{{\rm{noi}}}}}}. $

式中:${{{P}}_{{\rm{sig}}}}$为信号功率,${{{P}}_{{\rm{noi}}}}$为噪声功率. 信噪比越低,复合噪声信号越复杂.

实验数据选取表2中的训练样本和测试样本,添加信噪比为4、6、8、10、12 dB的高斯噪声,使原始信号的重要特征被淹没,从而构建5种复合噪声样本. 经过8次实验,8种模型的平均实验结果如表3所示. 表中,A为准确率. 显然,在每种噪声下,DC-MAFFM的准确率都比其他模型高. 首先,当SNR=12 dB时,所有模型识别的准确率均超过89%,说明所选模型的诊断性能都较先进. 继续添加噪声,分别在SNR=10、8 dB下测试各网络的识别准确率,DC-MAFFM的测试准确率分别为98.48%和96.39%,均高于其他网络,且标准差分别为0.65%和0.91%,突出了良好的网络稳定性. 最后在SNR=6、4 dB的噪声信号识别对比中,MSCNN-LSTM、WDCNN、MSCNN、DC、Resnet、DRSN-CS、MA1DCNN的准确率分别下降了15.49%、16.60%、9.44%、17.62%、11.69%、7.37%和15.15%,然而,DC-MAFFM仅下降5.38%,准确率下降幅度低且明显高于其他模型. 此外,所述模型在强噪声SNR=4 dB情况下,其标准差仅有0.90%,比次稳定模型Resnet的标准差下降了1.02%. 仅当SNR=10时,其标准差比Resnet的高了0.10%,在另外噪声环境中都表现出了最好的稳定性. 可见,所提模型在噪声情景下具有优异的诊断性能.

表 3   12k驱动端轴承数据在不同噪声下8种模型的准确率

Tab.3  Accuracy rates of 8 models under different noises for 12k driving end bearing data

模 型A
SNR=4SNR=6SNR=8SNR=10SNR=12
MSCNN-LSTM[14]0.6646±0.01450.8195±0.01480.8892±0.03000.9236±0.03330.9706±0.0177
WDCNN[15]0.5968±0.01060.7578±0.03640.8665±0.01710.9499±0.00940.9701±0.0172
MSCNN[16]0.7605±0.03520.8549±0.04430.9195±0.02260.9493±0.02510.9774±0.0104
DC0.6346±0.02140.8108±0.01580.8900±0.01390.9410±0.01100.9754±0.0091
Resnet[17]0.7485±0.01110.8654±0.00960.9336±0.00510.9703±0.00640.9904±0.0017
DRSN-CS[18]0.7928±0.01510.8665±0.01930.9423±0.00190.9755±0.01070.9875±0.0059
MA1DCNN[19]0.8019±0.03740.8744±0.02290.9076±0.01400.9537±0.02320.9836±0.0122
DC-MAFFM0.8808±0.00090.9346±0.00730.9639±0.00910.9848±0.00650.9992±0.0010

新窗口打开| 下载CSV


3.3.2. 变工况下各模型的领域适应能力

将4种单一工况的加速度计数据合并为混合模式,可以认为电机是在变工况下工作,从而模拟滚动轴承在多种负载和速度下运行的真实情景. 从电机风扇端4种负载下(0、745.7、1491.4、2237.1 W)采集各健康状态的振动信号,采样频率为12 kHz,将不同负载下的相同状态视为一类. 将振动信号每1024个数据点不重叠切出一个样本. 风扇端轴承数据集的详细描述如表4所示. 表中,Nsam表示轴承数据样本数,L为负载.

表 4   12k风扇端轴承数据

Tab.4  12k fan end bearing datasets

故障类别D/cmNsam
L=0 WL=745.7 WL=1491.4 WL=2237.1 W
正常0118118118118
外圈故障10.0178118118118118
外圈故障20.0356118118118118
外圈故障30.0533118118118118
内圈故障40.0178118118118118
内圈故障50.0356118118118118
内圈故障60.0533118118118118
滚动体故障70.0178118118118118
滚动体故障80.0356118118118118
滚动体故障90.0533118118118118

新窗口打开| 下载CSV


实验(A1~A4)对4个故障诊断任务进行综合验证. 任务信息如表5所示. 表中,Ntrain1Ntest1分别表示训练集和测试集所用工况样本. 例如,任务A1表示使用3种负载下的样本进行模型训练,使用另一种负载下的样本进行测试. 其他任务遵循类似的模式. 每个任务包含3540个训练样本和1180个测试样本.

表 5   风扇端轴承在变工况下各任务信息

Tab.5  Task information of fan end bearing under variable working conditions

任务名称Ntrain1Ntest1
A10、1、23
A20、1、32
A30、2、31
A41、2、30

新窗口打开| 下载CSV


表6所示为4个任务下8个不同模型8次实验的平均对比结果. 可以看出,DC-MAFFM除了在A1任务中,相比于DRSN-CS准确率仅低0.5%,在其他任务中都取得了比其他网络更好的性能,且在A1、A2、A3任务的故障诊断准确率均在99%以上,在A3和A4任务中,取得了相比其他网络较大的提升,最大涨幅达到17.30%和23.35%. 这进一步验证了其优越的对抗工况变化的领域自适应能力.

表 6   变工况下8种模型的准确率

Tab.6  Accuracy of 8 models under variable working conditions

模 型A
A1A2A3A4
MSCNN-LSTM[14]0.74590.95920.91850.7799
WDCNN[15]0.81190.89880.86020.8242
MSCNN[16]0.89470.92800.95810.8508
DC0.87710.91500.85350.8062
Resnet[17]0.93380.98420.89700.9102
DRSN-CS[18]0.99820.99280.93180.9027
MA1DCNN[19]0.89530.91060.94590.7685
DC-MAFFM0.99770.99990.99830.9447

新窗口打开| 下载CSV


3.4. 实例验证2

采用江南大学离心风机系统[21]上测得的滚动轴承故障数据. 测试的轴承是单列调心滚子轴承(N205和NU205). 使用线切割机人为诱发轴承故障,轴承振动数据由加速度计测得,采样频率为50 kHz. 在3种不同转速(600、800、1000 r/min)下采集了轴承的4种状态包括正常、内圈故障、外圈故障和滚动体故障.

3.4.1. 各模型抗噪声的鲁棒性分析

选取的数据如表7所示,添加信噪比为4、6、8、10、12 dB的高斯噪声,经过8次实验,8种模型的平均准确率和标准差如表8所示. 每个样本包含1024个数据. 显然,在每种噪声下,DC-MAFFM的准确率都比其他模型高. 首先,在SNR=12时,有5种模型的准确率超过90%,体现出所选模型良好的抗噪声能力,同时DC-MAFFM比次优模型MA1DCNN的准确率高了1.79%,比第3好模型MSCNN-LSTM高了2.55%. 在SNR=10 dB时,DC-MAFFM的准确率比次优模型准确率的涨幅是每种噪声环境下相较于次优模型的最高,达到3.17%. 在强噪声SNR=4、6 dB下,DC-MAFFM的测试准确率分别为75.56%和80.40%,标准差分别为0.42%和0.63%,其准确率比次优模型DRSN-CS的准确率分别高1.19%和1.2%,标准差分别下降0.71%和0.75%,在各种模型中的稳定性最强. 因此所提模型在噪声情景下具有优异的诊断性能.

表 7   江南大学轴承数据集描述

Tab.7  Description of Jiangnan University bearing dataset

故障类型NtrainNtestNsam
正常09243961320
外圈故障1307132439
内圈故障2307132439
滚动体故障3307132439

新窗口打开| 下载CSV


表 8   江南大学数据在不同噪声下8种模型的准确率

Tab.8  Accuracy of 8 models on Jiangnan University data under different noise

模 型A
SNR=4SNR=6SNR=8SNR=10SNR=12
MSCNN-LSTM[14]0.6710±0.04020.7157±0.02080.7939±0.01980.8509±0.02160.9107±0.0080
WDCNN[15]0.6396±0.01610.6969±0.01490.7223±0.02290.7703±0.02760.8193±0.0197
MSCNN[16]0.6785±0.01020.6985±0.00990.7497±0.00740.8032±0.00780.8164±0.0143
DC0.6527±0.02120.7164±0.01150.7654±0.01510.8191±0.01820.8544±0.0126
Resnet[17]0.7106±0.01550.7552±0.01160.8231±0.00910.8559±0.00220.9072±0.0084
DRSN-CS[18]0.7437±0.01130.7920±0.01380.8476±0.01550.8760±0.02870.9096±0.0250
MA1DCNN[19]0.6783±0.04740.7597±0.03350.8238±0.01660.8723±0.02700.9172±0.0280
DC-MAFFM0.7556±0.00420.8040±0.00630.8555±0.00980.9077±0.00470.9351±0.0048

新窗口打开| 下载CSV


3.4.2. 变工况下各模型的领域适应能力

执行B1、B2、B3这3个任务进行综合验证. 任务信息如表9所示. 任务包含5860个训练样本和2930个测试样本. 在原始数据基础上加入SNR=10 dB的噪声后,再进行变工况实验,实验结果如表10所示.

表 9   江南大学数据在变工况下各任务信息

Tab.9  Task information for Jiangnan University data under varying working conditions

任务名称Ntrain1Ntest1
B1600、1000800
B2600、8001000
B3800、1000600

新窗口打开| 下载CSV


表 10   噪声和变工况下8种模型准确率

Tab.10  Accuracy of 8 models under noise and variable working conditions

模 型A
B1B2B3
MSCNN-LSTM[14]0.86720.81340.7568
WDCNN[15]0.79970.71080.7392
MSCNN[16]0.78420.69350.7317
DC0.83840.75530.7046
Resnet[17]0.86450.82870.7457
DRSN-CS[18]0.90060.84220.7483
MA1DCNN[19]0.86920.80520.7705
DC-MAFFM0.90480.84590.8071

新窗口打开| 下载CSV


显然,所提模型在所有任务中的准确率最高,在2个任务中与次优模型DRSN-CS准确率相比分别高了0.42%、0.37%,在B3任务中与次优模型MA1DCNN相比准确率提高了3.66%,因此B3明显体现出在噪声和变工况的情景下所选模型的强稳定性和泛化性.

3.5. 消融研究

使用表4数据对DC-MAFFM的关键组件进行消融研究,验证本研究设计的组件的重要性5个消融后的网络结构如下. M1:移除DC模块的MAFFM;M2:移除不同大小卷积核特征融合的DC-MAFFM;M3:移除AFFM的DC-MAFFM;M4:移除多尺度特征提取的DC-MAFFM;M5:移除SAM的DC-MAFFM. M6:原始模型DC-MAFFM.

8次实验下消融实验的平均结果如表11所示. 可以看出,当DC-MAFFM中的一些关键组件被移除时,DC-MAFFM的故障识别性能受到较大影响. 在这些实验中,影响最大的是将用于特征预处理和噪声过滤的DC模块移除,相较于原始模型,模型M1在A2和A4任务下的识别准确率分别下降了9.96%和12.41%,可见DC模块可以显著提高变工况下的网络性能,而且长程依赖信息对故障诊断极其重要. 当多尺度特征提取模块变成单尺度特征提取模块时,相对于M6,M4在A4任务下准确率下降了3.85%,表明多尺度特征提取可以从不同尺度的振动信号中学习更丰富的特征. 当把不同大小卷积核特征融合移除后,相对于M6,M2在A1和A4这2个任务中准确率分别下降了1.13%和3.11%,表明该模块可以较好地从振动信号中提取更多的鲁棒性特征. 此外,相对于M5,M6在A1、A2、A3任务上的识别准确率有小幅提升,在A4任务下提升达到1.46%,证明了增加SAM的合理性.

表 11   所提模型关键部分消融研究

Tab.11  Ablation study of key parts of proposed model

模 型A
A1A2A3A4
M10.97710.90030.99750.8206
M20.98630.99670.99790.9136
M30.99240.99860.99740.8986
M40.99720.99740.99680.9062
M50.99730.99890.99760.9301
M60.99760.99990.99830.9447

新窗口打开| 下载CSV


4. 结 论

针对实际工厂中存在的噪声和变工况问题,提出DC-MAFFM模型,利用2个轴承数据验证所提模型故障诊断能力的显著性和稳定性,为滚动轴承的故障诊断提供了启发并具备一定的工程应用价值. 研究结论如下:

(1) DC-MAFFM网络直接对原始一维振动信号进行处理,无需任何手工提取特征的过程,能够实现滚动轴承的端到端故障诊断.

(2) 空洞卷积模块和残差连接相结合,由于其大感受野和高稳定性的特点,在滚动轴承故障诊断中,表现出优越的特征提取能力.

(3) IMFEN模块对振动信号进行多尺度特征提取,在此基础上加入特征融合,能够提取信号更丰富的互补特征,充分提取关于该类故障的特征表示,消融研究也证明了该改进的有效性,在该改进下,IMFEN模块与传统多尺度特征提取相比,在A4任务下准确率提升了3.11%.

(4)网络可以通过CAM对通道间的相互依赖关系进行建模以自适应优化每层特征,然后通过SAM对时间信号片段的相对重要性进行编码以选择性地增强故障脉冲片段的学习,从而获得更具判别性的特征.

在未来的工作中,将进一步研究对真实损坏的数据,只需要实验数据就能进行智能故障诊断的跨域方法,进一步扩大该模型在工程领域的应用范围.

参考文献

PHAM M T, KIM J M, KIM C H

Rolling bearing fault diagnosis based on improved GAN and 2-D representation of acoustic emission signals

[J]. IEEE Access, 2022, 10: 78056- 78069

DOI:10.1109/ACCESS.2022.3193244      [本文引用: 1]

肖雄, 肖宇雄, 张勇军, 等

基于二维灰度图的数据增强方法在电机轴承故障诊断的应用研究

[J]. 中国电机工程学报, 2021, 41 (2): 738- 749

[本文引用: 1]

XIAO Xiong, XIAO Yuxiong, ZHANG Yongjun, et al

Research on the application of data enhancement method based on two-dimensional grayscale map in motor bearing fault diagnosis

[J]. Proceedings of the CSEE, 2021, 41 (2): 738- 749

[本文引用: 1]

李世晓, 杜锦华, 龙云

基于一维卷积神经网络的机电作动器故障诊断

[J]. 电工技术学报, 2022, 37 (Suppl.1): 62- 73

[本文引用: 1]

LI Shixiao, DU Jinhua, LONG Yun

Fault diagnosis of electromechanical actuators based on one-dimensional convolutional neural network

[J]. Transactions of China Electrotechnical Society, 2022, 37 (Suppl.1): 62- 73

[本文引用: 1]

WU C, JIANG P, DING C, et al

Intelligent fault diagnosis of rotating machinery based on one-dimensional convolutional neural network

[J]. Computers in Industry, 2019, 108: 53- 61

DOI:10.1016/j.compind.2018.12.001      [本文引用: 1]

YE Z, YU J

AKSNet: a novel convolutional neural network with adaptive kernel width and sparse regularization for machinery fault diagnosis

[J]. Journal of Manufacturing Systems, 2021, 59: 467- 480

DOI:10.1016/j.jmsy.2021.03.022      [本文引用: 1]

SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition . Boston: IEEE, 2015: 1−9.

[本文引用: 1]

RAVIKUMAR K N, YADAV A, KUMAR H, et al

Gearbox fault diagnosis based on multi-scale deep residual learning and stacked LSTM model

[J]. Measurement, 2021, 186: 110099

DOI:10.1016/j.measurement.2021.110099      [本文引用: 1]

XIAO Y, SHAO H, MIN Z, et al

Multiscale dilated convolutional subdomain adaptation network with attention for unsupervised fault diagnosis of rotating machinery cross operating conditions

[J]. Measurement, 2022, 204: 112146

DOI:10.1016/j.measurement.2022.112146      [本文引用: 1]

LIANG H, CAO J, ZHAO X

Multi-scale dynamic adaptive residual network for fault diagnosis

[J]. Measurement, 2022, 188: 110397

DOI:10.1016/j.measurement.2021.110397      [本文引用: 1]

BOROVYKH A, BOHTE S, OOSTERLEE C W. Conditional time series forecasting with convolutional neural networks [EB/OL]. (2018-09-17). [2023-01-02]. https://arxiv.org/abs/1703.04691.

[本文引用: 1]

WANG P, CHEN P, YUAN Y, et al. Understanding convolution for semantic segmentation [C]// 2018 IEEE Winter Conference on Applications of Computer Vision . Lake Tahoe: IEEE, 2018: 1451-1460.

[本文引用: 1]

HE K, ZHANG X, REN S, et al. Identity mappings in deep residual networks [C]// Computer Vision-ECCV . Amsterdam: Springer, 2016: 630−645.

[本文引用: 1]

HU J, SHEN L, SUN G. Squeeze-and-excitation networks [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition . Salt Lake City: IEEE, 2018: 7132−7141.

[本文引用: 1]

CHEN X, ZHANG B, GAO D

Bearing fault diagnosis base on multi-scale CNN and LSTM model

[J]. Journal of Intelligent Manufacturing, 2021, 32: 971- 987

DOI:10.1007/s10845-020-01600-2      [本文引用: 5]

ZHANG W, PENG G, LI C, et al

A new deep learning model for fault diagnosis with good anti-noise and domain adaptation ability on raw vibration signals

[J]. Sensors, 2017, 17 (2): 425

DOI:10.3390/s17020425      [本文引用: 5]

JIANG G, HE H, YAN J, et al

Multiscale convolutional neural networks for fault diagnosis of wind turbine gearbox

[J]. IEEE Transactions on Industrial Electronics, 2018, 66 (4): 3196- 3207

[本文引用: 5]

HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition . Las Vegas: IEEE, 2016: 770−778.

[本文引用: 5]

ZHAO M, ZHONG S, FU X, et al

Deep residual shrinkage networks for fault diagnosis

[J]. IEEE Transactions on Industrial Informatics, 2019, 16 (7): 4681- 4690

[本文引用: 5]

WANG H, LIU Z, PENG D, et al

Understanding and learning discriminant features based on multiattention 1DCNN for wheelset bearing fault diagnosis

[J]. IEEE Transactions on Industrial Informatics, 2019, 16 (9): 5735- 5745

[本文引用: 5]

SMITH W A, RANDALL R B

Rolling element bearing diagnostics using the Case Western Reserve University data: a benchmark study

[J]. Mechanical Systems and Signal Processing, 2015, 64: 100- 131

[本文引用: 1]

LI K, PING X, WANG H, et al

Sequential fuzzy diagnosis method for motor roller bearing in variable operating conditions based on vibration analysis

[J]. Sensors, 2013, 13 (6): 8013- 8041

DOI:10.3390/s130608013      [本文引用: 1]

/