基于连续小波卷积神经网络的轴承智能故障诊断方法
Bearing intelligent fault diagnosis method based on continuous wavelet convolutional neural network
通讯作者:
收稿日期: 2024-01-14
基金资助: |
|
Received: 2024-01-14
Fund supported: | 国家自然科学基金资助项目(62373035,62273025). |
作者简介 About authors
耿志强(1973—),男,教授,博导,从事智能建模与故障诊断研究.orcid.org/0000-0003-0647-3792.E-mail:
传统故障诊断方法存在特征提取有限和故障检测不准确的问题,为此提出新的轴承智能故障诊断方法. 构建连续小波卷积层取代卷积神经网络(CNN)中的初始卷积层,用于提取轴承数据的初级特征;使用增强ACON激活函数处理提取的振动信号;设计新的计算空间,提高CNN的整体自适应性. 在凯斯西储大学轴承数据集上开展滚动轴承故障诊断方法对比实验. 结果表明,与传统基于CNN、快速傅里叶变换-CNN、长短时记忆-CNN故障诊断方法相比,所提方法的故障诊断精度分别提高了7.45、4.46和1.53个百分点,CNN的收敛速度更快. 在不同工况的泛化任务中,所提方法的平均准确率为99.64%,准确性和泛化能力良好.
关键词:
A new bearing intelligent fault diagnosis method was proposed, aiming at the problems of limited feature extraction and inaccurate fault detection in traditional fault diagnosis methods. A continuous wavelet convolutional layer was constructed to replace the initial convolutional layer in the convolutional neural network (CNN) for extracting the primary features of the bearing data. The enhanced ACON activation function was used to process the extracted vibration signals. A new computational space was designed to improve the overall adaptivity of CNN. Comparative experiments of rolling bearing fault diagnosis methods based on the Case Western Reserve University bearing dataset were carried out. Experimental results showed that the fault diagnosis accuracy of the proposed method was improved by 7.45, 4.46 and 1.53 percentage points, respectively, and the convergence speed of CNN was faster compared with the traditional fault diagnosis methods based on CNN, the fast Fourier transform with CNN, the long short-term memory with CNN. In the generalization task for different working conditions, the proposed method had an average accuracy of 99.64%, demonstrating superior accuracy and generalisability.
Keywords:
本文引用格式
耿志强, 陈威, 马波, 韩永明.
GENG Zhiqiang, CHEN Wei, MA Bo, HAN Yongming.
故障诊断方法[4]主要分为传统信号处理、机器学习和深度学习. 传统信号处理常用的技术有小波变换[5]和傅立叶变换[6];机器学习的常用方法有支持向量机[7](support sector machine, SVM)和极限学习机[8](extreme learning machine, ELM);包括卷积神经网络[9](convolutional neural network, CNN)和长短期记忆[10]( long short-term memory, LSTM)在内的深度学习方法越来越受欢迎. 传统的信号处理方法计算简单、易于理解和实现,特定类型的故障诊断性能良好. 针对经验小波变换(empirical wavelet transform, EWT)在划分数据边界时的不准确性,Xu等[11]提出新颖的频谱分割方法. 为了解决EWT无法检测滚动轴承故障的问题,Huang等[12]提出频相空间EWT (frequency phase space EWT, FPSEWT). 为了解决轴承早期故障特征难提取和避免应用变异模态分解(variational mode decomposition, VMD)时出现的过度分解的问题,Li等[13]提出基于VMD-短期傅里叶变换(short time Fourier transform,FRFT)的滚动轴承诊断方法VMD-FRFT. Xu等[11-13]所提方法须进行人工选择和提取特征,处理复杂的故障模式时不够灵活,而且严重依赖工程师的经验和领域知识. Zhang等[14]提出基于贝叶斯的轴承故障诊断方法,旨在增强轴承数据独立性,提高故障诊断的准确性. Ye等[15]基于VMD、多尺度置换熵和基于粒子群优化的支持向量机,提出能够提高诊断准确率的轴承故障诊断方法. Ma等[16]提出的滚动轴承综合故障诊断方法优化了VMD和ELM,能够从轴承振动信号中更有效地提取特征信息. 机器学习方法在处理小数据样本时若遇过拟合问题,须进行人工设计和特征方向选择. 深度学习可以从原始数据中学习和提取更高层次的特征,而无需人工干预,能够比传统信号处理方法更好地处理复杂的数据模式和故障特征. CNN因良好的特征提取能力在滚动轴承故障诊断领域得到广泛应用. Xu等[17]提出的基于迁移CNN (transfer CNN, TCNN)框架的在线故障诊断方法,能够利用源领域学到的知识有效解决目标领域中的问题. Yang等[18]将由对抗神经网络创建的故障信号二维灰度图像与二维CNN结合,完成了小样本轴承的故障诊断. Wang等[19]建议使用对称点图案(symmetrized dot pattern, SDP)图解轴承状况,采用基于挤压和激励的CNN (squeeze-and-excitation-enabled CNN, SE-CNN)模型自动提取数据特征. Mao等[20]将原始振动信号转换为二维频率和平方包络谱,这些信号与红外热图像相结合后输入用于跨域变速箱诊断的网络.
在实际工业中,轴承的工作条件可能不同,而且振动信号经常包含噪声,导致网络处理信号能力下降,使得网络诊断效果欠佳. CNN与信号处理方法结合的特定轴承故障诊断方法常用却难以准确地提取轴承的故障特征. 为了提高CNN的泛化能力和特征提取能力,本研究提出基于连续小波CNN的轴承智能故障诊断方法CWCNN. 该方法基于传统的端到端诊断模型,将具有物理意义的小波卷积层作为CNN的首层,以增强模型的可解释性和通用性. 为了提高小波函数在振动数据中的定位精度,本研究改进原始小波函数提出新的时频定位函数. 在凯斯西储大学(CWRU)轴承数据集[21]上开展所提方法与传统故障诊断方法的对比分析实验,验证所提方法的有效性.
1. 相关理论和模型改进
1.1. 卷积神经网络模型
CNN的自适应特征提取能力强大,它的网络结构分为卷积层、激活层、池化层,特征提取过程具有权重共享和空间不变的特性. 经典的CNN模型主要有LeNet-5、AlexNet、GoogleNet、ResNet等. AlexNet因其出色的分类精度、并行计算和多层次特征提取能力成为较早应用于实践的深度神经网络. 本研究优化了用于训练轴承故障数据集的AlexNet,CNN的结构如图1所示. 以振动信号作为输入,由卷积层和池化层提取故障特征;使用 Softmax 分类器识别故障;交叉熵为损失函数,表达式为
图 1
式中:f(x)为样本 x 的真实分类结果,g(x)为样本 x 的输出分类结果. 通过反向传播来更新权重和偏差,使损失函数最小化,满足模型的设计要求.
1.2. ACON激活函数及改进
Ma等[22]提出ACON激活函数,用于确定是否激活神经元. ACON的原理:考虑具有n个值的标准最大值函数 max (x1, ···, xn),该函数近似为
式中:Sβ为近似最大值函数;xi 为输入;n 为数据集中的样本数;β 为切换因子: 当 β→0, Sβ→平均值时,近似函数为线性;当 β→∞, Sβ→最大时,近似函数为非线性. 设 η1(x) = p1x、η2(x) = p2x,式(2)转化为
当 p1=1、p2=0 时,激活函数是神经网络中常用的ReLU. 在本研究中,ACON激活函数由式(3)得出,定义输入为一维振动信号. 利用通道权重建立具有多个通道的一维自适应函数,计算式为
式中:βa为数据空间中的自适应函数,它根据输入数据选择激活函数;σ 为Sigmoid函数;c 、 w 为空间维度;X1=Rc×c/r, X2=Rc/r×c, r 为比例因子. 本研究构建适合振动信号的ACON激活函数替代ReLU,增强了所提方法的学习和泛化能力.
1.3. 小波核
Morlet小波是常用于信号处理和时频分析的小波函数,表达式为
式中:ω0为频率参数,用于控制小波在频域中的中心频率;t为时间. 为了改善小波核在振动数据中的定位精度,增加调节形状的参数,使得小波函数能够更好地适应不同频率的信号. 引入调节参数m来改进小波函数的时频局部化能力. 改进后的Morlet小波函数表达式为
其中m的数值大小对于Morlet小波函数的频率和时域分辨率有重要影响. 通常情况下,数值较小的m能够提高时域分辨率,但会降低频率分辨率;数值较大的m能够产生更好的频率分辨率,但时域分辨率会降低. CNN中的卷积运算与小波函数类似,可以表示为信号处理中2个向量的内积. 同样基于内积,连续小波变换的表达式为
式中:s为与频率成反比的尺度参数;u为平移参数,控制小波函数在时间轴上的移动;x(t)为输入信号;
1.4. 基于连续小波卷积神经网络的轴承智能故障诊断方法
现实中诊断方法须自适应应对不同类型的诊断任务,特征提取能力要求高. 为此,将CNN的第一层改为小波核,并用改进的ACON激活函数代替ReLU. 第一层卷积层在CNN中负责提取基本特征(如边缘、纹理的低级特征). 小波核在时频域上有比传统信号处理方法更好的局部化性质,更适合于对信号进行初步的特征提取和局部分析. 使用小波核替代全部的卷积层会增加计算复杂度和模型复杂度,将小波核仅用于第一层在一定程度上降低模型的复杂度和计算开销. 振动信号通常涉及非平稳特性,而小波变换在处理非平稳信号时具有优势,在初始阶段使用小波核可以更好地处理这些非平稳信号的初步表示. 因此,将Morlet小波核作为CNN的第一层卷积层能够更好地提取信号的初级特征. CWCNN可用于故障诊断的自适应提取和泛化,该方法训练振动信号的过程如图2所示. CWCNN在不同运行条件下的滚动轴承故障诊断步骤如下. 1)通过测试平台获取振动信号并进行分段;2)初始化模型参数,如学习率等;3)输入数据,小波核提取初始特征信息;4)计算损失参数,根据损失更新网络参数;5)重复训练达到迭代次数.
图 2
图 2 连续小波卷积神经网络训练振动信号的过程
Fig.2 Continuous wavelet convolutional neural network training process for vibrating signals
2. 实验验证
2.1. 实验平台及参数介绍
实验环境为Python 3.8,采用Tensorflow 2.3.0深度学习框架搭建模型. CWCNN的详细参数如表1所示,其中NK为核数目. CWCNN加入了批量归一化层以提高网络训练的稳定性. 在训练过程中,使用Adam梯度下降算法对参数进行自适应优化,学习率设定为0.001. 丢失率设定为0.5,在训练过程中随机剔除一半参数,以避免网络过度拟合. 设置批量大小为32,迭代轮次epoch为50,损失函数采用交叉熵损失函数. 对比实验中的其他故障诊断方法如CNN、快速傅里叶变换-CNN[23](fast Fourier transform with CNN,FFT-CNN), 长短时记忆-CNN[24](long short-term memory with CNN,LSTM-CNN)的超参数设置和CWCNN的基本一致. 结果表明,当设置m= 0.5 时,可以获得最佳的模型定位性能.
表 1 连续小波卷积神经网络的结构参数
Tab.1
网络层 | 核大小 | NK | 输出大小 |
输入层 | — | — | 1× |
连续小波 | — | — | 16×128 |
最大池化 | 64×1×2 | 32 | 16×64 |
卷积层 | 64×1×3 | 32 | 32×64 |
最大池化 | 64×1×2 | 32 | 32×32 |
卷积层 | 64×1×3 | 64 | 64×32 |
最大池化 | 1×2 | 64 | 64×16 |
全连接 | 100 | — | 1×100 |
输出层 | 10 | — | 10 |
2.2. 数据集说明
使用CWRU公开的实验数据集作为训练和测试实验数据,轴承测试台如图3所示. 该数据集通常用于诊断轴承故障和比较不同算法的性能. 选取信号的频率为12 kHz、负载为
图 3
2.3. 数据预处理
在CWRU轴承数据集中,以12 kHz的采样频率计算,每种故障情况有120 000个采样点,采样选取120个样本,正常状态的样本有300个. 正常与故障样本的数量差距明显,会对网络识别准确性产生负面影响,数据集中的样本量不足以满足网络训练和验证的要求容易在训练过程中出现过拟合. 数据增强可以有效地缓解模型的过拟合程度,增加模型对新数据样本的适应度. 为了解决数据量不平衡的问题,采用随机抽取的数据增强方法进行样本抽样;使用宽度为1 024的窗口按一定步长平移,每次平移都会对窗口中的所有数据点进行采样. 每个信号段都会与后一个信号段重叠以便有效利用原始信号中的信息并改进数据集. 实验中训练集和测试集的比例为4∶1,确保划分的合理性. 如表2 所示为CWRU轴承数据集,其中SF为故障长度,ntr为训练样本数,nte为测试样本数. 工况A、B、C的负载分别为
表 2 凯斯西储大学轴承数据集
Tab.2
故障位置 | 标签 | SF/mm | A工况 | B工况 | C工况 | |||||
ntr | nte | ntr | nte | ntr | nte | |||||
正常 | 0 | — | 400 | 100 | 400 | 100 | 400 | 100 | ||
外圈 | 1 | 0.18 | 400 | 100 | 400 | 100 | 400 | 100 | ||
2 | 0.36 | 400 | 100 | 400 | 100 | 400 | 100 | |||
3 | 0.53 | 400 | 100 | 400 | 100 | 400 | 100 | |||
内圈 | 4 | 0.18 | 400 | 100 | 400 | 100 | 400 | 100 | ||
5 | 0.36 | 400 | 100 | 400 | 100 | 400 | 100 | |||
6 | 0.53 | 400 | 100 | 400 | 100 | 400 | 100 | |||
7 | 0.18 | 400 | 100 | 400 | 100 | 400 | 100 | |||
8 | 0.36 | 400 | 100 | 400 | 100 | 400 | 100 | |||
滚动 | 9 | 0.53 | 400 | 100 | 400 | 100 | 400 | 100 |
2.4. 模型诊断性能实验
图 4
图 4 添加小波核后的轴承故障诊断实验结果
Fig.4 Experimental results of bearing fault diagnosis after adding wavelet kernel
图 5
图 5 未添加小波核的轴承故障诊断实验结果
Fig.5 Experimental results of bearing fault diagnosis without adding wavelet kernel
小波核不仅提高模型的诊断精度,还大大缩短了训练模型的时间,收敛速度大大提升. 为了证实CWCNN在故障诊断方面的功效,对比不同方法的轴承故障诊断结果,如表3所示,其中tc为平均计算时间,采用随机抽样技术处理数据集,最终的准确度是10次训练的平均值,以平衡方法的影响. CWCNN的故障诊断准确率为 99.87%,与传统CNN相比提高了7.45个百分点,与FFT-CNN相比提高了4.46个百分点,与LSTM-CNN相比提高了1.53个百分点. 与其他模型相比,平均评估持续时间明显缩短.
表 3 不同方法的轴承故障诊断结果对比
Tab.3
方法 | Acc/% | tc/ms |
CNN | 92.42 | 17.36 |
FFT-CNN | 95.41 | 11.56 |
LSTM-CNN | 98.34 | 14.32 |
CWCNN | 99.87 | 8.63 |
测试集的混淆矩阵如图6所示. 可以看出,10种类型的故障,每种100个样本,只有1个样本分类出现错误. 具体来说,1个外圈中度缺陷样本(标签 1)被误分类为滚动体中度缺陷(标签 8). 该结果表明,CWCNN在检测不同故障方面的分类准确性良好.
图 6
图 6 测试集轴承故障分类结果的混淆矩阵
Fig.6 Confusion matrix for test set bearing fault classification results
2.5. 变工况下模型的泛化性分析
在现实工业世界中,为了应对不同的工作条件,轴承载荷不可避免地会发生变化. 在多变的工作条件下,模型良好的诊断性能对确保安全运行至关重要. 从CWRU轴承数据集中选取3组不同负载、采样频率一致的数据,验证CWCNN在不同条件下的有效性和泛化能力. CWCNN在滚动轴承故障诊断领域的有效性通过变工况准确率测试验证. 对宽卷积-CNN (wide convolution kernels with CNN,WKCNN)[25]、GhostCNN[26]、多分支深度可分离-CNN[27] (multi branch depth seperable with CNN,MBDS-CNN)、ILeNet-5[28]及CWCNN在变工况下进行实验,各实验分别取10次结果的平均值,以减小误差,结果如表4所示,其中a-b表示将数据集a作为模型的训练集,数据集b作为模型诊断结果使用的测试集,其余同理. CWCNN在变工况下的平均准确度为99.64%,均高于其他对比方法,与WKCNN相比提高0.87个百分点,比GhostCNN提高2.39个百分点,比MBDS-CNN提高0.93个百分点,比ILeNet-5提高1.32个百分点. 结果表明,在不同的工况之下,CWCNN具有非常优异的分类精度以及泛化性能.
表 4 不同方法在变工况下的诊断准确率
Tab.4
方法 | Acc/% | |||||
a-b | a-c | b-a | b-c | c-a | c-b | |
CWCNN | 99.82 | 99.65 | 99.70 | 99.53 | 99.55 | 99.58 |
WKCNN | 99.32 | 98.15 | 99.42 | 97.71 | 99.14 | 98.85 |
GhostCNN | 97.16 | 96.89 | 97.18 | 97.89 | 97.14 | 97.26 |
MBDS-CNN | 99.14 | 97.42 | 99.14 | 98.42 | 98.85 | 99.28 |
ILeNet-5 | 98.56 | 96.86 | 98.95 | 98.29 | 98.85 | 98.43 |
3. 结 语
本研究提出基于连续小波CNN的轴承智能故障诊断方法,通过将ACON激活函数替代ReLU的方式增强方法的适应性. 实验结果表明,所提方法在轴承智能诊断准确性和稳定性方面比传统故障诊断方法更具优势. 采用小波核卷积可以解决传统神经网络参数数量多、收敛速度慢、计算复杂等问题;改进后的小波函数提高了振动数据分析模型的精度和时频分辨率,使模型能够更好地捕捉振动信号的瞬态特征. 所提方法具有比其他CNN方法更强的自适应特征提取能力,在使用相同轴承数据集的情况下,所提方法的准确率为99.87%,高于传统CNN、FFT-CNN以及LSTM-CNN. 相较于传统CNN、FFT-CNN以及LSTM-CNN,所提方法的平均评估持续时间明显缩短. 加入构造的ACON激活函数增强网络的泛化能力,在变工况的泛化任务中表现优良,所提方法的平均准确度为99.64%,高于WKCNN、GhostCNN、MBDS-CNN 、ILeNet-5. 后续研究将考虑使用不同频率或不同类别的振动信号进行跨域故障诊断实验,实现不同领域的轴承故障诊断.
参考文献
Rolling element bearing diagnostics: a tutorial
[J].DOI:10.1016/j.ymssp.2010.07.017 [本文引用: 1]
深度学习在机械设备故障预测与健康管理中的研究综述
[J].DOI:10.3969/j.issn.1001-3881.2021.19.033 [本文引用: 1]
Review on the research of deep learning in mechanical equipment fault prognostics and health management
[J].DOI:10.3969/j.issn.1001-3881.2021.19.033 [本文引用: 1]
A study of big data-based machine learning techniques for wheel and bearing fault diagnosis
[J].
Applications of machine learning to machine fault diagnosis: a review and roadmap
[J].DOI:10.1016/j.ymssp.2019.106587 [本文引用: 1]
基于小波变换和优化CNN的风电齿轮箱故障诊断
[J].
Fault diagnosis of wind power gearbox based on wavelet transform and improved CNN
[J].
Short-frequency Fourier transform for fault diagnosis of induction machines working in transient regime
[J].DOI:10.1109/TIM.2016.2647458 [本文引用: 1]
Recent advances on SVM based fault diagnosis and process monitoring in complicated industrial processes
[J].DOI:10.1016/j.neucom.2015.09.081 [本文引用: 1]
Fast and accurate classification of time series data using extended ELM: application in fault diagnosis of air handling units
[J].
基于一维卷积神经网络的钻杆故障诊断
[J].
Drill pipe fault diagnosis method based on one-dimensional convolutional neural network
[J].
Sequential fault diagnosis based on LSTM neural network
[J].DOI:10.1109/ACCESS.2018.2794765 [本文引用: 1]
A novel rolling bearing fault diagnosis method based on empirical wavelet transform and spectral trend
[J].
Frequency phase space empirical wavelet transform for rolling bearings fault diagnosis
[J].DOI:10.1109/ACCESS.2019.2922248 [本文引用: 1]
Fault diagnosis for rolling bearing based on VMD-FRFT
[J].DOI:10.1016/j.measurement.2020.107554 [本文引用: 2]
Naive bayes bearing fault diagnosis based on enhanced independence of data
[J].DOI:10.3390/s18020463 [本文引用: 1]
Rolling bearing fault diagnosis based on VMD-MPE and PSO-SVM
[J].DOI:10.3390/e23060762 [本文引用: 1]
Composite fault diagnosis of rolling bearing based on chaotic honey badger algorithm optimizing VMD and ELM
[J].DOI:10.3390/machines10060469 [本文引用: 1]
Online fault diagnosis method based on transfer convolutional neural networks
[J].
Conditional GAN and 2-D CNN for bearing fault diagnosis with small samples
[J].
A new intelligent bearing fault diagnosis method using SDP representation and SE-CNN
[J].
Fusion domain-adaptation CNN driven by images and vibration signals for fault diagnosis of gearbox cross-working conditions
[J].DOI:10.3390/e24010119 [本文引用: 1]
Bearing fault detection and diagnosis using Case Western Reserve University dataset with deep learning approaches: a review
[J].
基于FFT和CNN的滚动轴承故障诊断方法
[J].DOI:10.11991/yykj.202101004 [本文引用: 1]
A fault diagnosis method of rolling bearing based on FFT and CNN
[J].DOI:10.11991/yykj.202101004 [本文引用: 1]
基于WKCNN的风电机组轴承声信号故障诊断研究
[J].
Fault diagnosis of wind turbine bearing acoustic signal based on WKCNN
[J].
基于多分支深度可分离卷积神经网络的滚动轴承故障诊断研究
[J].
Fault diagnosis of rolling bearings based on a multi branch depth separable convolutional neural network
[J].
/
〈 |
|
〉 |
