基于改进稀疏滤波与深度网络融合的轴承故障诊断
Bearing fault diagnosis based on improved sparse filter and deep network fusion
收稿日期: 2020-01-9
Received: 2020-01-9
作者简介 About authors
乔美英(1976—),女,副教授,从事振动信号处理、故障诊断研究.orcid.org/0000-0001-9281-341X.E-mail:
针对滚动轴承故障时特征提取依赖人工经验,以及故障类别难以自动准确识别的问题,提出了一种改进稀疏滤波和深层空洞门卷积网络相结合的故障诊断模型. 采用滑动窗对具有时序特征的轴承振动信号进行采样处理以避免过拟合;通过改进目标函数的稀疏滤波消除数据中的异方差并提取数据特征,达到缩短计算时间和提高分类准确率的效果;利用空洞门卷积和双向LSTM网络对噪声进行滤除,同时进行故障分类识别. 对比凯斯西储大学和动力系统装置的轴承实验数据,显示该模型故障诊断准确率可达98%. 不同负载和不同信噪比的轴承振动信号实验,表明该模型具有泛化性和抗噪性.
关键词:
An improved model combining sparse filtering and deep dilated gate convolutional network was proposed in order to solve the problem that feature extraction relies on manual experience when rolling bearing faults occur, and that the fault category was difficult to automatically and accurately identify. Sliding window was used to sample bearing vibration signals with time series characteristics in order to avoid over fitting. Heteroscedasticity was eliminated and data features were extracted by improving the sparse filtering of the objective function in order to shorten the calculation time and improve the accuracy of classification. The fault classification model was established by combining the dilated gate convolution and the bidirectional LSTM network, and the data noise can be filtered out. Data experiments from Case Western Reserve University and laboratory power equipment were compared. Results show that the fault diagnosis accuracy rate of this model can reach 98%. Different load and different SNR experiments with bearing vibration signals show that the model has generalization and anti-noise performance.
Keywords:
本文引用格式
乔美英, 汤夏夏, 闫书豪, 史建柯.
QIAO Mei-ying, TANG Xia-xia, YAN Shu-hao, SHI Jian-ke.
滚动轴承在工业领域中有广泛的应用,轴承的稳定运行可以提高企业的工作效率[1],一旦轴承发生故障就会带来巨大的经济损失,严重时还会威胁到人身安全.
在故障诊断分类识别方面,深度学习将特征提取和故障诊断结合在一起. 周奇才等[7]提出基于改进堆叠式循环神经网络的轴承故障诊断模型,通过门控单元解决梯度消失的问题;Zilong等[8]提出由空洞卷积、门卷积和残差网络组合的网络模型,空洞卷积增大了局部感受野,增加了卷积核的接收域;田源[9]提出基于迭代空洞卷积网络的命名实体模型,提高了网络训练精度;Yaguo等[10]利用2层稀疏滤波网络提取特征,结合softmax进行分类,效果显著. 轴承信号是典型的时间序列数据,而长短时记忆网络(long short-term memory,LSTM)处理时间序列数据有独特的优势. 于洋等[11]提出LSTM与迁移学习(transfer learning,TL)相结合的故障识别方法,可以有效地对多类故障识别. 这些方法的不足之处在于,深度学习的网络模型较复杂,在网络训练过程中会消耗大量的时间.
针对深度学习存在的问题,本文提出改进目标函数的稀疏滤波(improved sparse filter,ISP)和空洞门卷积神经网络(dilated gate long short-term memory network,DGLSTM)相结合的方法,构造用于轴承振动信号故障诊断的稀疏空洞门卷积(ISP-DGLSTM)网络. 该方法通过改进目标函数的稀疏滤波提取故障特征,减少计算时间;利用空洞门卷积网络的特性,对轴承信号的噪声进行滤除,实现故障分类.
1. 改进稀疏滤波的特征学习
1.1. 稀疏滤波
给定样本矩阵
式中:每一行代表一个特征,每一列代表一个样本,F的每个元素
其中:W为权值矩阵,
再归一化每一列[14]
这样,所有的特征便落在二范数的单位球上[15].
采用L1范数惩罚优化归一化后的矩阵元素,并将优化后的所有样本相加组成目标函数. 对于有
1.2. 改进稀疏滤波
图 1
消除异方差,常采用的是加权最小二乘法[22]. 对数变换也能消除异方差. 根据这一特点,对稀疏滤波的目标函数进行改进:
依据式(6)求函数L对W的偏导:
令
则
当W和X的初值给定时,依据式(6)~(9),通过L-BFGS算法[23]求出稀疏滤波的权值矩阵W. 其中,L-BFGS是拟牛顿法的改进算法,基本思想是:只保存并利用最近m次迭代的曲率信息来构造Hessian矩阵的近似矩阵. 具体计算公式如下:
式(10)中,Hessian矩阵的逆矩阵
式中:
每次迭代的初始值
图 2
图 3
2. 网络结构与算法流程
将经过稀疏滤波后的数据传入DGLSTM网络进行训练,如图4所示. DGLSTM网络是由4个空洞门卷积层、2个双向LSTM层和2个全连接层组成. 数据在通过空洞卷积层后,长度缩减,同时通过设置空洞卷积的空洞因子增大感受野,这是网络结构开始变化的重要的部分. LSTM处理时间序列数据具有独特的优势,本文采用双向LSTM网络不仅能处理好数据之间的关系,也可以防止梯度消失. 输出层为2个全连接层,最后一层采用softmax作为激活函数使输出值保持为0~1.0. 输出层中每个神经元的值表示输入样本属于故障类别的概率.
图 4
空洞卷积与普通卷积有相似的特征,传统的CNN网络一般先进行卷积再进行池化操作,以满足降低维度和增大感受野的需求,空洞卷积采用特定步长跳跃的方式读取数据,如图5所示. 空洞卷积在不丢失信息的情况下设置空洞率增大感受野,让每个卷积输出都包含更多的信息. 相应的,空洞卷积的感受野有2种计算方式:正常空洞卷积和padding空洞卷积. padding空洞卷积的具体计算方法:感受野尺寸
图 5
当特征数据通过空洞卷积的操作后,网络可以接收更长的样本来获取更多的信息. 但是,轴承的工作环境复杂,往往含有大量的噪声,如果不对噪声进行处理,将无法在数据中提取更多的有用信息. 门卷积能有效地控制输入信息,滤除噪声,同时采用残差网络与门卷积结合的方法防止出现梯度消失的现象.
图 6
3. 实验及结果分析
3.1. 数据描述
3.1.1. 凯斯西储大学轴承数据
凯斯西储大学(Case Western Reserve University,CWRU)轴承数据常被用作轴承故障诊断的判别,CWRU实验台[31]是由2HP电机、编码器、测功器组成,实验轴承为SKF6205型电机轴承. 如图7所示,实验数据采集来自安装在电机驱动端和风扇端的加速度传感器,根据电动机转速不同分为0 HP、1 HP、2 HP、3 HP负载数据,采样频率为12 kHz,本文实验选择驱动端数据,如表1所示. 表中,D为直径,LD为负载. 在实际实验时,轴承失效有3种可能的位置,分别为内环、外环和滚动单元. 为了验证本研究所提方法的可靠性,在驱动端的每个位置收集了3个故障的数据,分别为7、14和21 mm,每个故障类型采集400个样本,每1 200个信号组成一组样本. 试验数据包含10种信号,分别为正常信号和故障信号.
图 7
表 1 CWRU轴承故障数据集
Tab.1
数据集 | 信号等级 | D/mm | LD/HP | |||
1 | 2 | 3 | 4 | |||
1 | 正常 | 0 | 0 | 1 | 2 | 3 |
2 | 轻微内圈故障 | 7 | 0 | 1 | 2 | 3 |
3 | 中等内圈故障 | 14 | 0 | 1 | 2 | 3 |
4 | 严重内圈故障 | 21 | 0 | 1 | 2 | 3 |
5 | 轻微外圈故障 | 7 | 0 | 1 | 2 | 3 |
6 | 中等外圈故障 | 14 | 0 | 1 | 2 | 3 |
7 | 严重外圈故障 | 21 | 0 | 1 | 2 | 3 |
8 | 轻微滚动故障 | 7 | 0 | 1 | 2 | 3 |
9 | 中等滚动故障 | 14 | 0 | 1 | 2 | 3 |
10 | 严重滚动故障 | 21 | 0 | 1 | 2 | 3 |
3.1.2. 传动系诊断模拟器数据
图 8
3.2. 实验验证
3.2.1. CWRU和DDS数据训练
轴承振动信号是典型的时间序列数据,采用滑动窗口的方式在时间序列上进行重采样,以防止出现过拟合现象;由于轴承数据采集过程中存在大量噪声,采用改进稀疏滤波对特征进行提取,滤除数据中存在的异方差;将提取的特征输入空洞门卷积网络进行分类,并通过不同数据的实验对比验证所提方法的性能. 所提的网络模型在2层双向LSTM网络(DBLSTM)[33]的基础上建立.
采用CWRU轴承数据进行对比实验,4种网络模型分类精度和运行时间的对比结果见表2,这4种网络模型分别是:双向LSTM网络(DBLSTM)、稀疏双向LSTM网络(ISP-DBLSTM)、空洞门卷积网络(DGLSTM)和稀疏空洞门卷积网络(ISP-DGLSTM). 表中,ACC为精度,t为运行时间. 在此次实验中,所有测试的算法采用Python语言编写;在Windows10系统,英特尔酷睿i7-7700处理器和16 GB内存的计算机上运行.
表 2 4种网络模型结果对比
Tab.2
模型 | ACC | t/s |
DBLSTM | 0.928 | 45.21 |
ISP-DBLSTM | 0.987 | 45.02 |
DGLSTM | 0.971 | 43.96 |
ISP-DGLSTM | 0.998 | 41.92 |
为了使结果具有可比性,4个模型的设置采用相同的超参数:信号长度l=1 200;小批量b=100;学习率η=0.006;为了防止过拟合,在各层之间设置丢弃率RD=0.6;数据按照7∶3的比例划分为训练集和测试集,并对数据进行标准化处理.
图 9
表 3 ISP-DGLSTM网络模型各层参数设置
Tab.3
网络层 | 输出参数 | 卷积核 | 滤波器数量 | rD |
输入 | 1 200×1 | − | − | − |
Covn1 | 3×16 | 3×1 | 16 | 1 |
Covn2 | 3×16 | 3×1 | 16 | 2 |
Covn3 | 3×16 | 3×1 | 16 | 2 |
Covn4 | 3×16 | 3×1 | 16 | 4 |
DBLSTM1 | 100×1 | 50 | − | − |
DBLSTM2 | 100×1 | 50 | − | − |
Dense1 | 200 | − | − | − |
Dense2 | 10 | − | − | − |
图 10
图 10 CWRU数据的4种模型精度对比曲线图
Fig.10 Four kinds of models accuracy compared by curve under CWRU data
从表3可以看出,ISP-DGLSTM的空洞卷积增大了卷积核的接收域,网络可以接收更多的信息;在含有噪声的数据中,门卷积对噪声进行有效的滤除,为网络训练奠定基础. 在模型中只需要调整输入参数和空洞率的大小,所需调整的参数少,为训练模型节省了大量的计算时间.
图 11
图 12
图 12 动力传动系统数据的4种模型精度对比曲线图
Fig.12 Four kinds of models accuracy compared by curve under driveline data
3.2.2. 不同负载和不同信噪比的性能验证
图 13
图 13 CWRU数据下4种模型精度图
Fig.13 Four kinds of model accuracy figure under CWRU data
如图14所示为动力传动系统数据中不同速度下训练精度折线图,其中DDS-A和DDS-B是恒速状态下的数据,电机转速分别为1 120 r/min和1 350 r/min. DDS-AB是变速状态下的数据,由A和B组随机一半的数据组成. 可以看出,当数据集的噪声和速度发生变化时,DBLSTM和ISP-DBLSTM的ACC大幅度下降,数据特征未能完整提取出来;含有门卷积的DGLSTM和ISP-DGLSTM网络可以滤除噪声,ACC大于0.9.
图 14
图 14 动力传动系统数据的4种模型精度图
Fig.14 Four kinds of model accuracy figure under driveline data
为了验证模型的抗噪性能,在CWRU原始数据中加入不同信噪比的高斯白噪声,加入的信噪比越小,信号中所含的噪声越大. 如图15所示分别为加入信噪比为1和信噪比为−4的信号图. 可以看出,信号的幅值范围随信噪比的变小而增大.
图 15
图 15 加入信噪比的CWRU数据信号图
Fig.15 Add signal diagram with signal-to-noise ratio to CWRU data
图 16
图 16 凯斯西储大学数据中加入信噪比为1的精度对比曲线图
Fig.16 Accuracy comparison curve with signal-to-noise ratio of 1 added to Case Western Reserve University data
图 17
图 17 凯斯西储大学数据中加入信噪比为−4的精度对比曲线图
Fig.17 Accuracy comparison curve with signal-to-noise ratio of −4 added to Case Western Reserve University data
4. 结 语
针对轴承故障特征难以提取的问题,本研究提出改进稀疏滤波和深层空洞门卷积的网络模型ISP-DGLSTM. 通过改进的稀疏滤波对特征进行自适应提取,有效消除异方差问题. 引入空洞卷积来替代池化操作,减少数据的丢失. 为了降低数据中的噪声,在网络结构中采用门卷积操作. 通过不同模型和不同数据集的对比实验,所提ISP-DGLSTM结构具有良好的泛化性和抗噪性.
与其他模型相比,该模型的结构具有较高的精度和抗噪声性能. 在语音识别,机器视觉等领域中,所提方法的性能需要进一步验证.
参考文献
基于平移不变CNN的机械故障诊断研究
[J].
Machinery fault diagnosis based on shift invariant CNN
[J].
Short-frequency Fourier transform for fault diagnosis of induction machines working in transient regime
[J].DOI:10.1109/TIM.2016.2647458 [本文引用: 1]
用于滚动轴承转频估计的EMD软阈值降噪算法
[J].
EMD soft-thresholding denoising algorithm for rolling element bearing rotational frequency estimation
[J].
Bearing fault detection utilizing group delay and the Hilbert-Huang transform
[J].DOI:10.1007/s12206-017-0208-z [本文引用: 1]
基于形态小波和S变换的滚动轴承故障特征提取
[J].
Rolling bearing fault feature extraction based on morphological wavelet and S-transform
[J].
基于改进堆叠式循环神经网络的轴承故障诊断
[J].
Bearing fault diagnosis based on improved stacked recurrent neural network
[J].
A deep learning method for bearing fault diagnosis through stacked residual dilated convolutions
[J].DOI:10.3390/app9091823 [本文引用: 1]
An intelligent fault diagnosis method using unsupervised feature learning towards mechanical big data
[J].DOI:10.1109/TIE.2016.2519325 [本文引用: 1]
基于TL-LSTM的轴承故障声发射信号识别研究
[J].
Research on acoustic emission signal recognition of bearing fault based on TL-LSTM
[J].
基于稀疏滤波的信号识别
[J].
signal recognition based on sparse filtering
[J].
基于深度稀疏滤波的目标跟踪
[J].DOI:10.3969/j.issn.1003-9775.2017.03.008 [本文引用: 1]
Target tracking based on deep sparse filtering
[J].DOI:10.3969/j.issn.1003-9775.2017.03.008 [本文引用: 1]
Well-posedness of the permutation problem in sparse filter estimation with ℓp minimization
[J].DOI:10.1016/j.acha.2012.11.001 [本文引用: 1]
基于稀疏滤波和神经网络的人脸识别算法
[J].
The facial recognition algorithm based on sparse filtering-neural networks
[J].
Weighted composite quantile regression estimation and variable selection for varying coefficient models with heteroscedasticity
[J].DOI:10.1016/j.jkss.2014.05.005 [本文引用: 1]
Robust generalized empirical likelihood for heavy tailed autoregressions with conditionally heteroscedastic errors
[J].DOI:10.1016/j.jmva.2014.12.008 [本文引用: 1]
靶场光学测量数据异方差性检验及修正
[J].DOI:10.3969/j.issn.1673-3819.2008.04.031 [本文引用: 1]
Test and adjust heteroscedasticity of optical measure data in proof range
[J].DOI:10.3969/j.issn.1673-3819.2008.04.031 [本文引用: 1]
A heteroskedasticity robust Breusch-Pagan test for contemporaneous correlation in dynamic panel data models
[J].DOI:10.1016/j.jeconom.2016.12.005 [本文引用: 1]
基于最小二乘支持向量机的滚动轴承故障诊断
[J].
Bearing fault diagnosis using wavelet packet transform and least square support vector machines
[J].
Parameter estimation of a Gaussian mixture model for wind power forecast error by Riemann L-BFGS optimization
[J].
遥测数据时间序列滑动窗口动态分割技术
[J].
A dynamic slide windows segmentation technology for telemetry time series
[J].
Improving Spanish speech synthesis intelligibility under noisy environments
[J].
Fully convolutional networks for semantic segmentation
[J].
Feature-based decipherment for machine translation
[J].
基于双向LSTM的手写文字识别技术研究
[J].
Handwriting Chinese text recognition using BiLSTM network
[J].
Bearing fault automatic classification based on deep learning
[J].
基于VMD和马氏距离SVM的滚动轴承故障诊断
[J].
Fault diagnosis method of rolling bearings based on VMD and mahalanobis distance SVM
[J].
/
〈 |
|
〉 |
