浙江大学学报(工学版), 2020, 54(12): 2301-2309 doi: 10.3785/j.issn.1008-973X.2020.12.004

机械工程、能源工程

基于改进稀疏滤波与深度网络融合的轴承故障诊断

乔美英,, 汤夏夏,, 闫书豪, 史建柯

Bearing fault diagnosis based on improved sparse filter and deep network fusion

QIAO Mei-ying,, TANG Xia-xia,, YAN Shu-hao, SHI Jian-ke

收稿日期: 2020-01-9  

Received: 2020-01-9  

作者简介 About authors

乔美英(1976—),女,副教授,从事振动信号处理、故障诊断研究.orcid.org/0000-0001-9281-341X.E-mail:qiaomy@hpu.edu.cn , E-mail:qiaomy@hpu.edu.cn

摘要

针对滚动轴承故障时特征提取依赖人工经验,以及故障类别难以自动准确识别的问题,提出了一种改进稀疏滤波和深层空洞门卷积网络相结合的故障诊断模型. 采用滑动窗对具有时序特征的轴承振动信号进行采样处理以避免过拟合;通过改进目标函数的稀疏滤波消除数据中的异方差并提取数据特征,达到缩短计算时间和提高分类准确率的效果;利用空洞门卷积和双向LSTM网络对噪声进行滤除,同时进行故障分类识别. 对比凯斯西储大学和动力系统装置的轴承实验数据,显示该模型故障诊断准确率可达98%. 不同负载和不同信噪比的轴承振动信号实验,表明该模型具有泛化性和抗噪性.

关键词: 特征提取 ; 稀疏滤波 ; 空洞门卷积 ; 双向LSTM ; 故障分类 ; 抗噪性

Abstract

An improved model combining sparse filtering and deep dilated gate convolutional network was proposed in order to solve the problem that feature extraction relies on manual experience when rolling bearing faults occur, and that the fault category was difficult to automatically and accurately identify. Sliding window was used to sample bearing vibration signals with time series characteristics in order to avoid over fitting. Heteroscedasticity was eliminated and data features were extracted by improving the sparse filtering of the objective function in order to shorten the calculation time and improve the accuracy of classification. The fault classification model was established by combining the dilated gate convolution and the bidirectional LSTM network, and the data noise can be filtered out. Data experiments from Case Western Reserve University and laboratory power equipment were compared. Results show that the fault diagnosis accuracy rate of this model can reach 98%. Different load and different SNR experiments with bearing vibration signals show that the model has generalization and anti-noise performance.

Keywords: feature extraction ; sparse filter ; dilated gate convolution ; bidirectional LSTM ; fault classification ; anti-noise performance

PDF (2061KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

乔美英, 汤夏夏, 闫书豪, 史建柯. 基于改进稀疏滤波与深度网络融合的轴承故障诊断. 浙江大学学报(工学版)[J], 2020, 54(12): 2301-2309 doi:10.3785/j.issn.1008-973X.2020.12.004

QIAO Mei-ying, TANG Xia-xia, YAN Shu-hao, SHI Jian-ke. Bearing fault diagnosis based on improved sparse filter and deep network fusion. Journal of Zhejiang University(Engineering Science)[J], 2020, 54(12): 2301-2309 doi:10.3785/j.issn.1008-973X.2020.12.004

滚动轴承在工业领域中有广泛的应用,轴承的稳定运行可以提高企业的工作效率[1],一旦轴承发生故障就会带来巨大的经济损失,严重时还会威胁到人身安全.

在轴承故障诊断领域,传统的方法先对特征进行提取,然后通过各种分类器进行分类识别[2]. Burrie等[3]提出基于短时傅里叶变换(short-time Fourier transform,STFT)的电机暂态故障诊断方法;程卫东等[4]提出经验模态分解与小波软阈值相结合的降噪方法;Jin等[5]提出结合群时延希尔伯特的轴承故障诊断方法;杨先勇等[6]提出基于极大提升形态小波(max-lifting morphological wavelet,MLMW)分析和S变换的滚动轴承故障特征提取方法. 以上的方法,在特征处理的过程中都加入了人的主观因素,无法完全提取特征.

在故障诊断分类识别方面,深度学习将特征提取和故障诊断结合在一起. 周奇才等[7]提出基于改进堆叠式循环神经网络的轴承故障诊断模型,通过门控单元解决梯度消失的问题;Zilong等[8]提出由空洞卷积、门卷积和残差网络组合的网络模型,空洞卷积增大了局部感受野,增加了卷积核的接收域;田源[9]提出基于迭代空洞卷积网络的命名实体模型,提高了网络训练精度;Yaguo等[10]利用2层稀疏滤波网络提取特征,结合softmax进行分类,效果显著. 轴承信号是典型的时间序列数据,而长短时记忆网络(long short-term memory,LSTM)处理时间序列数据有独特的优势. 于洋等[11]提出LSTM与迁移学习(transfer learning,TL)相结合的故障识别方法,可以有效地对多类故障识别. 这些方法的不足之处在于,深度学习的网络模型较复杂,在网络训练过程中会消耗大量的时间.

针对深度学习存在的问题,本文提出改进目标函数的稀疏滤波(improved sparse filter,ISP)和空洞门卷积神经网络(dilated gate long short-term memory network,DGLSTM)相结合的方法,构造用于轴承振动信号故障诊断的稀疏空洞门卷积(ISP-DGLSTM)网络. 该方法通过改进目标函数的稀疏滤波提取故障特征,减少计算时间;利用空洞门卷积网络的特性,对轴承信号的噪声进行滤除,实现故障分类.

1. 改进稀疏滤波的特征学习

1.1. 稀疏滤波

稀疏滤波是Ngiam[12]提出的针对特征提取的无监督学习滤波器. 与传统的需要大量超参数调优的特征提取方法相比,稀疏滤波只需调整1个超参数[13]. 它先归一化特征矩阵的行,再归一化矩阵的列;将归一化后的特征矩阵元素相加得到目标函数;优化目标函数,得到最优特征矩阵.

给定样本矩阵 $ {{X}}\in {\bf{R}}^{N\times M} $,其中N为向量维数,M为样本数量. 则X相应的特征矩阵 ${{F}}\in {\bf{R}}^{{N_{\rm{f}}}\times M}$,如式(1)所示.

$ {{F}} = \left[ {\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} {{{F}}_1^{\left( 1 \right)}}&{{{F}}_1^{\left( 2 \right)}}\\ {{{F}}_2^{\left( 1 \right)}}&{{{F}}_2^{\left( 2 \right)}} \end{array}}&{\begin{array}{*{20}{c}} \ldots &{{{F}}_1^{\left( M \right)}}\\ \ldots &{{{F}}_2^{\left( M \right)}} \end{array}}\\ {\begin{array}{*{20}{c}} \vdots & \vdots \\ {{{F}}_{{N_{\rm{f}}}}^{\left( 1 \right)}}&{{{F}}_{{N_{\rm{f}}}}^{\left( 2 \right)}} \end{array}}&{\begin{array}{*{20}{c}} & \vdots \\ \cdots &{{{F}}_{{N_{\rm{f}}}}^{\left( M \right)}} \end{array}} \end{array}} \right]. $

式中:每一行代表一个特征,每一列代表一个样本,F的每个元素 ${{{F}}}_{i}^{\left(j\right)}$表示第j个样本的第i个特征,计算公式为

$ \begin{split} {{{{{F}}}}}_{i}^{\left(j\right)}=& \sum\limits_{n=1}^{{N}}{{{W}}}_{in}{{{X}}}^{\left(nj\right)}={{{W}}}_{i1}{{{X}}}^{\left(1j\right)}+ \\& {{{W}}}_{i2}{{{X}}}^{\left(2j\right)}+\cdots +{{{W}}}_{iN}{{{X}}}^{\left(Nj\right)}. \end{split} $

其中:W为权值矩阵, ${{W}}\in {\bf{R}}^{{N}_{{\rm{f}}}\times N}$. 归一化特征矩阵F的每一行

$ {\tilde {{F}}_i} = \frac{{{{{F}}_i}}}{{\left\| {{{{F}}_i}} \right\|}_2}. $

再归一化每一列[14]

$ {\hat {{F}}^{\left( j \right)}} = \frac{{{{\tilde {{F}}}^{\left( j \right)}}}}{{{{\left\| {{{\tilde {{F}}}^{\left( j \right)}}} \right\|}_2}}}. $

这样,所有的特征便落在二范数的单位球上[15].

采用L1范数惩罚优化归一化后的矩阵元素,并将优化后的所有样本相加组成目标函数. 对于有 $ {N}_{{\rm{f}}} $维的向量,目标函数 $L\left({{w}}\right)$

$ L\left( {{w}} \right) = {\rm{min}}\mathop \sum \limits_{j = 1}^{{M}} {\left\| {{{\hat {{F}}}^{\left( j \right)}}} \right\|_1} = \mathop \sum \limits_{j = 1}^{{M}} {\left\| {\frac{{{{\tilde {{F}}}^{\left( j \right)}}}}{{{{\left\| {{{\tilde {{F}}}^{\left( j \right)}}} \right\|}_2}}}} \right\|_1}. $

1.2. 改进稀疏滤波

对轴承故障诊断而言,特征之间一般存在一定的内在关系[16-17],比如具有同方差性. 由于轴承振动信号比较复杂,不同变量之间的方差往往不同,经常出现异方差性[18-19]. 同时,随着时间的变化,方差也会有相应的变化,比如采集数据的传感器位置不同会影响方差的大小.

在对数据分析的过程中,常采用图形法[20]和Breusch-Pagan法[21]检测数据是否存在异方差. 其中图形法是根据数据标准化残差在水平参考线两侧分布的均匀程度来判断. Breusch-Pagan法是通过计算置信水平p来判断,若p小于设定的判别界限(p=0.05),则原始数据中存在异方差;反之,则不存在异方差.

本研究所用的轴承数据随机抽取6 000个样本点,采用图形法检测其异方差的图形如图1所示. 图中,x为变量,R为标准化残差. 从图1可以看出,在水平参考线的两侧有部分样本残差分布不均匀. 通过Breusch-Pagan法计算可得p=1.973×10−8,由于p远远小于0.05,说明原始数据中存在异方差.

图 1

图 1   原始数据散点图

Fig.1   Original data scatter diagram


消除异方差,常采用的是加权最小二乘法[22]. 对数变换也能消除异方差. 根据这一特点,对稀疏滤波的目标函数进行改进:

$ L\left({{ w}} \right) =\! \!\ln \left( {1 -\min \sum\limits_{{{j\! =\! }}1}^{{M}} \left\| \!{{{\hat {{F}}}^{\left( j \right)}}}\! \right\|_1^2} \right) \!\!= \!\!\ln \left( {1 -\min \sum\limits_{{{j\! = \!}}1}^{{M}} \left\| {\frac{{{{\tilde {{F}}}^{\left( j \right)}}}}{{\left\|\! {{{\tilde {{F}}}^{\left( j \right)}}} \right\|}_2}}\! \right\|_1^2}\! \right). $

依据式(6)求函数LW的偏导:

$ \begin{split} L\left( {{w}} \right) = & {\rm{ln}}\left( {1 - \min \sum\limits_{{{j\! =\! }}1}^{{M}} ||{{\hat {{F}}}^{\left( j \right)}}||_1^2} \right) = \\ & {\rm{\;ln}}\left( {1 - \min \sum\limits_{{{j\! =\! }}1}^{{M}} \left\| {\dfrac{{\dfrac{{{{{F}}^{\left( j \right)}}}}{{||{{{F}}^{\left( j \right)}}|{|_2}}}}}{{{{\left\| {\dfrac{{{{{F}}^{\left( j \right)}}}}{{||{{{F}}^{\left( j \right)}}|{|_2}}}} \right\|}_2}}}} \right\|_1^2} \right). \end{split} $

$ \begin{split} L\left({{ w}} \right) = & {\rm{\;ln}}\left( {1 - {\rm{min}}\sum\limits_{n = 1}^{{N}} {\left\| {\frac{{ D}}{{||{ D}|{|_2}}}} \right\|_1^2} } \right) = \\ & {\rm{\;ln}}\left( {1 - {\rm{min}}\sum\limits_{{{n}} = 1}^{{N}} {\sum\limits_{i = 1}^{{N_{\rm{f}}}} {{{\left| {\frac{ D}{{\sqrt {\displaystyle\sum\limits_{i = 1}^{{N_{\rm{f}}}} {\displaystyle\sum\limits_{j = 1}^M {{{ D }^2}} } } }}} \right|}^2}} } } \right). \end{split} $

$ \begin{split} \frac{\partial L}{\partial {{W}}}= & \frac{1}{1-{\rm{min}}\displaystyle\sum\limits _{n=1}^{{N}}\displaystyle\sum\limits _{i=1}^{{N}_{{\rm{f}}}}{\left|\frac{ D}{\sqrt{\displaystyle\sum\limits _{i=1}^{{N}_{{\rm{f}}}}\displaystyle\sum\limits _{j=1}^{M}{\left( D \right)}^{2}}}\right|}^{2}} \times \\ & \frac{2\partial \left(1-{\rm{min}}\displaystyle\sum\limits _{n=1}^{{N}}\sum\limits _{i=1}^{{N}_{{\rm{f}}}}\left|\frac{ D }{\sqrt{\displaystyle\sum\limits _{i=1}^{{N}_{{\rm{f}}}}\displaystyle\sum\limits _{j=1}^{M}{\left({ D}\right)}^{2}}}\right|\right)}{\partial {{W}}}. \end{split} $

WX的初值给定时,依据式(6)~(9),通过L-BFGS算法[23]求出稀疏滤波的权值矩阵W. 其中,L-BFGS是拟牛顿法的改进算法,基本思想是:只保存并利用最近m次迭代的曲率信息来构造Hessian矩阵的近似矩阵. 具体计算公式如下:

$ {{{X}}}_{k+1}={{{X}}}_{k}-{{{H}}}_{k}{{L'}_{k}}; $

$ {{L'}_{k}}=\frac{\partial L}{\partial {{W}}}, \;k=0,1,2,\cdots, m. $

式(10)中,Hessian矩阵的逆矩阵 $ {{{H}}}_{k} $更新为

$ {{H}}_{k+1}={{{V}}}_{k}^{\rm{T}}{{{H}}}_{k}{{{V}}}_{k}+{\rho }_{k}{{{s}}}_{k}{{{s}}}_{k}^{\rm{T}}. $

式中: ${\rho }_{k}={1}/\left({{{{y}}}_{k}^{\rm{T}}{{{s}}}_{k}} \right)$${{{V}}}_{k}={{I}}-{\rho }_{k}{{{y}}}_{k}{{{s}}}_{k}^{\rm{T}}$I为单位矩阵; ${{{s}}}_{k}={{{x}}}_{k+1}-{{{x}}}_{k}$${{{y}}}_{k}={{L'}_{k+1}}-{{L'}_{k}}$;从式(12)可以看出, $ {H}_{k+1} $是用曲率信息 $\left\{{{{s}}}_{k},{{{y}}}_{k}\right\}$修正 $ {H}_{k} $得到的. 通过反复计算式(10),可得

每次迭代的初始值 ${H}_{k}^{0}={{I}}{{{{s}}}_{k-1}^{\rm{T}}{{{y}}}_{k-1}} \left/{\left( { {{{{y}}}_{k-1}^{\rm{T}}{{{y}}}_{k-1}}} \right) }\right.$,结合式(9),将 ${\partial L}/{\partial {{W}}}$代入L-BFGS算法,求出稀疏滤波的权值矩阵W.

为了验证所提方法的有效性,对随机抽取的6 000个样本点采用图形法对传统稀疏滤波和改进目标函数的稀疏滤波数据进行异方差验证,如图23所示. 从图2可以看出,水平线两侧有部分残差分布不均匀,在Breusch-Pagan检测中p=3.415×10−8,远小于判别界限0.05;如图3所示为改进稀疏滤波后的散点图,图中水平线的两侧残差分布均匀,且p=0.738,大于判别界限0.05,符合同方差性质. 因此本研究通过改进稀疏滤波,在对特征进行提取的同时,消除了数据中存在的异方差数据,为后续网络的故障分类奠定基础.

图 2

图 2   基于传统稀疏滤波后的散点图

Fig.2   Scatter graph based on traditional sparse filtering


图 3

图 3   基于改进稀疏滤波后的散点图

Fig.3   Scatter graph based on improved sparse filtering


2. 网络结构与算法流程

将经过稀疏滤波后的数据传入DGLSTM网络进行训练,如图4所示. DGLSTM网络是由4个空洞门卷积层、2个双向LSTM层和2个全连接层组成. 数据在通过空洞卷积层后,长度缩减,同时通过设置空洞卷积的空洞因子增大感受野,这是网络结构开始变化的重要的部分. LSTM处理时间序列数据具有独特的优势,本文采用双向LSTM网络不仅能处理好数据之间的关系,也可以防止梯度消失. 输出层为2个全连接层,最后一层采用softmax作为激活函数使输出值保持为0~1.0. 输出层中每个神经元的值表示输入样本属于故障类别的概率.

图 4

图 4   空洞门卷积神经网络结构图

Fig.4   Dilated gate convolution network structure graph


在进行网络训练之前,为了避免由于样本较少而出现过拟合现象,采用数据增强技术. 轴承数据是时间序列数据,采用滑动窗口的方式进行数据增强[24]. 图4中,沿时间轴对时间序列进行重采样.

DGLSTM网络的主要部分是4层空洞门卷积层,它是由空洞卷积和门卷积组成. 其中,空洞卷积又称扩张卷积,由Yu等[25]提出. 最初空洞卷积是被设计出来用在上下文分析的场景的,后来被广泛应用于语音合成[26]、语义分割[27]、机器翻译[28]等领域.

空洞卷积与普通卷积有相似的特征,传统的CNN网络一般先进行卷积再进行池化操作,以满足降低维度和增大感受野的需求,空洞卷积采用特定步长跳跃的方式读取数据,如图5所示. 空洞卷积在不丢失信息的情况下设置空洞率增大感受野,让每个卷积输出都包含更多的信息. 相应的,空洞卷积的感受野有2种计算方式:正常空洞卷积和padding空洞卷积. padding空洞卷积的具体计算方法:感受野尺寸 $=2(r{_{\rm{D}}}-1)$ $ \left(k-1\right)+k $.其中,rD为空洞率,k为卷积核大小.

图 5

图 5   不同空洞率的空洞卷积

Fig.5   Dilated convolution with different dilate rates


图5(a)所示为空洞率为1的3×3空洞卷积,此时的空洞卷积和普通的卷积操作一样;如图5(b)所示为空洞率为2的3×3卷积,其中,只有9个红点的权重不为0,其余的均为0,此时卷积的感受野已经增大到7×7;同理,在图5(c)中是空洞率为4的空洞卷积,感受野增大到了15×15. 对比传统呈线性增长的卷积操作,空洞卷积的感受野呈指数级增长[29].

当特征数据通过空洞卷积的操作后,网络可以接收更长的样本来获取更多的信息. 但是,轴承的工作环境复杂,往往含有大量的噪声,如果不对噪声进行处理,将无法在数据中提取更多的有用信息. 门卷积能有效地控制输入信息,滤除噪声,同时采用残差网络与门卷积结合的方法防止出现梯度消失的现象.

将经过空洞卷积层的数据传入双向LSTM网络中进行训练. 由于2个LSTM之间没有连接,双向LSTM网络可以看作2个单向LSTM网络构成[30]. 从图4可以看出,在前向传播层中,所有的数据由t=1到t=T完成前向传播;在反向传播层中,反向传播的神经元其实也在运行着前向传播的动作,只是由t=T到t=1进行传播. 数据传入全连接层进行分类,构成稀疏空洞门卷积网络(ISP-DGLSTM),整体算法流程图如图6所示.

图 6

图 6   稀疏空洞门卷积网络流程图

Fig.6   ISP-DGLSTM network flow chart


3. 实验及结果分析

3.1. 数据描述

3.1.1. 凯斯西储大学轴承数据

凯斯西储大学(Case Western Reserve University,CWRU)轴承数据常被用作轴承故障诊断的判别,CWRU实验台[31]是由2HP电机、编码器、测功器组成,实验轴承为SKF6205型电机轴承. 如图7所示,实验数据采集来自安装在电机驱动端和风扇端的加速度传感器,根据电动机转速不同分为0 HP、1 HP、2 HP、3 HP负载数据,采样频率为12 kHz,本文实验选择驱动端数据,如表1所示. 表中,D为直径,LD为负载. 在实际实验时,轴承失效有3种可能的位置,分别为内环、外环和滚动单元. 为了验证本研究所提方法的可靠性,在驱动端的每个位置收集了3个故障的数据,分别为7、14和21 mm,每个故障类型采集400个样本,每1 200个信号组成一组样本. 试验数据包含10种信号,分别为正常信号和故障信号.

图 7

图 7   CWRU试验台

Fig.7   CWRU test-bed


表 1   CWRU轴承故障数据集

Tab.1  Bearing fault data set of CWRU

数据集 信号等级 D/mm LD/HP
1 2 3 4
1 正常 0 0 1 2 3
2 轻微内圈故障 7 0 1 2 3
3 中等内圈故障 14 0 1 2 3
4 严重内圈故障 21 0 1 2 3
5 轻微外圈故障 7 0 1 2 3
6 中等外圈故障 14 0 1 2 3
7 严重外圈故障 21 0 1 2 3
8 轻微滚动故障 7 0 1 2 3
9 中等滚动故障 14 0 1 2 3
10 严重滚动故障 21 0 1 2 3

新窗口打开| 下载CSV


3.1.2. 传动系诊断模拟器数据

为了验证模型的性能,采用如图8所示的动力传动系统诊断模拟器(driveline diagnostic simulator,DDS)实验台进行实验. DDS实验台是一个由变速驱动电机、编码器、扭转传感器、主齿轮箱、副平型齿轮箱、可编程磁闸和传感器组成的完整的动力系统装置[32]. 该实验台采集的滚动轴承的外环、内环故障以及滚动元件数据对研究齿轮箱的噪声特性和振动特性具有实际意义.

图 8

图 8   动力传动系统诊断测试台

Fig.8   Driveline diagnostic simulator test bench


3.2. 实验验证
3.2.1. CWRU和DDS数据训练

轴承振动信号是典型的时间序列数据,采用滑动窗口的方式在时间序列上进行重采样,以防止出现过拟合现象;由于轴承数据采集过程中存在大量噪声,采用改进稀疏滤波对特征进行提取,滤除数据中存在的异方差;将提取的特征输入空洞门卷积网络进行分类,并通过不同数据的实验对比验证所提方法的性能. 所提的网络模型在2层双向LSTM网络(DBLSTM)[33]的基础上建立.

采用CWRU轴承数据进行对比实验,4种网络模型分类精度和运行时间的对比结果见表2,这4种网络模型分别是:双向LSTM网络(DBLSTM)、稀疏双向LSTM网络(ISP-DBLSTM)、空洞门卷积网络(DGLSTM)和稀疏空洞门卷积网络(ISP-DGLSTM). 表中,ACC为精度,t为运行时间. 在此次实验中,所有测试的算法采用Python语言编写;在Windows10系统,英特尔酷睿i7-7700处理器和16 GB内存的计算机上运行.

表 2   4种网络模型结果对比

Tab.2  Results comparison of four network models

模型 ACC t/s
DBLSTM 0.928 45.21
ISP-DBLSTM 0.987 45.02
DGLSTM 0.971 43.96
ISP-DGLSTM 0.998 41.92

新窗口打开| 下载CSV


为了使结果具有可比性,4个模型的设置采用相同的超参数:信号长度l=1 200;小批量b=100;学习率η=0.006;为了防止过拟合,在各层之间设置丢弃率RD=0.6;数据按照7∶3的比例划分为训练集和测试集,并对数据进行标准化处理.

图9所示为CWRU数据信号图. 图中,f为频率,A为幅值. 从图9可以看出,轴承振动的信号中含有大量噪声,这会干扰轴承故障分类.

图 9

图 9   CWRU轴承数据信号图

Fig.9   CWRU bearing data signal figure


图10所示为4种模型在西储大学数据下实验所得的精度图. 图中,n为迭代次数. 由图10可知:在CWRU的数据验证过程中,数据中的噪声对网络训练精度产生了一定的影响. 4种网络模型在迭代15次后,ACC均大于0.9,LSTM网络ACC稳定为0.95;DGLSTM的ACC一直处于振荡状态,收敛速度较慢;ISP-LSTM在迭代100次后,ACC逐渐趋于稳定;本研究所提方法ISP-DGLSTM在迭代10次后达到收敛,ACC大于0.99. 对比4种不同模型的计算时间和准确率,ISP-DGLSTM计算时间最短,精度最高. 以西储大学实验数据为例,ISP-DGLSTM参数见表3.

表 3   ISP-DGLSTM网络模型各层参数设置

Tab.3  Parameter setting of each layer of ISP-DGLSTM network model

网络层 输出参数 卷积核 滤波器数量 rD
输入 1 200×1
Covn1 3×16 3×1 16 1
Covn2 3×16 3×1 16 2
Covn3 3×16 3×1 16 2
Covn4 3×16 3×1 16 4
DBLSTM1 100×1 50
DBLSTM2 100×1 50
Dense1 200
Dense2 10

新窗口打开| 下载CSV


图 10

图 10   CWRU数据的4种模型精度对比曲线图

Fig.10   Four kinds of models accuracy compared by curve under CWRU data


表3可以看出,ISP-DGLSTM的空洞卷积增大了卷积核的接收域,网络可以接收更多的信息;在含有噪声的数据中,门卷积对噪声进行有效的滤除,为网络训练奠定基础. 在模型中只需要调整输入参数和空洞率的大小,所需调整的参数少,为训练模型节省了大量的计算时间.

为了验证ISP-DGLSTM的泛化性,采用DDS数据进行训练,信号图如图11所示. 对比图9,DDS数据背景噪声复杂,数据波动大、具有随机性,很难从信号中提取有用的特征.将DDS数据放入4种模型进行训练,得到精度对比图,如图12所示. 与图10对比可知,在噪声信息较多的数据中,LSTM和ISP-LSTM的ACC下降明显,并且一直处于震荡状态,收敛不稳定;含有空洞门卷积的DGLSTM和ISP-DGLSTM的ACC均大于0.9. 说明空洞门卷积对噪声有一定滤除作用. 结合改进的稀疏滤波对特征进行提取,ISP-DGLSTM在迭代50次后ACC=0.98且达到收敛.

图 11

图 11   动力传动系统轴承数据信号图

Fig.11   Driveline bearing data signal figure


图 12

图 12   动力传动系统数据的4种模型精度对比曲线图

Fig.12   Four kinds of models accuracy compared by curve under driveline data


3.2.2. 不同负载和不同信噪比的性能验证

为了验证模型的鲁棒性能,实验采用不同负载下的数据,CWRU不同负载下的4种模型对比如图13所示. 其中A组是以每秒12 000个样本的速度收集的驱动端和风机端数据;B组是以每秒12 000个样本和以每秒48 000个样本收集的驱动端数据;C组是以每秒12 000个样本收集的风机端数据和以每秒48 000个样本收集的驱动端数据组成;A-B是由A组和B组中随机挑选的一半的数据组成;同理,B-C、A-C数据是由相应组的一半的数据组成. 由图13可知,在不同负载、不同转速下,ISP-DGLSTM收敛速度快,ACC均大于0.98.

图 13

图 13   CWRU数据下4种模型精度图

Fig.13   Four kinds of model accuracy figure under CWRU data


图14所示为动力传动系统数据中不同速度下训练精度折线图,其中DDS-A和DDS-B是恒速状态下的数据,电机转速分别为1 120 r/min和1 350 r/min. DDS-AB是变速状态下的数据,由A和B组随机一半的数据组成. 可以看出,当数据集的噪声和速度发生变化时,DBLSTM和ISP-DBLSTM的ACC大幅度下降,数据特征未能完整提取出来;含有门卷积的DGLSTM和ISP-DGLSTM网络可以滤除噪声,ACC大于0.9.

图 14

图 14   动力传动系统数据的4种模型精度图

Fig.14   Four kinds of model accuracy figure under driveline data


为了验证模型的抗噪性能,在CWRU原始数据中加入不同信噪比的高斯白噪声,加入的信噪比越小,信号中所含的噪声越大. 如图15所示分别为加入信噪比为1和信噪比为−4的信号图. 可以看出,信号的幅值范围随信噪比的变小而增大.

图 15

图 15   加入信噪比的CWRU数据信号图

Fig.15   Add signal diagram with signal-to-noise ratio to CWRU data


图16所示为加入信噪比为1的4种模型精度曲线图. 可知,4种模型的故障识别精度均大于0.85,且很快都能达到收敛,其中ISP-DGLSTM的ACC大于0.9,并在迭代50次后逐渐达到稳定. 如图17所示为信噪比为−4的4种模型精度曲线图. 在强噪声干扰下,模型的精度均有所下降. LSTM和DGLSTM模型在迭代了100次后逐渐趋于稳定,模型收敛,ACC=0.76;ISP-LSTM收敛速度较慢,在迭代150次后达到ACC=0.81的精度;ISP-DGLSTM在迭代80次后达到收敛,ACC=0.87.

图 16

图 16   凯斯西储大学数据中加入信噪比为1的精度对比曲线图

Fig.16   Accuracy comparison curve with signal-to-noise ratio of 1 added to Case Western Reserve University data


图 17

图 17   凯斯西储大学数据中加入信噪比为−4的精度对比曲线图

Fig.17   Accuracy comparison curve with signal-to-noise ratio of −4 added to Case Western Reserve University data


4. 结 语

针对轴承故障特征难以提取的问题,本研究提出改进稀疏滤波和深层空洞门卷积的网络模型ISP-DGLSTM. 通过改进的稀疏滤波对特征进行自适应提取,有效消除异方差问题. 引入空洞卷积来替代池化操作,减少数据的丢失. 为了降低数据中的噪声,在网络结构中采用门卷积操作. 通过不同模型和不同数据集的对比实验,所提ISP-DGLSTM结构具有良好的泛化性和抗噪性.

与其他模型相比,该模型的结构具有较高的精度和抗噪声性能. 在语音识别,机器视觉等领域中,所提方法的性能需要进一步验证.

参考文献

朱会杰, 王新晴, 芮挺, 等

基于平移不变CNN的机械故障诊断研究

[J]. 振动与冲击, 2019, 38 (5): 45- 52

[本文引用: 1]

ZHU Hui-jie, WANG Xin-qing, RUI Ting, et al

Machinery fault diagnosis based on shift invariant CNN

[J]. Journal of Vibration and Shock, 2019, 38 (5): 45- 52

[本文引用: 1]

杨宇, 罗鹏, 甘磊, 等. SADBN及其在滚动轴承故障分类识别中的应用[J]. 振动与冲击, 2019, 38(15): 11-16.

[本文引用: 1]

YANG Yu, LUO Peng, GAN Lei, et al. SADBN and its application in rolling bearing fault identification and classification [J]. Journal of Vibration and Shock, 2019, 38(15): 11-16.

[本文引用: 1]

JORDI B V, RUBEN P, JAVIER M R, et al

Short-frequency Fourier transform for fault diagnosis of induction machines working in transient regime

[J]. IEEE Transactions on Instrumentation and Measurement, 2017, 66 (3): 432- 440

DOI:10.1109/TIM.2016.2647458      [本文引用: 1]

程卫东, 赵德尊

用于滚动轴承转频估计的EMD软阈值降噪算法

[J]. 浙江大学学报: 工学版, 2016, 50 (3): 428- 435

[本文引用: 1]

CHENG Wei-dong, ZHAO De-zun

EMD soft-thresholding denoising algorithm for rolling element bearing rotational frequency estimation

[J]. Journal of Zhejiang University: Engineering Science, 2016, 50 (3): 428- 435

[本文引用: 1]

SHUAI J, LEE S K

Bearing fault detection utilizing group delay and the Hilbert-Huang transform

[J]. Journal of Mechanical Science and Technology, 2017, 31 (3): 1089- 1096

DOI:10.1007/s12206-017-0208-z      [本文引用: 1]

杨先勇, 周晓军, 张文斌, 等

基于形态小波和S变换的滚动轴承故障特征提取

[J]. 浙江大学学报: 工学版, 2010, 44 (11): 2088- 2092

[本文引用: 1]

YANG Xian-yong, ZHOU Xiao-jun, ZHANG Wen-bin, et al

Rolling bearing fault feature extraction based on morphological wavelet and S-transform

[J]. Journal of Zhejiang University: Engineering Science, 2010, 44 (11): 2088- 2092

[本文引用: 1]

周奇才, 沈鹤鸿, 赵炯, 等

基于改进堆叠式循环神经网络的轴承故障诊断

[J]. 同济大学学报: 自然科学版, 2019, 47 (10): 1500- 1507

[本文引用: 1]

ZHOU Qi-cai, SHEN He-hong, ZHAO Jiong, et al

Bearing fault diagnosis based on improved stacked recurrent neural network

[J]. Journal of Tongji University: Natural Science, 2019, 47 (10): 1500- 1507

[本文引用: 1]

ZHUANG Z, LV H, XU, et al

A deep learning method for bearing fault diagnosis through stacked residual dilated convolutions

[J]. Applied Sciences, 2019, 9 (9): 1823

DOI:10.3390/app9091823      [本文引用: 1]

田源. 基于深度学习的中文命名实体识别方法研究[D]. 长沙: 湖南大学, 2018: 42-56.

[本文引用: 1]

TIAN Yuan. The research of Chinese named entity recognition based on deep learning [D]. Changsha: Hunan University, 2018: 42-56.

[本文引用: 1]

LEI Y, JIA F, LIN J, et al

An intelligent fault diagnosis method using unsupervised feature learning towards mechanical big data

[J]. IEEE Transactions on Industrial Electronics, 2016, 63 (5): 3137- 3147

DOI:10.1109/TIE.2016.2519325      [本文引用: 1]

于洋, 何明, 刘博, 等

基于TL-LSTM的轴承故障声发射信号识别研究

[J]. 仪器仪表学报, 2019, 40 (5): 51- 59

[本文引用: 1]

YU Yang, HE Ming, LIU Bo, et al

Research on acoustic emission signal recognition of bearing fault based on TL-LSTM

[J]. Chinese Journal of Scientific Instrument, 2019, 40 (5): 51- 59

[本文引用: 1]

NGIAM J, CHEN Z, BHASKAR S A, et al. Sparse filtering [C] // Proceedings of Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2011: 1125-1133.

[本文引用: 1]

陈赟

基于稀疏滤波的信号识别

[J]. 电信快报, 2015, (8): 46- 48

[本文引用: 1]

CHEN Yun

signal recognition based on sparse filtering

[J]. Telecom Express, 2015, (8): 46- 48

[本文引用: 1]

邱立达, 刘天键, 傅平

基于深度稀疏滤波的目标跟踪

[J]. 计算机辅助设计与图形学学报, 2017, 29 (3): 459- 468

DOI:10.3969/j.issn.1003-9775.2017.03.008      [本文引用: 1]

QIU Li-da, LIU Tian-jian, FU Ping

Target tracking based on deep sparse filtering

[J]. Journal of Computer-Aided Design and Computer Graphics, 2017, 29 (3): 459- 468

DOI:10.3969/j.issn.1003-9775.2017.03.008      [本文引用: 1]

ALEXIS B, PRASAD S, FRÉDÉRIC B, et al

Well-posedness of the permutation problem in sparse filter estimation with p minimization

[J]. Applied and Computational Harmonic Analysis, 2013, 35 (3): 394- 406

DOI:10.1016/j.acha.2012.11.001      [本文引用: 1]

何金洋

基于稀疏滤波和神经网络的人脸识别算法

[J]. 理论探讨, 2016, 7 (5): 28- 31

[本文引用: 1]

HE Jin-yang

The facial recognition algorithm based on sparse filtering-neural networks

[J]. Theoretical Investigation, 2016, 7 (5): 28- 31

[本文引用: 1]

李永国. 变量预测模型模式识别方法及其在滚动轴承故障诊断中的应用[D]. 长沙: 湖南大学, 2015: 6-12.

[本文引用: 1]

LI Yong-guo. Variable predictive model based class discriminate and its application in fault diagnosis of roller bearing [D]. Changsha: Hunan University, 2015: 6-12.

[本文引用: 1]

YANG H, LV J, GUO C

Weighted composite quantile regression estimation and variable selection for varying coefficient models with heteroscedasticity

[J]. Journal of the Korean Statistical Society, 2015, 44 (1): 77- 94

DOI:10.1016/j.jkss.2014.05.005      [本文引用: 1]

HILL J B

Robust generalized empirical likelihood for heavy tailed autoregressions with conditionally heteroscedastic errors

[J]. Journal of Multivariate Analysis, 2015, 135: 131- 152

DOI:10.1016/j.jmva.2014.12.008      [本文引用: 1]

杨荣芳, 周惠

靶场光学测量数据异方差性检验及修正

[J]. 指挥控制与仿真, 2008, 30 (4): 114- 116

DOI:10.3969/j.issn.1673-3819.2008.04.031      [本文引用: 1]

YANG Rong-fang, ZHOU Hui

Test and adjust heteroscedasticity of optical measure data in proof range

[J]. Command Control and Simulation, 2008, 30 (4): 114- 116

DOI:10.3969/j.issn.1673-3819.2008.04.031      [本文引用: 1]

HALUNGA A, ORME C D, YAMAGATA T

A heteroskedasticity robust Breusch-Pagan test for contemporaneous correlation in dynamic panel data models

[J]. Journal of Econometrics, 2017, 198 (2): 209- 230

DOI:10.1016/j.jeconom.2016.12.005      [本文引用: 1]

万书亭, 佟海侠, 董炳辉

基于最小二乘支持向量机的滚动轴承故障诊断

[J]. 振动. 测试与诊断, 2010, 30 (2): 149- 152

[本文引用: 1]

WAN Shu-ting, TONG Hai-xia, DONG Bing-hui

Bearing fault diagnosis using wavelet packet transform and least square support vector machines

[J]. Journal of Vibration, Measurement and Diagnosis, 2010, 30 (2): 149- 152

[本文引用: 1]

GE F, JU Y, QI Z, et al

Parameter estimation of a Gaussian mixture model for wind power forecast error by Riemann L-BFGS optimization

[J]. IEEE Access, 2018, (6): 38892- 38899

[本文引用: 1]

李旭芳, 段春林, 张冬波, 等

遥测数据时间序列滑动窗口动态分割技术

[J]. 飞行器测控学报, 2015, 34 (4): 345- 349

[本文引用: 1]

LI Xu-fang, DUAN Chun-lin, ZHANG Dong-bo, et al

A dynamic slide windows segmentation technology for telemetry time series

[J]. Journal of Spacecraft TT and C Technology, 2015, 34 (4): 345- 349

[本文引用: 1]

YU F, KOLTUN V. Multi-scale context aggregation by dilated convolutions [C] // International Conference on Learning Representations. San Juan, Puerto Rico: ICLR, 2016.

[本文引用: 1]

LORENZO J, BARRA R, YAMAGISHI J, et al

Improving Spanish speech synthesis intelligibility under noisy environments

[J]. Journal of the Acoustical Society of America, 2016, 140 (4): 2961- 2962

[本文引用: 1]

LONG J, SHELHAMER E, DARRELL T

Fully convolutional networks for semantic segmentation

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 39 (4): 640- 651

[本文引用: 1]

NAIM I, RILEY P, GILDEA D

Feature-based decipherment for machine translation

[J]. Computational Linguistics, 2018, 44 (2): 1- 33

[本文引用: 1]

张利刚. 基于全空洞卷积神经网络的图像语义分割[D]. 长春: 东北师范大学, 2018: 9-15.

[本文引用: 1]

ZHANG Li-gang. Image semantic segmentation based on full cavitation convolutional neural network [D]. Changchun: Northeast Normal University, 2018: 9-15.

[本文引用: 1]

张新峰, 闫昆鹏, 赵珣

基于双向LSTM的手写文字识别技术研究

[J]. 南京师大学报, 2019, 42 (3): 58- 64

[本文引用: 1]

ZHANG Xin-feng, YAN Kun-peng, ZHAO Xun

Handwriting Chinese text recognition using BiLSTM network

[J]. Journal of Nanjing Normal University, 2019, 42 (3): 58- 64

[本文引用: 1]

YANG Y, FU P, HE Y

Bearing fault automatic classification based on deep learning

[J]. IEEE Access, 2018, (6): 71540- 71554

[本文引用: 1]

乔美英, 刘宇翔, 兰建义

基于VMD和马氏距离SVM的滚动轴承故障诊断

[J]. 中山大学学报: 自然科学版, 2019, 58 (5): 8- 16

[本文引用: 1]

QIAO Mei-ying, LIU Yu-xiang, LAN Jian-yi

Fault diagnosis method of rolling bearings based on VMD and mahalanobis distance SVM

[J]. Journal of Sun Yat-sen University: Medical Sciences, 2019, 58 (5): 8- 16

[本文引用: 1]

LI X, TIAN J, XU M, et al. DBLSTM-based multi-scale fusion for dynamic emotion prediction in music [C] // 2016 IEEE International Conference on Multimedia and Expo. Seattle: IEEE, 2016: 1-6.

[本文引用: 1]

/