伴随着科技的快速发展及工业应用的不断进步,现代工业中机械设备越来越精密,其自动化和智能化水平越来越高。机械设备在实际工程中往往处于极端恶劣的工作环境中,如超高速、大过载、强辐射等,且其本身构造复杂,故障模式多样,导致机械设备的运行安全问题日渐凸显。一旦发生故障而引起事故,轻则造成经济损失,重则发生人员伤亡,所以有必要对机械设备的健康状态进行诊断与评估。
传统的故障诊断方法大多是通过研究设备运行的物理机理来计算故障特征频率,或对运行数据进行特征信号分解,来达到识别故障的目的。常用的方法包括短时傅里叶变换(short-time Fourier transform,STFT)[1 ] 、小波变换[2 ] 、经验模态分解[3 ] 和变分模态分解[4 ] 等。采用上述方法对故障信号进行降噪分离,在设备故障诊断中取得了较好的效果。然而,其只能处理简单且充足的数据信号,且需要人工干预以提取故障特征,难以处理复杂机械设备的故障诊断问题。
近年来,人工智能成为学术界研究热点之一,学者们将其中多种算法框架引入故障诊断中,而深度学习方法凭借其强大的特征提取能力、多样化的下游任务处理能力、端到端任务处理能力等优势,成为故障诊断领域的主流工具之一。Zhang等[5 ] 提出了一种深度全卷积神经网络模型,可用以提取由振动信号转换的光谱图数据特征而完成故障分类;Wang等[6 ] 基于卷积神经网络(convolutional neural network, CNN)提出了一种多尺度学习神经网络,提高了故障数据特征的提取能力;He等[7 ] 利用STFT得到频谱矩阵,采用优化的大容量记忆存储与检索模型完成了故障诊断。虽然采用上述诊断方法都取得了一定效果,但都是以具有质量好且样本充足的故障数据为前提的[8 ] 。在实际工程中,工况环境复杂,机械设备的故障诊断数据难以充分获取,深度学习模型的泛化能力大大降低[9 ] ,导致出现过拟合等问题。因此,利用少量的故障样本训练出能够精确识别故障类别的深度学习智能诊断模型,是故障诊断研究中的重点课题[10 ] 。
因此,诸多学者提出了一系列方法。如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率。上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式。因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率。
针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类。由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据。Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据。上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况。然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] 。在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力。
虽然ACGAN模型可以很好地解决多模数据生成问题,但由于其框架自身的缺陷,当训练数据较少时仍然会出现训练不稳定甚至崩溃等情况。因此,作者提出了一种多判别器辅助分类器生成对抗网络(multi-discriminator ACGAN,MDACGAN)模型,用于提高小样本条件下机械设备的故障数据扩充和诊断能力。主要研究工作如下:
1)通过引入3个判别器和1个独立的分类器,构建新的ACGAN框架,避免生成器拟合出欺骗判别器的特殊条件,提高标签识别精度,从而提高数据的生成质量并增强其多样性;
2)通过引入Wasserztein距离构造一种新的ACGAN损失函数,同时将Wasserstein的L2梯度惩罚项强制约束条件替换为LP(Lipschitz penalty,利普希茨约束),以提高训练的稳定性;
3)引入高效通道注意力(efficient channel attention, ECA)机制,通过动态调整每个通道的权重来强调重要特征,这种针对性的加权机制可以进一步提高模型的特征提取能力。
1 GAN 及其变体的原理
1.1 WGAN 和改进WGAN 的原理
原始的GAN是一类由2个对抗训练模型构成的深度学习算法,一个模型是生成器(generator),另一个模型是判别器(discriminator)。GAN的框架如图1 (a)所示。生成器的目标是最大程度地拟合逼近真实样本的数据分布,即生成与训练样本相似的数据;判别器的目标是区分数据是真实样本还是生成器生成的伪数据样本。两者相互博弈训练,最终达到一种纳什均衡状态。
图1
图1
GAN 和ACGAN 框架
Fig.1
Frames of GAN and ACGAN
m i n G m a x D L ( D , G ) = E x ~ P r l o g D ( x ) + E z ~ P z l o g 1 - D G ( z ) (1)
式中:E ⋅ 为期望函数,P r 为真实样本x 的数据分布,P z 为噪声样本z 的数据分布,D ( x ) 为判别器的输出值,G ( z ) 为生成器的输出结果。
m i n G L ( G ) = E y ~ P g l o g 1 - D ( y ) (2)
m a x D L ( D ) = E x ~ P r l o g D ( x ) + E y ~ P g l o g 1 - D y (3)
由式(2)和式(3)可知,生成器的目标是生成尽可能真实的数据来欺骗判别器,判别器的目标是最大化目标函数,即尽可能区分样本的真假源。
在模型的实际训练中存在着梯度消失和模型崩溃的问题,其原因是式(1)的度量模式为Jensen-Shannon divergence(JS散度)。在训练之初,P r 与P g 在高维空间产生重叠,导致JS散度无法产生梯度,即梯度消失,从而导致模型无法得到训练。为此,Arjovsky等[27 ] 将Wasserstein距离引入目标函数,提出了WGAN,以解决JS散度度量模式无法提供训练梯度的问题。Wasserstein距离的定义如下[27 ] :
W ( P r , P g ) = i n f γ ~ ∏ ( P r , P g ) E ( x , y ) ~ γ x - y (4)
式中:∏ P r , P g 为P r 与P g 联合分布的集合,i n f 表示下确界,γ 为联合分布,x - y 为样本距离。
式(4)表示在所有可能的联合分布中取到期望值的下界。
但由于i n f γ ~ ∏ ( P r , P g ) 不能直接求解,须截断以限制判别器网络权值的取值范围,即满足Lipschitz连续条件,以近似计算Wasserstein距离。采用权值截断会使大部分权值落在截断的边界上,导致无法获得梯度,进而可能导致模式崩溃[28 ] 。改进WGAN即WGAN-GP[29 ] 采用由L2梯度惩罚项替换权值截断的方法解决上述问题。L2梯度惩罚项满足WGAN中的Lipschitz连续性条件,同时避免了权值截断导致的权重集中在边界上的问题,提高了模型的训练稳定性和灵活性。
G P = λ E P x ^ ∇ x ^ D x ^ 2 - 1 2 (5)
式中:G P 为梯度惩罚项,λ 为比例因子,· 2 为二范数,∇ 表示梯度,P x ^ 为x ^ 的数据分布,x ^ = t y + ( 1 - t ) x , 0 ≤ t ≤ 1 。
L = E x ~ P r D x - E y ~ P g D ( y ) + λ E x ^ ~ P x ^ ∇ x ^ D x ^ 2 - 1 2 (6)
1.2 ACGAN 的原理
ACGAN是GAN的一种变体,同时具有条件生成对抗网络(conditional GAN, CGAN)[30 ] 和半监督学习生成对抗网络(semi-supervised learning GAN, SGAN)[31 ] 的特点,能够在生成符合特定条件的数据时输出其所属的类别。ACGAN的框架如图1 (b)所示。生成器的输入噪声嵌入了标签信息,因此能够生成带标签的数据;判别器可判别真假数据源和区分数据类别信息。由于引入了标签信息,ACGAN的目标函数包含两个部分,分别如式(7)和式(8)所示[19 ] :
L s o u r c e = E x ~ P r l o g D ( x ) + E z ~ P z l o g 1 - D G ( z ) (7)
L c l a s s = E c ~ P r l o g D ( c ) + E c ~ P z l o g 1 - D ( G ( c ) ) (8)
式中:L s o u r c e 为数据真假判别引起的损失,L c l a s s 为标签类别判断引起的损失,c 为标签数据。
对于生成器而言,需要最大化L c l a s s - L s o u r c e ;对于判别器,则最大化损失函数L s o u r c e + L c l a s s 。
2 MDACGAN 原理
2.1 模型框架设计
ACGAN将标签信息嵌入生成器的输入噪声中,同时进一步扩展了判别器的判别与分类能力。然而,与原始GAN一样,ACGAN同样存在训练不稳定、模型崩溃等问题。模型崩溃即生成器学习到了某种特殊的条件参数,此时生成器生成的假样本可以轻松骗过判别器。实际上生成器并不是真正地拟合真实的数据分布,而仅仅是某种特殊条件促使其生成相同的样本,可能会导致生成样本模式的缺失[32 ] 。因此,本文提出了MDACGAN模型,通过设计多个判别器来避免生成器学习到欺骗判别器的特殊条件,以解决模型崩溃问题。MDACGAN框架如图2 所示。模型设计细节如下:
图2
图2
MDACGAN 框架
Fig.2
Frame of MDACGAN
1)构造3个不同的判别器网络和1个生成器网络,进行对抗训练。3个判别器网络分别为2个卷积神经网络和1个全连接神经网络。由于3个网络模型的结构不尽相同,可避免生成器学习到欺骗判别器的特殊条件。
2)在原始的ACGAN中,判别器包含了判断真假源和分类标签两个功能,并且判断与分类部分共享了网络权重。新框架构建了3个判别器网络,若按照原始框架处理,则有3个分类器网络,而设计多判别器的目的主要是为了避免生成器学习到欺骗判别器的特殊条件,即其主要功能是真假源的判断。故MDACGAN模型中判别器的分类功能被独立出去,通过构建分类神经网络来处理标签分类问题。构造了独立的分类器后,既能减轻网络模型的冗余度,同时可以按照深度学习对分类模型的设计思路设计分类器,增强模型的可拓展性。
3)为了进一步提高模型提取特征的能力,在分类器中添加了ECA[33 ] 。该模块的特点是参数量相比其他注意力模块少。
4)在激活函数方面,判别器采用Leaky ReLU函数,生成器和分类器采用ReLU激活函数。此外,判别器和生成器采用RMSProp优化器来更新网络参数,以提高收敛速度,且避免梯度消失。分类器采用Adam优化器,用来高效处理稀疏梯度,提高训练的效率和稳定性。分类器的输出层采用Softmax函数处理多分类目标。
2.2 损失函数设计
如上文所述,原始的ACGAN存在训练不稳定、模型崩溃等问题,而MDACGAN模型通过设计多判别器的方式解决了模型崩溃的问题。本小节通过对目标函数优化设计来解决模型训练不稳定的问题。
WGAN即基于Wasserstein距离重新设计了GAN的目标函数,WGAN-GP则用梯度惩罚机制代替权重截断以满足LP,进一步优化了模型。这2次改进基本解决了原始GAN模型训练不稳定的问题。基于上述方法的优越性,将Wasserstein距离与梯度惩罚机制引入ACGAN模型的目标函数中。改进的目标函数如下:
L D 0 = - E x ~ P r D ( x ) + E y ~ P g D ( y ) + λ E x ^ ~ P x ^ ∇ x ^ D x ^ 2 - 1 2 (9)
L G = - 1 3 E y ~ P g D 0 ( y ) + E y ~ P g D 1 ( y ) + E y ~ P g D 2 ( y ) + L C g (10)
L C r = E x ~ P r - l o g P c = c r | x (11)
L C g = E y ~ P g - l o g P c = c g | y (12)
L C = 1 2 L C r + L C g (13)
式中:L D 、L G 和L C 分别为判别器、生成器和分类器的损失函数,L C r 和L C g 分别为分类真实样本与生成样本的交叉熵损失函数。其中,L D 0 、L D 1 和L D 2 的表达式形式相同,这里只给出了L D 0 的表达式,L D 1 和L D 2 的表达式可类似获得。
后续经过实验发现,随着样本类别数量的增加,生成样本的质量会急剧下降,训练不稳定等情况会出现。Petzka等[34 ] 改进了梯度惩罚机制,提出了单边惩罚方法,只惩罚梯度范数大于1的部分,其定义如下[34 ] :
L P = λ E p x ^ m a x 0 , ∇ x ^ D x ^ 2 - 1 2 (14)
该方法将原G P 的硬约束替换为单边软约束,进一步提升了训练的稳定性,并且降低了对超参数的敏感性。MDACGAN将L P 引入判别器的目标函数中,最终判别器的目标函数如下:
L D 0 = - E x ~ P r D ( x ) + E y ~ P g D ( y ) + λ E x ^ ~ P x ^ m a x 0 , ∇ x ^ D x ^ 2 - 1 2 (15)
2.3 模型训练流程
MDACGAN模型中3个判别器和1个生成器均采用RMSProp优化器,分类器采用Adam梯度下降算法,损失函数采用交叉熵损失函数。网络模型的结构和超参数是在ACGAN模型的基础上进行实验后得到的结果,其结构如表1 所示。其中生成器学习率为0.000 2,分类器学习率为0.000 02,模型梯度惩罚项的惩罚系数为10,批量尺寸为10,输入生成器的噪声维度为100。
1)生成器将嵌入了标签信息的随机噪声生成带标签的数据,生成数据和真实数据输入3个判别器中进行数据源判断,同时计算判别器网络损失函数,采用优化器更新网络参数。
2)生成器生成的数据和真实数据同样输入分类器中进行分类,并计算分类器损失,更新分类器的网络参数。
3)训练判别器和分类器后,进行组合结构训练。保持判别器和分类器的权重参数不变,基于生成器的损失函数计算损失,并更新参数。
训练完生成器后,即结束了一个轮次训练,进入下一轮迭代。通过足够多的迭代训练,生成器和判别器模型收敛而达到纳什均衡状态,分类器也达到收敛状态。此时,生成器生成的带标签的数据即可用于扩充数据集。
3 实验验证
实验所用PC(personal computer,个人电脑)的中央处理器采用AMD Ryzen 7 4800HS with Radeon Graphics,显存为6 GB的NVIDIA GeForce RTX2060 with Max-Q GPU。MDACGAN模型基于深度学习框架Tensorflow2.7构建。
3.1 实验1
3.1.1 数据集介绍与预处理
采用美国凯斯西储大学(Case Western Reserve University,CWRU)公开的轴承故障数据集[35 ] 。该数据集包含3种电火花引起的轴承损伤数据,损伤直径分别为0.178,0.356,0.533 mm,损伤点设置在3点钟、6点钟、12点钟等3个位置,包含内圈、滚动体、外圈等3种故障模式及0级、1级、2级、3级等4级负载。振动信号由16通道数据记录仪采集得到,采样频率分别为12, 48 kHz。
本次实验选取了8类驱动端轴承损伤数据,包含内圈、滚动体、外圈等3种故障模式,选取3个不同损伤位置以及0级、1级负载,如表2 所示。从每种数据类型中,随机抽取连续的4 096个数据点作为一个样本,选取50个样本用于MDACGAN模型的训练以生成新的样本扩充数据,另取100个样本作为测试集,用于验证该方法的有效性。
本文采用一种由一维振动信号转换成二维灰度图的数据预处理方法[36 ] 。由于将数据信号由一维转换为二维,可以采用在图像领域表现优异的二维卷积核对原始数据进行特征提取。该转换方法可以表示为[36 ] :
P ( j , k ) = r o u n d N ( j - 1 ) × M + k - m i n N m a x N - m i n N × 255 (16)
式中:P j , k 为转换完成后灰度图矩阵中j , k 位置的值;M 为图像的长度,转换后图像大小为M × M ;N 为选择的原始数据点个数;r o u n d ⋅ 为四舍五入函数,用于保证原始数据值归一化为0~255后仍是整数,0~255即整个灰度图的像素值。
在处理中,将原始数据转换为64×64大小的灰度图,作为MDACGAN的输入。部分故障数据灰度图如图3 所示。
图3
图3
实验1 的部分故障数据灰度图
Fig.3
Gray scale of partial fault data in experiment 1
3.1.2 实验结果对比
实验所采用的模型结构如表1 所示。MDACGAN模型生成的部分样本如图4 (a)所示。由图可知,生成样本与真实样本相似但不完全相同,说明生成模型拟合到逼近真实的样本分布,而不是学习到能够欺骗判别器的特殊条件。ACGAN和ACWGAN-GP模型所生成的图片分别如图4 (b)和图4 (c)所示。
图4
图4
不同模型对CWRU 轴承故障数据集生成的样本
Fig.4
Samples generated by different models on CWRU bearing fault data set
当然,肉眼的评判并不全面客观,本文采用弗雷歇感知距离D FI [37 ] 和最大均值差异D MM [38 ] 两种评价指标来评判所生成图片的质量,同时与ACGAN、ACWGAN-GP[24 ] 两种模型所生成的图片进行对比。
D FI 为真实图片与生成图片在特征层面的距离,本质上是采用均值和协方差矩阵计算2个分布之间的距离。D FI 表示为[37 ] :
D F I = μ r - μ g 2 + T r ∑ r + ∑ g - 2 ∑ r ∑ g 1 2 (17)
式中:μ r 为真实图片特征的均值;μ g 为生成图片特征的均值;T r 表示矩阵对角线上元素的总和,在矩阵论中称为迹(Trace);∑ r 为真实图片特征的协方差矩阵;∑ g 为生成图片特征的协方差矩阵。
生成图片与真实图片的特征越相近,其均值之差的平方越小,协方差越小,D FI 值也就越小。较小的D FI 值意味着2个分布之间更接近,生成图片的质量较高,多样性更好。ACGAN、ACWGAN-GP、MDACGAN等3种模型以相同训练集作为输入,生成相同数量的数据样本,其D FI 值如表3 所示。
同时,引入另一种度量分布差异的指标D MM ,其在希尔伯特空间度量2个分布的差异。所以,可以用D MM 度量真实训练数据集分布P r 与生成数据集分布P g 之间的距离。D MM 值越小,则2个分布越接近,从而反映模型的生成效果越好。D MM 表示为[38 ] :
D M M ( F , P r , P g ) = s u p f H ≤ 1 E P r f ( x ) - E P g [ f ( y ) ] (18)
式中:F 为所有可能函数的集合,s u p 表示取映射函数f 在给定范围的上确界即最大值,f H ≤ 1 表示函数f 在再生希尔伯特空间中的范数小于等于1。
由表3 和表4 可知,MDACGAN模型的D FI 值和D MM 值比其他2种模型小得多,虽然标签2对应的D FI 值明显比其他类高,但根据D MM 值及其与其他2种模型的比较,可知该类生成质量仍然较高。ACGAN模型的D FI 值和D MM 值均较大,D FI 值基本相同,且通过对比可知真实样本图片与生成样本图片相差甚大,但生成的图片基本一样,说明原始的ACGAN模型在训练小样本、多类别数据时会发生崩溃,难以提取特征进行对抗生成工作。虽然ACWGAN-GP模型在目标函数中引入了Wasserstein距离和梯度惩罚项,相比ACGAN模型,其训练稳定性有所改善,但在完成多类别任务中表现效果较差,所生成图片的质量与多样性不高,这进一步验证了对本文所提出的MDACGAN模型框架以及损失函数改进的有效性。
为了进一步验证生成样本与真实样本的相似性,本文采用t 分布随机邻域嵌入(t -distributed stochastic neighbor embedding,t -SNE)[39 ] 方法对生成样本和真实样本进行降维可视化。ACGAN模型训练时发生崩溃,生成了相同的图片,因此没有进行比较分析。生成样本和真实样本的可视化结果如图5 所示。图中,R_class n 表示第n 类真实样本(训练样本),G_class n 表示第n 类生成样本。由图可知,MDACGAN模型生成样本与真实样本的特征更具有相似性。
图5
图5
CWRU 轴承故障数据集生成样本和训练样本 t -SNE 可视化结果
Fig.5
Generated samples and training samples t -SNE visualization results of CWRU bearing fault data set
生成模型训练完成后,即可生成伪样本扩充故障数据集。CWRU轴承故障数据集的扩充和划分如表5 所示。训练集共划分了7个数据集,其中:数据集1和数据集7为真实样本;数据集2至数据集6为混合数据集,即由生成样本与真实样本混合产生,真实样本的基数为50个。采用普通的CNN模型对上述数据集进行测试,其中CNN模型的结构与MDACGAN模型中Classifier模块的网络结构相同。同样由于ACGAN模型所生成图片的问题,只对比了MDACGAN和ACWGAN-GP模型扩充的数据集。其分类结果如表6 所示。
由表6 可知:数据集的数据量对故障诊断的准确率产生了影响,即使是普通的深度学习模型,在数据量充足的情况下,仍能取得较好的分类效果;通过MDACGAN模型生成数据样本扩充的数据集6已有98.00%的准确率,非常接近数据集7的99.75%的准确率。结果表明,生成对抗网络模型对于故障诊断具有较好的辅助作用,且本文提出的MDACGAN模型具有很好的拟合真实样本数据分布的能力。
3.2 实验2
基于XJTU-SY 滚动轴承加速寿命试验数据集的模型验证
3.2.1 数据集介绍与预处理
XJTU-SY数据集是西安交通大学雷亚国教授团队联合浙江长兴昇阳科技有限公司而制作[40 ] 。该数据集包含了3种工况下滚动轴承全寿命周期振动信号。试验中传感器采样频率为25.6 kHz,采样间隔为1 min,采样时长为1.28 s。
本文实验从XJTU-SY数据集中选取了3种工况下的6种故障数据,包含外圈故障、保持架故障和内圈故障等3种故障模式。其数据标签及故障类型如表7 所示。从每种类型的数据样本中,选取水平方向振动信号作为实验数据,数据预处理方法与对CWRU数据集的处理方法相同。将随机抽取连续的4 096个数据点转换为灰度图作为一个样本,选取50个样本用于生成对抗模型的训练,另外选取100个样本作为测试集,用于验证本文方法的有效性。
3.2.2 实验结果对比
与实验1相比,本次实验所采用的模型结构及其参数除了类别和数量不同外,其余完全相同,旨在通过采用不同的数据类别来进一步验证MDACGAN模型对于多故障模式数据样本的生成能力。由于ACGAN模型难以满足本任务要求,只对MDACGAN和ACWGAN-GP模型的生成结果进行对比。2种模型生成的数据样本如图6 所示。同样地,采用D FI 和D MM 指标对生成结果进行测试,结果如表8 和表9 所示。生成样本和真实样本的可视化结果如图7 所示。
图6
图6
不同模型对 XJTU-SY 数据集生成的样本
Fig.6
Samples generated by different models on XJTU-SY data set
图7
图7
XJTU-SY 数据集生成样本和训练样本 t -SNE 可视化结果
Fig.7
Generated samples and training samples t -SNE visualization results of XJTU-SY data set
由图6 可知,2种模型均较好地拟合了真实样本的数据分布,生成的数据样本与真实样本较为接近。由表8 和表9 可知,MDACGAN模型的多故障模式数据样本生成能力优于ACWGAN-GP模型。由图7 可知:ACWGAN-GP模型的生成样本与真实样本的二维特征各类别之间存在混合现象,没有得到很好区分;MDACGAN模型的生成样本与真实样本较好地得到分类,各类别之间也具有差异性。
本次故障诊断实验的数据集划分与CWRU数据集划分模式相同,采用的故障诊断模型仍为CNN模型,网络结构与实验1的诊断任务相同,分类结果如表10 所示。由表可知,数据集的扩充对分类精度有明显的提升作用,同时MDACGAN模型扩充数据集的分类准确率明显高于ACWGAN-GP模型。
3.3 实验3
3.3.1 数据集介绍与预处理
IMS轴承数据集是美国辛辛那提大学李杰教授团队公开的数据集[41 ] 。该数据集包含了3组试验数据。每组试验均测试4个轴承,固定转速为2 000 r/min,试验台记录了轴承整个寿命周期的实测数据。当失效试验结束时,试验1中轴承3出现了内圈缺陷,轴承4出现了滚子元件缺陷;试验2中轴承3发生外圈失效;试验3中轴承3发生外圈失效。本实验选取试验1和试验2的各2组数据、试验3的3组数据,共7组数据。其数据标签及数据类型如表11 所示。数据预处理方法与上述实验相同。将随机抽取的连续4 096个数据点转换为灰度图作为一个样本,选取50个样本用于生成对抗模型的训练,另选取100个样本作为测试集,用于验证本文方法的有效性。
3.3.2 实验结果对比
与上述实验相比,本次实验所采用的模型结构及其参数除了类别数量不同外,其余完全相同。由于ACGAN模型难以满足本任务要求,只对MDACGAN和ACWGAN-GP模型的生成结果进行对比。2种模型生成的数据样本如图8 所示。同样地,采用D FI 和D MM 指标对生成结果进行测试,结果如表12 和表13 所示。生成样本和真实样本的可视化结果如图9 所示。
图8
图8
不同模型对IMS 数据集生成的样本
Fig.8
Samples generated by different models on IMS data set
图9
图9
IMS 数据集生成样本和训练样本 t -SNE 可视化结果
Fig.9
Generated samples and training samples t -SNE visualization results of IMS data set
由图8 可知,2种模型生成的数据样本与真实样本都比较接近,ACWGAN-GP模型的某些类别生成数据与真实样本还存在一定差异。由表12 和表13 可知,MDACGAN模型的生成能力优于ACWGAN-GP模型。由图9 可知,ACWGAN-GP模型的生成样本与真实样本的各类别二维特征并没有很好地聚合在一起,MDACGAN模型的样本区分做得更好。
本次故障诊断实验的数据集划分与上述实验相同,采用的故障诊断模型除分类类别不同外,其余基本相同,分类结果如表14 所示。由表可知,MDACGAN模型所生成样本扩充数据的数据集对分类精度的提升幅度高于ACWGAN-GP模型扩充的数据集对分类精度的提升幅度。
本文选用3个故障数据集来对比本文所提方法与其他方法的实验效果,其中故障类别包含了8类、7类和6类等3种,来验证模型对多种类故障数据分布的拟合能力。从上述实验结果可知,本文所提出的MDACGAN模型具有较好的故障数据分布拟合能力,能生成与真实样本逼近的数据,从而可以扩充数据集以辅助故障诊断,有效提高了故障诊断的准确率。
4 总 结
针对机械设备故障诊断中存在的故障模式复杂、样本缺乏的问题,作者提出了一种多判别器辅助分类器生成对抗网络的数据增强算法。构建了3个判别器、1个生成器和1个分类器作为网络的整体框架;多判别器的设置减小了模型崩溃问题出现的概率;分类器的设置既减小了模型的冗余度,同时进一步增强了分类器的可拓展性。引入Wasserstein距离和LP正则化方法用于设计网络的损失函数,解决了模型训练不稳定的问题;将ECA机制引入分类器,进一步提高了模型的特征提取能力。3个数据集扩充的实验结果表明,MDACGAN模型的数据生成效果优于其他同类型模型,可以用于扩充故障数据集,提高诊断精度。此外,本文所提方法具有较好的拓展性,对于判别器的设计,本文只采用了CNN网络和多层感知器网络,分类器直接采用了CNN网络。对于该网络的设计,可以尝试采用其他深度学习算法,以得到能够满足多种需求的数据生成效果。
作者在未来的研究中,将针对MDACGAN模型在少样本学习和数据不平衡情况下的处理能力进行深入研究,使得其在数据量极少的条件下也能生成较高质量的伪样本,增强模型在特定任务中的有效性。
参考文献
View Option
[1]
ZHONG J , HUANG Y . Time-frequency representation based on an adaptive short-time Fourier transform
[J]. IEEE Transactions on Signal Processing , 2010 , 58 (10 ): 5118 -5128 .
[本文引用: 1]
[2]
TSE P W , PENG Y H , YAM R . Wavelet analysis and envelope detection for rolling element bearing fault diagnosis: Their effectiveness and flexibilities
[J]. Journal of Vibration and Acoustics , 2001 , 123 (3 ): 303 -310 .
[本文引用: 1]
[3]
HUANG N E , SHEN Z , LONG S R , et al . The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis
[J]. Proceedings of the Royal Society of London Series A: Mathematical, Physical and Engineering Sciences , 1998 , 454 : 903 -995 .
[本文引用: 1]
[4]
DRAGOMIRETSKIY K , ZOSSO D . Variational mode decomposition
[J]. IEEE Transactions on Signal Processing , 2013 , 62 (3 ): 531 -544 .
[本文引用: 1]
[5]
ZHANG W , ZHANG F , CHEN W , et al . Fault state recognition of rolling bearing based fully convolutional network
[J]. Computing in Science & Engineering , 2019 , 21 (5 ): 55 -63 .
[本文引用: 1]
[6]
WANG D , GUO Q , SONG Y , et al . Application of multiscale learning neural network based on CNN in bearing fault diagnosis
[J]. Journal of Signal Processing Systems , 2019 , 91 (10 ): 1205 -1217 .
[本文引用: 1]
[7]
HE M , HE D . Deep learning based approach for bearing fault diagnosis
[J]. IEEE Transactions on Industry Applications , 2017 , 53 (3 ): 3057 -3065 .
[本文引用: 1]
[8]
RUAN D , SONG X , GÜHMANN C , et al . Collaborative optimization of CNN and GAN for bearing fault diagnosis under unbalanced datasets
[J/OL]. Lubricants , 2021 , 9 (10 ): 105 [2023-10-20 ]. .
URL
[本文引用: 1]
[9]
XIAO D , HUANG Y , QIN C , et al . Transfer learning with convolutional neural networks for small sample size problem in machinery fault diagnosis
[J]. Proceedings of the Institution of Mechanical Engineers Part C: Journal of Mechanical Engineering Science , 2019 , 233 (14 ): 5131 -5143 .
[本文引用: 1]
[11]
REN S , ZHU W , LIAO B , et al . Selection-based resampling ensemble algorithm for nonstationary imbalanced stream data learning
[J]. Knowledge-Based Systems , 2019 , 163 : 705 -722 .
[本文引用: 1]
[12]
陈保家 ,陈学力 ,肖文荣 ,等 .小样本下滚动轴承故障的多源域迁移诊断方法
[J].电子测量与仪器学报 ,2022 , 36 (2 ): 219 -228 .
[本文引用: 1]
CHEN J B , CHEN X L , XIAO W R , et al . Multi-source domain transfer diagnosis method for rolling bearing faults under small samples
[J]. Journal of Electronic Measurement and Instrumentation , 2022 , 36 (2 ): 219 -228 .
[本文引用: 1]
[13]
吴定会 ,方钦 ,吴楚宜 .基于数据生成与迁移学习的轴承小样本故障诊断
[J].机械传动 ,2020 ,44 (11 ):139 -144 .
[本文引用: 1]
WU D H , FANG Q , WU C Y . Bearing small sample fault diagnosis based on data generation and transfer learning
[J]. Journal of Mechanical Transmission , 2020 , 44 (11 ): 139 -144 .
[本文引用: 1]
[14]
GOODFELLOW I , POUGET-ABADIE J , MIRZA M , et al . Generative adversarial nets
[C]//Proceedings of the 27th International Conference on Neural Information Processing Systems . Montreal, Canada : MIT Press , 2014 : 2672 -2680 .
[本文引用: 2]
[15]
GAO X , DENG F , YUE X . Data augmentation in fault diagnosis based on the Wasserstein generative adversarial network with gradient penalty
[J]. Neurocomputing , 2020 , 396 : 487 -494 .
[本文引用: 1]
[16]
HAN T , LIU C , YANG W , et al . A novel adversarial learning framework in deep convolutional neural network for intelligent diagnosis of mechanical faults
[J]. Knowledge-Based Systems , 2019 , 165 : 474 -487 .
[本文引用: 1]
[17]
ZHOU F , YANG S , FUJITA H , et al . Deep learning fault diagnosis method based on global optimization GAN for unbalanced data
[J]. Knowledge-Based Systems , 2020 , 187 : 104837 .
[本文引用: 1]
[18]
LIU S , CHEN J , QU C , et al . LOSGAN: Latent optimized stable GAN for intelligent fault diagnosis with limited data in rotating machinery
[J]. Measurement Science and Technology , 2021 , 32 (4 ): 045101 .
[本文引用: 1]
[19]
ODENA A , OLAH C , SHLENS J . Conditional image synthesis with auxiliary classifier GANS
[EB/OL]. [2023-10-20 ]. .
URL
[本文引用: 2]
[20]
SHAO S , WANG P , YAN R . Generative adversarial networks for data augmentation in machine fault diagnosis
[J]. Computers in Industry , 2019 , 106 : 85 -93 .
[本文引用: 1]
[21]
卢锦玲 ,张祥国 ,张伟 ,等 .基于改进辅助分类生成对抗网络的风机主轴承故障诊断
[J].电力系统自动化 ,2021 , 45 (7 ):148 -154 . doi:10.7500/AEPS20200415002
DOI:10.7500/AEPS20200415002
[本文引用: 2]
LU J L , ZHANG X G , ZHANG W , et al . Fault diagnosis of main bearing of wind turbine based on improved auxiliary classifier generative adversarial network
[J]. Automation of Electric Power System , 2021 , 45 (7 ): 148 -154 .
DOI:10.7500/AEPS20200415002
[本文引用: 2]
[22]
HUANG N , CHEN Q , CAI G , et al . Fault diagnosis of bearing in wind turbine gearbox under actual operating conditions driven by limited data with noise labels
[J]. IEEE Transactions on Instrumentation and Measurement , 2021 , 70 : 1 -10 .
[本文引用: 1]
[24]
YANG Z K , BU L P , WANG T , et al . Fire image generation based on ACGAN
[C]//The 31th Chinese Control and Decision Conference , Nanchang, Jiangxi, Jun. , 3 -5 , 2019 .
[本文引用: 2]
[25]
DHARANYA V , JOSEPH RAJ A N , GOPI V P . Facial expression recognition through person-wise regeneration of expressions using auxiliary classifier generative adversarial network (AC-GAN) based model
[J]. Journal of Visual Communication and Image Representation , 2021 , 77 : 103110 .
[本文引用: 1]
[26]
LI W , ZHONG X , SHAO H , et al . Multi-mode data augmentation and fault diagnosis of rotating machinery using modified ACGAN designed with new framework
[J]. Advanced Engineering Informatics , 2022 , 52 : 101552 .
[27]
ARJOVSKY M , CHINTALA S , BOTTOU L . Wasserstein generative adversarial networks
[C]//34th International Conference on Machine Learning , Sydney, Australia, Aug. 6 -11 , 2017 .
[本文引用: 3]
[29]
GULRAJANI I , AHMED F , ARJOVSKY M , et al . Improved training of Wasserstein GANS
[EB/OL]. [2023-10-20 ]. .
URL
[本文引用: 3]
[30]
MIRZA M , OSINDERO S . Conditional generative adversarial nets
[J]. Computer Science , 2014 : 2672 -2680 .
[本文引用: 1]
[31]
ODENA A . Semi-supervised learning with generative adversarial networks
[EB/OL]. [2023-10-20 ]. .
URL
[本文引用: 1]
[32]
MORDIDO G , YANG H , MEINEL C . Dropout-GAN: Learning from a dynamic ensemble of discriminators
[J]. arXiv preprint arXiv:, 2018 .
[本文引用: 1]
[33]
WANG Q , WU B , ZHU P , et al . ECA-Net: Efficient channel attention for deep convolutional neural networks
[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition , Seattle, Washington, USA , Jun . 14 -19 . 2020 .
[本文引用: 1]
[34]
PETZKA H , FISCHER A , LUKOVNICOV D . On the regularization of Wasserstein GANS
[J]. arXiv preprint arXiv:, 2017 .
[本文引用: 2]
[35]
SMITH W A , RANDALL R B . Rolling element bearing diagnostics using the Case Western Reserve University data: A benchmark study
[J]. Mechanical Systems and Signal Processing , 2015 , 64/65 : 100 -131 .
[本文引用: 1]
[36]
WEN L , LI X , GAO L , et al . A new convolutional neural network-based data-driven fault diagnosis method
[J]. IEEE Transactions on Industrial Electronics , 2018 , 65 (7 ): 5990 -5998 .
[本文引用: 2]
[37]
HEUSEL M , RAMSAUER H , UNTERTHINER T , et al . GANS trained by a two time-scale update rule converge to a local Nash equilibrium
[C]//NIPS'17: Proceedings of the 31st International Conference on Neural Information Processing Systems , Long Beach, CA, USA, Dec . 4 -9 , 2017 .
[本文引用: 2]
[38]
GRETTON A , BORGWARDT K M , RASCH M J , et al . A kernel two-sample test
[J]. The Journal of Machine Learning Research , 2012 , 13 (1 ): 723 -773 .
[本文引用: 2]
[39]
PEZZOTTI N , LELOEVELDT B P , VAN DER MAATEN L , et al . Approximated and user steerable tSNE for progressive visual analytics
[J]. IEEE Transactions on Visualization and Computer Graphics , 2016 , 23 (7 ): 1739 -1752 .
[本文引用: 1]
[40]
雷亚国 ,韩天宇 ,王彪 ,等 .XJTU-SY滚动轴承加速寿命试验数据集解读
[J].机械工程学报 ,2019 ,55 (16 ):1 -6 . doi:10.3901/jme.2019.16.001
DOI:10.3901/jme.2019.16.001
[本文引用: 1]
LEI Y G , HAN T Y , WANG B , et al . XJTU-SY rolling element bearing accelerated life test datasets: A tutorial
[J]. Journal of Mechanical Engineering , 2019 , 55 (16 ): 1 -6 .
DOI:10.3901/jme.2019.16.001
[本文引用: 1]
[41]
GOUSSEAU W , AANTONI J , GIRARDIN F , et al . Analysis of the rolling element bearing data set of the center for intelligent maintenance systems of the university of Cincinnati
[EB/OL]. [2023-10-20 ]. .
URL
[本文引用: 1]
Time-frequency representation based on an adaptive short-time Fourier transform
1
2010
... 传统的故障诊断方法大多是通过研究设备运行的物理机理来计算故障特征频率,或对运行数据进行特征信号分解,来达到识别故障的目的.常用的方法包括短时傅里叶变换(short-time Fourier transform,STFT)[1 ] 、小波变换[2 ] 、经验模态分解[3 ] 和变分模态分解[4 ] 等.采用上述方法对故障信号进行降噪分离,在设备故障诊断中取得了较好的效果.然而,其只能处理简单且充足的数据信号,且需要人工干预以提取故障特征,难以处理复杂机械设备的故障诊断问题. ...
Wavelet analysis and envelope detection for rolling element bearing fault diagnosis: Their effectiveness and flexibilities
1
2001
... 传统的故障诊断方法大多是通过研究设备运行的物理机理来计算故障特征频率,或对运行数据进行特征信号分解,来达到识别故障的目的.常用的方法包括短时傅里叶变换(short-time Fourier transform,STFT)[1 ] 、小波变换[2 ] 、经验模态分解[3 ] 和变分模态分解[4 ] 等.采用上述方法对故障信号进行降噪分离,在设备故障诊断中取得了较好的效果.然而,其只能处理简单且充足的数据信号,且需要人工干预以提取故障特征,难以处理复杂机械设备的故障诊断问题. ...
The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis
1
1998
... 传统的故障诊断方法大多是通过研究设备运行的物理机理来计算故障特征频率,或对运行数据进行特征信号分解,来达到识别故障的目的.常用的方法包括短时傅里叶变换(short-time Fourier transform,STFT)[1 ] 、小波变换[2 ] 、经验模态分解[3 ] 和变分模态分解[4 ] 等.采用上述方法对故障信号进行降噪分离,在设备故障诊断中取得了较好的效果.然而,其只能处理简单且充足的数据信号,且需要人工干预以提取故障特征,难以处理复杂机械设备的故障诊断问题. ...
Variational mode decomposition
1
2013
... 传统的故障诊断方法大多是通过研究设备运行的物理机理来计算故障特征频率,或对运行数据进行特征信号分解,来达到识别故障的目的.常用的方法包括短时傅里叶变换(short-time Fourier transform,STFT)[1 ] 、小波变换[2 ] 、经验模态分解[3 ] 和变分模态分解[4 ] 等.采用上述方法对故障信号进行降噪分离,在设备故障诊断中取得了较好的效果.然而,其只能处理简单且充足的数据信号,且需要人工干预以提取故障特征,难以处理复杂机械设备的故障诊断问题. ...
Fault state recognition of rolling bearing based fully convolutional network
1
2019
... 近年来,人工智能成为学术界研究热点之一,学者们将其中多种算法框架引入故障诊断中,而深度学习方法凭借其强大的特征提取能力、多样化的下游任务处理能力、端到端任务处理能力等优势,成为故障诊断领域的主流工具之一.Zhang等[5 ] 提出了一种深度全卷积神经网络模型,可用以提取由振动信号转换的光谱图数据特征而完成故障分类;Wang等[6 ] 基于卷积神经网络(convolutional neural network, CNN)提出了一种多尺度学习神经网络,提高了故障数据特征的提取能力;He等[7 ] 利用STFT得到频谱矩阵,采用优化的大容量记忆存储与检索模型完成了故障诊断.虽然采用上述诊断方法都取得了一定效果,但都是以具有质量好且样本充足的故障数据为前提的[8 ] .在实际工程中,工况环境复杂,机械设备的故障诊断数据难以充分获取,深度学习模型的泛化能力大大降低[9 ] ,导致出现过拟合等问题.因此,利用少量的故障样本训练出能够精确识别故障类别的深度学习智能诊断模型,是故障诊断研究中的重点课题[10 ] . ...
Application of multiscale learning neural network based on CNN in bearing fault diagnosis
1
2019
... 近年来,人工智能成为学术界研究热点之一,学者们将其中多种算法框架引入故障诊断中,而深度学习方法凭借其强大的特征提取能力、多样化的下游任务处理能力、端到端任务处理能力等优势,成为故障诊断领域的主流工具之一.Zhang等[5 ] 提出了一种深度全卷积神经网络模型,可用以提取由振动信号转换的光谱图数据特征而完成故障分类;Wang等[6 ] 基于卷积神经网络(convolutional neural network, CNN)提出了一种多尺度学习神经网络,提高了故障数据特征的提取能力;He等[7 ] 利用STFT得到频谱矩阵,采用优化的大容量记忆存储与检索模型完成了故障诊断.虽然采用上述诊断方法都取得了一定效果,但都是以具有质量好且样本充足的故障数据为前提的[8 ] .在实际工程中,工况环境复杂,机械设备的故障诊断数据难以充分获取,深度学习模型的泛化能力大大降低[9 ] ,导致出现过拟合等问题.因此,利用少量的故障样本训练出能够精确识别故障类别的深度学习智能诊断模型,是故障诊断研究中的重点课题[10 ] . ...
Deep learning based approach for bearing fault diagnosis
1
2017
... 近年来,人工智能成为学术界研究热点之一,学者们将其中多种算法框架引入故障诊断中,而深度学习方法凭借其强大的特征提取能力、多样化的下游任务处理能力、端到端任务处理能力等优势,成为故障诊断领域的主流工具之一.Zhang等[5 ] 提出了一种深度全卷积神经网络模型,可用以提取由振动信号转换的光谱图数据特征而完成故障分类;Wang等[6 ] 基于卷积神经网络(convolutional neural network, CNN)提出了一种多尺度学习神经网络,提高了故障数据特征的提取能力;He等[7 ] 利用STFT得到频谱矩阵,采用优化的大容量记忆存储与检索模型完成了故障诊断.虽然采用上述诊断方法都取得了一定效果,但都是以具有质量好且样本充足的故障数据为前提的[8 ] .在实际工程中,工况环境复杂,机械设备的故障诊断数据难以充分获取,深度学习模型的泛化能力大大降低[9 ] ,导致出现过拟合等问题.因此,利用少量的故障样本训练出能够精确识别故障类别的深度学习智能诊断模型,是故障诊断研究中的重点课题[10 ] . ...
Collaborative optimization of CNN and GAN for bearing fault diagnosis under unbalanced datasets
1
2021
... 近年来,人工智能成为学术界研究热点之一,学者们将其中多种算法框架引入故障诊断中,而深度学习方法凭借其强大的特征提取能力、多样化的下游任务处理能力、端到端任务处理能力等优势,成为故障诊断领域的主流工具之一.Zhang等[5 ] 提出了一种深度全卷积神经网络模型,可用以提取由振动信号转换的光谱图数据特征而完成故障分类;Wang等[6 ] 基于卷积神经网络(convolutional neural network, CNN)提出了一种多尺度学习神经网络,提高了故障数据特征的提取能力;He等[7 ] 利用STFT得到频谱矩阵,采用优化的大容量记忆存储与检索模型完成了故障诊断.虽然采用上述诊断方法都取得了一定效果,但都是以具有质量好且样本充足的故障数据为前提的[8 ] .在实际工程中,工况环境复杂,机械设备的故障诊断数据难以充分获取,深度学习模型的泛化能力大大降低[9 ] ,导致出现过拟合等问题.因此,利用少量的故障样本训练出能够精确识别故障类别的深度学习智能诊断模型,是故障诊断研究中的重点课题[10 ] . ...
Transfer learning with convolutional neural networks for small sample size problem in machinery fault diagnosis
1
2019
... 近年来,人工智能成为学术界研究热点之一,学者们将其中多种算法框架引入故障诊断中,而深度学习方法凭借其强大的特征提取能力、多样化的下游任务处理能力、端到端任务处理能力等优势,成为故障诊断领域的主流工具之一.Zhang等[5 ] 提出了一种深度全卷积神经网络模型,可用以提取由振动信号转换的光谱图数据特征而完成故障分类;Wang等[6 ] 基于卷积神经网络(convolutional neural network, CNN)提出了一种多尺度学习神经网络,提高了故障数据特征的提取能力;He等[7 ] 利用STFT得到频谱矩阵,采用优化的大容量记忆存储与检索模型完成了故障诊断.虽然采用上述诊断方法都取得了一定效果,但都是以具有质量好且样本充足的故障数据为前提的[8 ] .在实际工程中,工况环境复杂,机械设备的故障诊断数据难以充分获取,深度学习模型的泛化能力大大降低[9 ] ,导致出现过拟合等问题.因此,利用少量的故障样本训练出能够精确识别故障类别的深度学习智能诊断模型,是故障诊断研究中的重点课题[10 ] . ...
数据驱动的经编机横移机构故障检测方法研究
1
2022
... 近年来,人工智能成为学术界研究热点之一,学者们将其中多种算法框架引入故障诊断中,而深度学习方法凭借其强大的特征提取能力、多样化的下游任务处理能力、端到端任务处理能力等优势,成为故障诊断领域的主流工具之一.Zhang等[5 ] 提出了一种深度全卷积神经网络模型,可用以提取由振动信号转换的光谱图数据特征而完成故障分类;Wang等[6 ] 基于卷积神经网络(convolutional neural network, CNN)提出了一种多尺度学习神经网络,提高了故障数据特征的提取能力;He等[7 ] 利用STFT得到频谱矩阵,采用优化的大容量记忆存储与检索模型完成了故障诊断.虽然采用上述诊断方法都取得了一定效果,但都是以具有质量好且样本充足的故障数据为前提的[8 ] .在实际工程中,工况环境复杂,机械设备的故障诊断数据难以充分获取,深度学习模型的泛化能力大大降低[9 ] ,导致出现过拟合等问题.因此,利用少量的故障样本训练出能够精确识别故障类别的深度学习智能诊断模型,是故障诊断研究中的重点课题[10 ] . ...
数据驱动的经编机横移机构故障检测方法研究
1
2022
... 近年来,人工智能成为学术界研究热点之一,学者们将其中多种算法框架引入故障诊断中,而深度学习方法凭借其强大的特征提取能力、多样化的下游任务处理能力、端到端任务处理能力等优势,成为故障诊断领域的主流工具之一.Zhang等[5 ] 提出了一种深度全卷积神经网络模型,可用以提取由振动信号转换的光谱图数据特征而完成故障分类;Wang等[6 ] 基于卷积神经网络(convolutional neural network, CNN)提出了一种多尺度学习神经网络,提高了故障数据特征的提取能力;He等[7 ] 利用STFT得到频谱矩阵,采用优化的大容量记忆存储与检索模型完成了故障诊断.虽然采用上述诊断方法都取得了一定效果,但都是以具有质量好且样本充足的故障数据为前提的[8 ] .在实际工程中,工况环境复杂,机械设备的故障诊断数据难以充分获取,深度学习模型的泛化能力大大降低[9 ] ,导致出现过拟合等问题.因此,利用少量的故障样本训练出能够精确识别故障类别的深度学习智能诊断模型,是故障诊断研究中的重点课题[10 ] . ...
Selection-based resampling ensemble algorithm for nonstationary imbalanced stream data learning
1
2019
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
小样本下滚动轴承故障的多源域迁移诊断方法
1
2022
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
小样本下滚动轴承故障的多源域迁移诊断方法
1
2022
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
基于数据生成与迁移学习的轴承小样本故障诊断
1
2020
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
基于数据生成与迁移学习的轴承小样本故障诊断
1
2020
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
Generative adversarial nets
2
2014
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
... GAN的目标函数表示如下[14 ] : ...
Data augmentation in fault diagnosis based on the Wasserstein generative adversarial network with gradient penalty
1
2020
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
A novel adversarial learning framework in deep convolutional neural network for intelligent diagnosis of mechanical faults
1
2019
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
Deep learning fault diagnosis method based on global optimization GAN for unbalanced data
1
2020
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
LOSGAN: Latent optimized stable GAN for intelligent fault diagnosis with limited data in rotating machinery
1
2021
... 因此,诸多学者提出了一系列方法.如:Ren等[11 ] 采用过采样方法,通过直接复制数据生成更多的样本,在一定程度上解决了数据量小的问题,但由于没有引入新的数据信息,同样会导致模型过拟合、泛化能力差等问题;陈保家等[12 ] 、吴定会等[13 ] 利用迁移学习方法,采用相近源域的数据依次对模型进行预训练,采用目标域数据对预训练模型进行微调,来提高识别目标域的精度,但不一定能找到相近源域的数据集;Goodfellow等[14 ] 提出了生成对抗网络(generative adversarial nets, GAN)模型,通过生成器与判别器的相互对抗训练,拟合真实样本的数据分布,并且通过生成器生成与真实数据相似的新数据,为解决故障诊断中的小样本问题提供了一种新的手段;Gao等[15 ] 采用带有梯度惩罚的Wasserstein GAN(WGAN)模型来降低训练的不稳定性,补充故障数据量不足的数据集;Han等[16 ] 将对抗性学习作为正则化条件加入CNN中,用于提高训练模型的泛化能力;Zhou等[17 ] 基于自动编码器设计生成器,用故障特征与诊断误差指导生成器训练;Liu等[18 ] 提出了一种基于稀疏半监督学习的GAN模型,可以利用大量未标记的数据提高标记训练部分的准确率.上述生成算法对故障数据集的扩充有较好的效果,但是在实际工况下机械设备的故障种类复杂,由于鉴别器的特性,上述算法只能做二分类即判断数据是真实的还是生成的,不能区分数据所属的故障模式,导致生成器很难拟合不同种类的数据分布,同样也不能控制生成的数据模式.因此,针对多种故障模式的数据集,需要根据具体的数据种类调整超参数来训练多个模型,这大幅降低了故障诊断的效率. ...
Conditional image synthesis with auxiliary classifier GANS
2
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
... ACGAN是GAN的一种变体,同时具有条件生成对抗网络(conditional GAN, CGAN)[30 ] 和半监督学习生成对抗网络(semi-supervised learning GAN, SGAN)[31 ] 的特点,能够在生成符合特定条件的数据时输出其所属的类别.ACGAN的框架如图1 (b)所示.生成器的输入噪声嵌入了标签信息,因此能够生成带标签的数据;判别器可判别真假数据源和区分数据类别信息.由于引入了标签信息,ACGAN的目标函数包含两个部分,分别如式(7) 和式(8) 所示[19 ] : ...
Generative adversarial networks for data augmentation in machine fault diagnosis
1
2019
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
基于改进辅助分类生成对抗网络的风机主轴承故障诊断
2
2021
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
... 生成器和判别器的目标函数分别为[21 ] : ...
基于改进辅助分类生成对抗网络的风机主轴承故障诊断
2
2021
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
... 生成器和判别器的目标函数分别为[21 ] : ...
Fault diagnosis of bearing in wind turbine gearbox under actual operating conditions driven by limited data with noise labels
1
2021
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
负载不平衡下小样本数据的轴承故障诊断
1
2021
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
负载不平衡下小样本数据的轴承故障诊断
1
2021
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
Fire image generation based on ACGAN
2
2019
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
... 当然,肉眼的评判并不全面客观,本文采用弗雷歇感知距离D FI [37 ] 和最大均值差异D MM [38 ] 两种评价指标来评判所生成图片的质量,同时与ACGAN、ACWGAN-GP[24 ] 两种模型所生成的图片进行对比. ...
Facial expression recognition through person-wise regeneration of expressions using auxiliary classifier generative adversarial network (AC-GAN) based model
1
2021
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
Multi-mode data augmentation and fault diagnosis of rotating machinery using modified ACGAN designed with new framework
2022
Wasserstein generative adversarial networks
3
11
... 针对上述问题,学者们引入辅助分类器生成对抗网络(auxiliary classifier GAN,ACGAN)[19 ] 模型来扩充多模故障数据集,将标签信息嵌入生成器的输入噪声中,并扩展了判别器的能力,使判别器既能进行真假判别,又可对数据进行类别分类.由于有标签信息嵌入,生成器可以生成带标签信息的数据,对于多模故障数据集,可以将其一次性输入模型中,生成对应故障模式的数据.Shao等[20 ] 开发了一种基于ACGAN的框架,用于从机械故障信号中学习并生成近似的一维原始数据,以扩充原始数据集;卢锦玲等[21 ] 将梯度惩罚引入ACGAN模型,并在判别器中引入池化层,提升了ACGAN模型的学习稳定性和特征提取能力,用于补充平衡风电机组的轴承故障数据;Huang等[22 ] 提出了一种改进的鲁棒多标签GAN,提高了模型的泛化能力,用于扩充风力机齿轮箱的故障数据.上述方法将ACGAN模型用于多模故障数据集的扩充,改善了原有诊断模型泛化能力差的状况.然而,GAN及其变体的网络都应用于图像领域,上述方法主要将GAN模型应用于一维信号数据的扩充,并不能很好地发挥GAN模型生成数据的能力[23 ] .在图像领域,Yang等[24 ] 为了解决火灾图片数据集难以获取的问题,基于信息最大化生成对抗网络(information maximizing GAN, InfoGAN)和ACGAN提出了一种用于生成火灾图像的GAN模型;Dharanya等[25 ] 针对人脸表情识别,提出了一种基于ACGAN的新模型,该模型的生成器采用U-Net架构,鉴别器采用胶囊网络,以提高特征提取能力,采用该模型可对多种表情进行分类;Li等[27 ] 将Wassertein距离引入损失函数中,改善了模型训练问题,并添加了独立的分类器,构建了新的ACGAN框架,用于旋转机械部件的故障诊断,但随着类别数的增加,ACGAN生成样本的质量与多样性都会降低,限制了其对大规模数据的处理能力. ...
... 在模型的实际训练中存在着梯度消失和模型崩溃的问题,其原因是式(1) 的度量模式为Jensen-Shannon divergence(JS散度).在训练之初,P r 与P g 在高维空间产生重叠,导致JS散度无法产生梯度,即梯度消失,从而导致模型无法得到训练.为此,Arjovsky等[27 ] 将Wasserstein距离引入目标函数,提出了WGAN,以解决JS散度度量模式无法提供训练梯度的问题.Wasserstein距离的定义如下[27 ] : ...
... [27 ]: ...
生成对抗网络研究综述
1
2021
... 但由于i n f γ ~ ∏ ( P r , P g ) 不能直接求解,须截断以限制判别器网络权值的取值范围,即满足Lipschitz连续条件,以近似计算Wasserstein距离.采用权值截断会使大部分权值落在截断的边界上,导致无法获得梯度,进而可能导致模式崩溃[28 ] .改进WGAN即WGAN-GP[29 ] 采用由L2梯度惩罚项替换权值截断的方法解决上述问题.L2梯度惩罚项满足WGAN中的Lipschitz连续性条件,同时避免了权值截断导致的权重集中在边界上的问题,提高了模型的训练稳定性和灵活性. ...
生成对抗网络研究综述
1
2021
... 但由于i n f γ ~ ∏ ( P r , P g ) 不能直接求解,须截断以限制判别器网络权值的取值范围,即满足Lipschitz连续条件,以近似计算Wasserstein距离.采用权值截断会使大部分权值落在截断的边界上,导致无法获得梯度,进而可能导致模式崩溃[28 ] .改进WGAN即WGAN-GP[29 ] 采用由L2梯度惩罚项替换权值截断的方法解决上述问题.L2梯度惩罚项满足WGAN中的Lipschitz连续性条件,同时避免了权值截断导致的权重集中在边界上的问题,提高了模型的训练稳定性和灵活性. ...
Improved training of Wasserstein GANS
3
... 但由于i n f γ ~ ∏ ( P r , P g ) 不能直接求解,须截断以限制判别器网络权值的取值范围,即满足Lipschitz连续条件,以近似计算Wasserstein距离.采用权值截断会使大部分权值落在截断的边界上,导致无法获得梯度,进而可能导致模式崩溃[28 ] .改进WGAN即WGAN-GP[29 ] 采用由L2梯度惩罚项替换权值截断的方法解决上述问题.L2梯度惩罚项满足WGAN中的Lipschitz连续性条件,同时避免了权值截断导致的权重集中在边界上的问题,提高了模型的训练稳定性和灵活性. ...
... L2梯度惩罚项定义为[29 ] : ...
... WGAN-GP的目标函数如下[29 ] : ...
Conditional generative adversarial nets
1
2014
... ACGAN是GAN的一种变体,同时具有条件生成对抗网络(conditional GAN, CGAN)[30 ] 和半监督学习生成对抗网络(semi-supervised learning GAN, SGAN)[31 ] 的特点,能够在生成符合特定条件的数据时输出其所属的类别.ACGAN的框架如图1 (b)所示.生成器的输入噪声嵌入了标签信息,因此能够生成带标签的数据;判别器可判别真假数据源和区分数据类别信息.由于引入了标签信息,ACGAN的目标函数包含两个部分,分别如式(7) 和式(8) 所示[19 ] : ...
Semi-supervised learning with generative adversarial networks
1
... ACGAN是GAN的一种变体,同时具有条件生成对抗网络(conditional GAN, CGAN)[30 ] 和半监督学习生成对抗网络(semi-supervised learning GAN, SGAN)[31 ] 的特点,能够在生成符合特定条件的数据时输出其所属的类别.ACGAN的框架如图1 (b)所示.生成器的输入噪声嵌入了标签信息,因此能够生成带标签的数据;判别器可判别真假数据源和区分数据类别信息.由于引入了标签信息,ACGAN的目标函数包含两个部分,分别如式(7) 和式(8) 所示[19 ] : ...
Dropout-GAN: Learning from a dynamic ensemble of discriminators
1
2018
... ACGAN将标签信息嵌入生成器的输入噪声中,同时进一步扩展了判别器的判别与分类能力.然而,与原始GAN一样,ACGAN同样存在训练不稳定、模型崩溃等问题.模型崩溃即生成器学习到了某种特殊的条件参数,此时生成器生成的假样本可以轻松骗过判别器.实际上生成器并不是真正地拟合真实的数据分布,而仅仅是某种特殊条件促使其生成相同的样本,可能会导致生成样本模式的缺失[32 ] .因此,本文提出了MDACGAN模型,通过设计多个判别器来避免生成器学习到欺骗判别器的特殊条件,以解决模型崩溃问题.MDACGAN框架如图2 所示.模型设计细节如下: ...
ECA-Net: Efficient channel attention for deep convolutional neural networks
1
... 3)为了进一步提高模型提取特征的能力,在分类器中添加了ECA[33 ] .该模块的特点是参数量相比其他注意力模块少. ...
On the regularization of Wasserstein GANS
2
2017
... 后续经过实验发现,随着样本类别数量的增加,生成样本的质量会急剧下降,训练不稳定等情况会出现.Petzka等[34 ] 改进了梯度惩罚机制,提出了单边惩罚方法,只惩罚梯度范数大于1的部分,其定义如下[34 ] : ...
... [34 ]: ...
Rolling element bearing diagnostics using the Case Western Reserve University data: A benchmark study
1
2015
... 采用美国凯斯西储大学(Case Western Reserve University,CWRU)公开的轴承故障数据集[35 ] .该数据集包含3种电火花引起的轴承损伤数据,损伤直径分别为0.178,0.356,0.533 mm,损伤点设置在3点钟、6点钟、12点钟等3个位置,包含内圈、滚动体、外圈等3种故障模式及0级、1级、2级、3级等4级负载.振动信号由16通道数据记录仪采集得到,采样频率分别为12, 48 kHz. ...
A new convolutional neural network-based data-driven fault diagnosis method
2
2018
... 本文采用一种由一维振动信号转换成二维灰度图的数据预处理方法[36 ] .由于将数据信号由一维转换为二维,可以采用在图像领域表现优异的二维卷积核对原始数据进行特征提取.该转换方法可以表示为[36 ] : ...
... [36 ]: ...
GANS trained by a two time-scale update rule converge to a local Nash equilibrium
2
2017
... 当然,肉眼的评判并不全面客观,本文采用弗雷歇感知距离D FI [37 ] 和最大均值差异D MM [38 ] 两种评价指标来评判所生成图片的质量,同时与ACGAN、ACWGAN-GP[24 ] 两种模型所生成的图片进行对比. ...
... D FI 为真实图片与生成图片在特征层面的距离,本质上是采用均值和协方差矩阵计算2个分布之间的距离.D FI 表示为[37 ] : ...
A kernel two-sample test
2
2012
... 当然,肉眼的评判并不全面客观,本文采用弗雷歇感知距离D FI [37 ] 和最大均值差异D MM [38 ] 两种评价指标来评判所生成图片的质量,同时与ACGAN、ACWGAN-GP[24 ] 两种模型所生成的图片进行对比. ...
... 同时,引入另一种度量分布差异的指标D MM ,其在希尔伯特空间度量2个分布的差异.所以,可以用D MM 度量真实训练数据集分布P r 与生成数据集分布P g 之间的距离.D MM 值越小,则2个分布越接近,从而反映模型的生成效果越好.D MM 表示为[38 ] : ...
Approximated and user steerable tSNE for progressive visual analytics
1
2016
... 为了进一步验证生成样本与真实样本的相似性,本文采用t 分布随机邻域嵌入(t -distributed stochastic neighbor embedding,t -SNE)[39 ] 方法对生成样本和真实样本进行降维可视化.ACGAN模型训练时发生崩溃,生成了相同的图片,因此没有进行比较分析.生成样本和真实样本的可视化结果如图5 所示.图中,R_class n 表示第n 类真实样本(训练样本),G_class n 表示第n 类生成样本.由图可知,MDACGAN模型生成样本与真实样本的特征更具有相似性. ...
XJTU-SY滚动轴承加速寿命试验数据集解读
1
2019
... XJTU-SY数据集是西安交通大学雷亚国教授团队联合浙江长兴昇阳科技有限公司而制作[40 ] .该数据集包含了3种工况下滚动轴承全寿命周期振动信号.试验中传感器采样频率为25.6 kHz,采样间隔为1 min,采样时长为1.28 s. ...
XJTU-SY滚动轴承加速寿命试验数据集解读
1
2019
... XJTU-SY数据集是西安交通大学雷亚国教授团队联合浙江长兴昇阳科技有限公司而制作[40 ] .该数据集包含了3种工况下滚动轴承全寿命周期振动信号.试验中传感器采样频率为25.6 kHz,采样间隔为1 min,采样时长为1.28 s. ...
Analysis of the rolling element bearing data set of the center for intelligent maintenance systems of the university of Cincinnati
1
... IMS轴承数据集是美国辛辛那提大学李杰教授团队公开的数据集[41 ] .该数据集包含了3组试验数据.每组试验均测试4个轴承,固定转速为2 000 r/min,试验台记录了轴承整个寿命周期的实测数据.当失效试验结束时,试验1中轴承3出现了内圈缺陷,轴承4出现了滚子元件缺陷;试验2中轴承3发生外圈失效;试验3中轴承3发生外圈失效.本实验选取试验1和试验2的各2组数据、试验3的3组数据,共7组数据.其数据标签及数据类型如表11 所示.数据预处理方法与上述实验相同.将随机抽取的连续4 096个数据点转换为灰度图作为一个样本,选取50个样本用于生成对抗模型的训练,另选取100个样本作为测试集,用于验证本文方法的有效性. ...