修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测
Unsupervised surface defect detection of magnetic tile for repair of suspected area defects
收稿日期: 2023-06-27
基金资助: |
|
Received: 2023-06-27
Fund supported: | 国家重点研发计划资助项目(2018YFC0808300);陕西省科技计划重点产业创新链(群)项目(2020ZDLGY15-07). |
作者简介 About authors
唐善成(1975—),男,副教授,从事人工智能、深度学习及自然语言理解研究.orcid.org/0009-0000-8458-9657.E-mail:
磁瓦表面缺陷样本数量少,异常视觉特征分布发散,现有依赖目标特征的有监督检测方法不能有效检测未定义缺陷;磁瓦表面正常纹理呈非均匀且非周期性分布,使得经典重构网络难以准确地重构磁瓦表面正常特征,导致相关无监督检测方法性能低下. 为此,采用多头注意力增强的掩码图像修复网络(MIINet),长距离提取图像特征,捕捉全局信息,增强图像修复的能力;引入视觉显著性算法抑制磁瓦表面纹理信息和突显缺陷区域,以便二值化算法精准分割缺陷嫌疑区域;利用MIINet修复待检测图像缺陷嫌疑区域,选用修复前后图像的残差图像和结构相似性实现缺陷检测与缺陷判定. 与经典无监督方法相比,修复缺陷嫌疑区域的表面缺陷检测方法的准确率提升了2.36%,F1值提升了1.62%.
关键词:
The number of magnetic tiles with surface defects is limited, and abnormal visual features are diversely distributed. The existing supervised detection methods that rely on target features cannot effectively detect undefined defects. The non-uniform and non-periodic distribution of normal texture on the surface of magnetic tiles makes it difficult for classical reconstruction networks to accurately reconstruct the normal features, resulting in poor performance of related unsupervised detection methods. The multi-head attention-based masked image inpaint network (MIINet) was utilized to extract image features over long distances, capture global information and enhance the repair capability of images. The vision saliency algorithm was used to suppress the texture information of the magnetic tile surface and emphasize the defect area, enabling the binary value algorithm to accurately segment the suspected defect region. MIINet was utilized to repair the suspected defect region in the image. The residual image and structural similarity of the before and after repair images were selected to achieve defect detection and defect judgment. Compared with the classical unsupervised method, the accuracy of the proposed surface defect detection method for repairing the suspected defect area was increased by 2.36%, and the F1 value was increased by 1.62%.
Keywords:
本文引用格式
唐善成, 逯建辉, 张莹, 金子成, 赵安新.
TANG Shancheng, LU Jianhui, ZHANG Ying, JIN Zicheng, ZHAO Anxin.
磁瓦作为永磁直流电机的重要组成元件,被广泛应用在永磁电机中. 受到生产工艺的影响,磁瓦表面容易形成漏洞、裂纹、漏角、起级、断块等缺陷,这些表面缺陷严重影响磁瓦寿命和性能. 随着工业生产的自动化,基于深度学习的表面缺陷检测在产品质量控制中发挥着越来越重要的作用,主要分为有监督学习和无监督学习检测方法.
一些学者利用不同有监督学习方法检测磁瓦表面缺陷. Huang等[1]提出专门用于表面缺陷检测的显著性实时模型MCuePush U-Net,在磁瓦数据集上,能够从低对比度图像中准确检测出多个表面缺陷,有效地将单张图片的检测时间从0.50 s降低到0.07 s. Cui等[2]提出的表面缺陷检测网络SDDNet快速准确,对微小缺陷的检测效果较好. Liu等[3]将二元网络引入表面缺陷检测领域,提出利用低位宽的二进制卷积层和激活层的网络Bi-ShuffleNet和U-BiNet,并将所提网络串联后应用在MT和NEU数据集上,与BiRealNet、ReActNet-A模型相比,模型所需计算量(operations per second,OPs)最小,精度少量下降. Tang等[4]提出融合高分辨率特征和多尺度特征的表面缺陷语义分割网络,该网络能够准确检测缺陷并精准定位缺陷边界. Ling等[5]提出的基于多头自注意力和自监督学习(SSL-VIT)的磁瓦表面缺陷检测方法,可以准确定位一个或者多个缺陷,测试精度高达98.5%. 刘培勇等[6]提出的基于卷积神经网络的磁瓦表面缺陷检测算法,在MT数据集上的检测精度达到99.90%. 卞佰成等[7]改进YOLOv3主干网络,引入SPP模块和SE模块,提升了模型的检测能力. Hou等[8]在YOLOv5s中引入Res-Head和Drop-CA,以增强不同层结构之间的特征融合,缓解了模型过于关注缺陷目标的问题. 以上方法虽然能够实现高精度检测,但是实际工况中通常磁瓦表面缺陷样本数量较少,而且异常视觉特征分布发散,现有依赖目标特征的有监督检测方法不能有效检测未定义缺陷[9].
针对有监督方法的弊端,学者开展了无监督方法研究,主要使用自编码器[10]和生成对抗网络[11]2种类型的重构网络. Mi等[12]在GAN的基础上加入注意力机制,使模型能够更好地理解全局信息. Guo等[13]基于cycleGAN构建无监督小样本缺陷检测模型,该模型可以在未标记训练数据不到1/3的情况下获得高的检测精度和精准的缺陷曲线. Wei等[14]基于GAN提出DCGAN的多级无监督织物缺陷检测方法,方法包含3个阶段:GAN训练、编码器训练和分类器训练,每个阶段采用单独的训练策略. 景海钊等[15]提出基于密集残差块的GAN超分辨率重建方法,有效实现了空间目标AO图像的清晰化重建,降低了重建图像的伪影,丰富了图像细节. 唐善成等[16]在VAE编解码器中融入注意力机制,增强了模型提取压敏电阻表面特征能力,实现了压敏电阻高精度检测. Wei等[17]在AE和VAE编解码网络中引入平均结构相似度(MSSIM)作为网络训练损失函数,仅使用L-p距离损失函数进行图像亮度比较. Liu等[18]基于AE编解码网络提出卷积自编码器网络(RCCAEN),与标准自编码器(AE)相比,RCCAEN可以提高系统的实时性和恢复图像边缘的模糊性. 上述图像重建网络应用于表面纹理分布均匀且周期性的图像时的重建效果良好,应用于表面纹理分布呈现非均匀和非周期性特征的图像时的重建能力不足.
针对以上问题,本研究提出修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测方法. 该检测方法综合无监督检测方法只需要无缺陷样本的优点,能够解决磁瓦表面缺陷数据量少、异常视觉特征发散的问题,可以减少对人工标注数据样本的依赖.为了解决传统图像重构网络无法长距离分析图像特征的问题,引入多头注意力机制构建图像修复模型,提升模型修复图像表面纹理细节的能力. 通过实验证明所提检测方法的可行性与有效性.
1. 修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测
修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测框架如图1所示,包括无缺陷磁瓦表面特征提取、缺陷嫌疑区域定位、磁瓦表面缺陷检测3个阶段. 1)无缺陷磁瓦表面特征提取:掩码图像修复网络(masked image inpaint network,MIINet)训练阶段输入为无缺陷图像. 首先将输入图像分割成指定大小的图像块;再随机生成掩码图像,根据掩码区域移除输入图像中对应位置的图像块,得到输入图像;然后将输入图像输入编码器进行编码,并在编码特征向量中嵌入共享特征向量,输入解码器预测被移除图像块;最后以修复图像与标签图像之间的均方误差值作为模型损失. 2)缺陷嫌疑区域定位:任意图像具备显著性特征,磁瓦图像缺陷区域显著性尤为突出. 首先利用显著性算法分析磁瓦图像表面特征信息,得到显著特征图;然后使用二值化对显著特征图进行阈值分割,确定缺陷嫌疑区域;最后对缺陷嫌疑区域进行分块定位. 3)磁瓦表面缺陷检测:首先向模型输入无缺陷图像,得到修复图像,修复前后图像相减,得到差分图像;再基于
图 1
图 1 修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测
Fig.1 Unsupervised surface defect detection of magnetic tile for repair of suspected area defects
1.1. 无缺陷磁瓦表面特征提取
MIINet的结构如图2所示. 首先通过块嵌入层将输入图像分割为196块同等大小的图像块,并将二维图像块展平为一维特征向量;然后随机丢弃固定比例特征向量,并在保留的特征向量中嵌入类别编码和位置编码,通过依赖多头注意力机制的编码器,长距离捕获不同维度下的图像特征,加权融合得到图像本质特征隐向量
图 2
1.1.1. 掩码策略
首先模型会随机生成一张掩码图像,掩码比率为75%[19],该掩码比率能够获得最佳的模型训练效果;然后将输入图像分割成规则的非重叠图像块;最后根据掩码区域移除输入图像中对应位置的图像块. 这种随机掩码的训练方式可以让重建任务多样化,有效增强模型的重构能力.
1.1.2. 块嵌入层
通过降维函数Flatten展平
随机生成掩码图像,根据掩码区域移除
嵌入位置编码
式中:
1.1.3. 编码器
式中:
式中:
每次
式中:
1.1.4. 解码器
在对编码器输出向量进行一系列处理后,输入解码器预测被丢弃特征向量,得到输出图像,具体流程如下. 1)通过线性层对输入数据进行维度转换,表示为
式中:
1.1.5. 模型损失
MIINet训练中的损失函数
式中:
1.2. 缺陷嫌疑区域定位
1.2.1. 视觉显著性特征分析
鉴于磁瓦表面复杂的纹理信息,采用基于空间尺度差异显著性[22]算法从多个尺度分析图像特征信息,获得不同尺度图像之间的像素关系,平衡不同尺度图像的权重,抑制纹理信息的显著特征,突显缺陷区域显著特征. 算法流程如下:1)使用2次3×3窗口的高斯滤波器,平滑原始磁瓦图像,得到灰度图像
给定任何矩形区域(对角顶点为
3)利用中心-周围方法计算12个多尺寸显著特征图. 具体计算步骤为a)计算全部矩形窗口尺寸,
式中:
c)依次计算每个显著特征图的每个像素,
式中:
1.2.2. 缺陷嫌疑区域确定
在磁瓦图像中,无缺陷区域也存在显著特征. 为了消除这些特征,对无缺陷图像的显著特征值进行统计分析,得到其分布区间;再采用阈值分割的方法来消除这些信息. 如图3所示,统计无缺陷显著特征图的像素分布情况,得到其像素分布柱状图,表示为
图 3
图 3 无缺陷磁瓦显著特征分析
Fig.3 Analysis of saliency characteristics of defect-free magnetic tiles
式中:
式中:
1.3. 磁瓦表面缺陷检测
1.3.1. 磁瓦表面缺陷检测流程
磁瓦表面缺陷检测流程如图4所示,具体检测流程如下. 1)将待检测图像分为16×16的图像块,根据掩码图像移除待检图像中被掩蔽的图像块(包括嫌疑缺陷);2)将步骤1)得到的结果输入MIINet,修复缺陷嫌疑区域,得到修复图像;3)将待检测图像与修复图像进行“减”操作,得到差分图像;4)对差分图像进行形态学处理,滤除图像中的小噪点;5)对步骤4)得到的结果进行阈值判断. 若结果为无缺陷图像,则输出检测结果;若结果为有缺陷图像,则进一步判定缺陷区域并输出检测结果.
图 4
1.3.2. 磁瓦表面缺陷检测
“减”操作的表达式为
式中:
图 5
图 5 磁瓦修复前后的差分图像
Fig.5 Differential image before and after magnetic tile repair
式中:
式中:
1.3.3. 缺陷区域判定
如图6所示,为了消除差分图像中残留的非缺陷区域,并确定缺陷区域的轮廓,对差分图像进行进一步检测,算法具体流程如下. 1)对比待检测图像与修复图像结构相似度,得到结构相似度热力图,热力图中灰度像素值越高,图像结构相似度越低,计算式为
图 6
式中:
式中:
2. 实验结果与分析
2.1. 实验环境
处理器为64位Win10、Intel(R) Core(TM) i9-12900H@2.50 GHz,CPU为NVIDIA GeForce RTX 2080 Laptop. 试验平台为python 3.7,CUDA Toolkit 11.6,OpenCV 1.6.0.
2.2. 实验数据
实验数据集为中科院自动化所公开的磁瓦数据集(magnetic tile dataset,MTD),包含6种类型的磁瓦图像,共计1 344张. 为了满足MIINet所需图片尺寸,将MTD的图像裁剪成224×224的统一尺寸,实验数据集各类别图片数目如表1所示. 其中
表 1 磁瓦数据集参数
Tab.1
类别 | 类别 | |||||
Blow hole | 115 | 122 | Fray | 32 | 68 | |
Break | 85 | 98 | Uneven | 103 | — | |
Crack | 57 | 75 | Free | 952 | 3 324 |
2.3. 实验结果
2.3.1. 磁瓦重建结果对比实验
在无监督缺陷检测模型中,重建能力是直接影响检测结果的关键因素. 检测模型的重建能力主要表现在修复待检测磁瓦图像的缺陷区域和保持无缺陷区域的图像细节能力方面. 使用相同数据集训练DCGAN、DCAE以及GAN+DA[23],为了让这3种方法在磁瓦数据集上达到最优的效果,统一迭代次数为1 000次,确保模型损失收敛;为了比较DCGAN、DCAE以及GAN+DA和MIINet的重建能力,选择5种不同类型的磁瓦样本进行定性分析. 如图7所示为磁瓦重建实验结果,其中列1、2分别是原始图像和对应的正确缺陷区域(ground truth,GT). 可以看出,DCAE和DCGAN的重建结果中都存在明显的缺陷残留痕迹,特别是DCGAN无缺陷区域的纹理细节在视觉上明显丢失严重;GAN+DA几乎能够完全修复如Blowhole、Break的小面积缺陷,而对于如Break、Fray的大面积缺陷,重建图像中存在明显缺陷残留,并且重建图像中纹理细节丢失严重. MIINet的重建结果中没有缺陷残留痕迹,并且缺陷区域与非缺陷区域衔接融洽. 实验结果表明,所提图像修复网络具有高质量的缺陷区域修复能力,为后续的缺陷检测工作奠定了基础.
图 7
图 7 不同检测模型的磁瓦重建结果
Fig.7 Magnetic tile reconstruction results of different detection models
DCAE和DCGAN通常用于均匀、周期性的规则纹理表面缺陷检测,难以处理磁瓦表面正常纹理呈现的非均匀且非周期性的特征. 此外, DCAE和DCGAN的感受野较小,只能对输入图像进行简单的映射变换,因此训练后的模型无法提取无缺陷图像本质的纹理信息,容易生成与原始图像高度相似的重建图像. GAN+DA通过引入双头注意力机制,增强了GAN模型捕获无缺陷图像数据特征的能力,但是重建图像中无缺陷区域的细节在视觉上丢失严重. 与上述模型相比,MIINet具有捕获磁瓦图像本质信息的能力,能够将缺陷特征修复为正常特征,因此在磁瓦图像的重建和修复效果最佳.
2.3.2. 缺陷嫌疑区域定位精准性实验
为了验证缺陷嫌疑区域定位的精准性,在5种磁瓦类别上进行测试,缺陷嫌疑区域定位结果如图8所示. 可以看出,显著特征图不仅有效突出了缺陷特征区域,而且分析得到的缺陷区域轮廓清晰;二值化算法分割得到的缺陷嫌疑区域不仅保留了相对完整的缺陷特征,而且有效消除了背景信息;MIINet掩码能够精准定位缺陷区域,完全遮掩缺陷区域. 由5种磁瓦类别的实验验证可以得出结论:采用视觉显著性和二值化算法定位缺陷嫌疑区域方面具有较高的准确性,有助于提高图像修复能力和缺陷检测的准确率.
图 8
图 8 不同方法的缺陷嫌疑区域定位结果
Fig.8 Localization results of suspected defect area for different methods
2.3.3. 缺陷判定准确性实验
为了验证模型对不同缺陷类型定位的准确性和对轮廓检测的完整性,检测4种缺陷类型,缺陷判定结果如图9所示. 可以看出,所提方法不仅可以准确地定位缺陷的位置,而且能够比较完整地检测到缺陷区域轮廓. 综合来看,所提方法具有辨别缺陷区域与非缺陷区域的能力.
图 9
2.4. 缺陷检测性能评估
式中:
在已有的实验环境下,构建修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测方法,利用测试集进行实验,结果如图10所示. 图中,pg为MIINet修复前后图像做“减”操作得到差分图像中的最高灰度像素值. 实际阈值T=31.574 853,由式(25)计算得到. 在相同实验环境下,采用相同数据集训练文献[23]~[25]所提模型,迭代次数统一为1 000次,以确保模型损失达到稳定状态. 利用同一测试集进行实验,实验结果如图11和表2所示. 从检测精度和ROC来看,所提方法较其他5种检测方法的检测效果更好,检测准确率Acc至少提高了2.36个百分点,F1值至少提高了1.62个百分点,AUC至少提高了0.84个百分点. 模型检测精度是间接反映模型将异常视觉特征修复为正常特征能力的参数,所提方法在磁瓦数据集上拥有较高检测精度,更符合工业生产线对可靠性的要求.
图 10
图 11
图 11 6种检测方法受试者工作特供曲线比较
Fig.11 Comparison of receiver operating characteristic curves for six detection methods
表 2 6种检测方法的检测精度比较
Tab.2
2.5. 模型失效实验
本研究模型在MTD数据集上整体表现良好,但在部分图像上失效,例样本检测过程如表3所示,其中NF为修复失效的图片数量. 主要失效原因如下. 类型1:在修复图像时,模型难以对与异常视觉特征相似的表面纹理进行高质量修复,图片共计25张. 类型2:在定位缺陷嫌疑区域时,算法不能对与正常特征对比度低的缺陷特征区域进行精准遮掩,图片共计23张. 类型3:在判定缺陷区域时,算法难以准确判定与正常纹理重合的缺陷区域,图片共计8张. 未来研究可以进一步优化和提升磁瓦表面缺陷检测中类型1、2的有效性,以提高模型的稳定性.
表 3 本研究部分模型失效样本检测过程
Tab.3
失效 类型 | 输入 图像 | 缺陷嫌 疑区域 | 修复 图像 | 检测 结果 | 期待 结果 | 判定 结果 | GT | NF |
1 | 有缺陷 | 无缺陷 | 25 | |||||
有缺陷 | 无缺陷 | |||||||
2 | 无缺陷 | 有缺陷 | 23 | |||||
无缺陷 | 有缺陷 | |||||||
3 | 有缺陷 | 有缺陷 | 8 | |||||
有缺陷 | 有缺陷 |
3. 结 论
(1)提出新的图像修复网络MIINet,引入多头注意力机制,长距离分析图像特征,充分学习修复不规则纹理所需表面特征信息. MIINet使用无缺陷图像进行训练,通过掩码遮蔽的方式修复有缺陷图像的缺陷区域,得到无缺陷图像利用判别阈值和SSIM,对修复前后的差分图像进行缺陷检测和缺陷区域判定.
(2)为了使模型能够精准修复有缺陷图像中的缺陷区域,构建缺陷嫌疑区域定位方法. 将原始图像经过视觉显著性分析,得到显著特征图;利用二值化算法消除显著特征图的背景信息,确定缺陷嫌疑区域;将缺陷嫌疑区域结果图转化为MIINet掩码,为MIINet提供目标修复区域.
(3)实验结果表明,修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测方法具有将异常视觉特征转化为正常特征的能力,缺陷检测准确率、F1值和AUC值分别为96.87%、97.93%、95.88%. 与经典磁瓦表面缺陷检测方法进行相比,该方法解决了磁瓦缺陷样本数量少和缺陷类型不确定的问题,检测效果更好.
参考文献
Surface defect saliency of magnetic tile
[J].DOI:10.1007/s00371-018-1588-5 [本文引用: 1]
SDDNet: a fast and accurate network for surface defect detection
[J].
Binary neural network for automated visual surface defect detection
[J].DOI:10.3390/s21206868 [本文引用: 1]
Semantic segmentation network for surface defect detection of automobile wheel hub fusing high-resolution feature and multi-scale feature
[J].DOI:10.3390/app112210508 [本文引用: 1]
Magnetic tile surface defect detection methodology based on self-attention and self-supervised learning
[J].
基于多支路卷积神经网络的磁瓦表面缺陷检测算法
[J].
Surface defect detection algorithm of magnetic tiles based on multi-branch convolutional neural network
[J].
基于改进YOLOv3的印刷电路板缺陷检测算法
[J].
Improved YOLOv3-based defect detection algorithm for printed circuit board
[J].
基于图像修复的无监督表面缺陷检测方法
[J].
Unsupervised surface defect detection method based on image inpainting
[J].
GAN-generated image detection with self-attention mechanism against GAN generator defect
[J].DOI:10.1109/JSTSP.2020.2994523 [本文引用: 1]
Using ISU-GAN for unsupervised small sample defect detection
[J].DOI:10.1038/s41598-022-15855-7 [本文引用: 1]
Multi-stage unsupervised fabric defect detection based on DCGAN
[J].DOI:10.1007/s00371-022-02754-1 [本文引用: 1]
基于密集残差块生成对抗网络的空间目标图像超分辨率重建
[J].DOI:10.37188/OPE.20223017.2155 [本文引用: 1]
Super-resolution reconstruction method for space target images based on dense residual block-based GAN
[J].DOI:10.37188/OPE.20223017.2155 [本文引用: 1]
采用变分自编码器的无监督压敏电阻表面缺陷检测
[J].
Unsupervised varistor surface defect detection based on variational autoencoder
[J].
Real-time implementation of fabric defect detection based on variational automatic encoder with structure similarity
[J].DOI:10.1007/s11554-020-01023-5 [本文引用: 1]
An automated defect detection approach for catenary rod-insulator textured surfaces using unsupervised learning
[J].
Human detection using a mobile platform and novel features derived from a visual saliency mechanism
[J].DOI:10.1016/j.imavis.2009.06.006 [本文引用: 1]
Dual attention-based industrial surface defect detection with consistency loss
[J].DOI:10.3390/s22145141 [本文引用: 5]
A semi-supervised learning method for surface defect classification of magnetic tiles
[J].DOI:10.1007/s00138-022-01286-x [本文引用: 2]
A four-stage product appearance defect detection method with small samples
[J].DOI:10.1109/ACCESS.2022.3196935 [本文引用: 4]
/
〈 |
|
〉 |
