基于异常特征对抗学习的工业图像异常检测方法
Industrial image anomaly detection method based on adversarial learning of abnormal features
通讯作者:
收稿日期: 2024-12-18
| 基金资助: |
|
Received: 2024-12-18
| Fund supported: | 四川省自然科学基金资助项目(2023NSFSC0504). |
作者简介 About authors
王天飞(2000—),男,硕士生,从事图像异常检测研究.orcid.org/0009-0007-0187-2723.E-mail:
为了解决工业图像异常检测中遇到的异常样本稀缺、标注过程复杂及深度模型计算开销大的问题,提出新的异常检测方法EDA. 该方法分为2个阶段. 1)异常学习和嵌入阶段,采用生成式对抗网络(GAN)架构来学习异常特征,通过缩减生成器参数量以保证网络轻量化,引入亚像素卷积以增强异常信息,随后在正常图像中随机选择区域,通过SAM (segment anything)模型进行区域的细化处理,在细化处理后的区域生成异常信息,为异常检测阶段提供先验异常特征及相应掩码. 2)异常检测阶段,引入Contrast U-Net网络利用有监督训练方式增强对异常特征的敏感度,并提升识别与定位的准确性. 在MVTec数据集上进行的实验结果表明,所提方法性能优异,图像级别AUROC为98.2%,像素级别AUROC为97.8%,AU-PR为81.1%,具有显著优势,在图像异常检测分割领域具有出色表现.
关键词:
A novel anomaly detection method named EDA (enhancing anomaly detection via adversarial anomaly learning) was proposed, to address the challenges of industrial image anomaly detection, including the scarcity of anomalous samples, the complexity of annotation, and the high computational cost of deep models. The proposed approach consisted of two key stages. 1) Anomaly learning and embedding stage: a generative adversarial network (GAN) architecture was employed to learn anomalous features. The generator’s parameters were reduced to ensure lightweight design, and subpixel convolution was introduced to enhance anomalous information. Random regions were selected from normal images, refined using the SAM (segment anything) model, and then anomalous features were generated in these refined regions, providing prior anomalous features and corresponding masks for the anomaly detection stage. 2) Anomaly detection stage: a Contrast U-net network was introduced to improve sensitivity to anomalous features and enhance the accuracy of identification and localization through supervised training. Experimental results on the MVTec dataset demonstrated the superior performance of the proposed method, achieving an image-level AUROC of 98.2%, a pixel-level AUROC of 97.8%, and an AU-PR of 81.1%, showing significant advantages and outstanding performance in the field of industrial image anomaly detection and segmentation.
Keywords:
本文引用格式
王天飞, 周文俊, 项圣, 贺宇航, 彭博.
WANG Tianfei, ZHOU Wenjun, XIANG Sheng, HE Yuhang, PENG Bo.
在制造业中,工业图像异常检测技术常用于检测工业制品的表面异常,其以独特的优势与功能,在提升产品质量、优化成本结构方面发挥着不可替代的作用. 然而,目前大部分的传统方法仅在特定场景下有效[1],不具有普适性,比如Reed等提出的RX (Reed-xiao)算法就利用高斯分布函数来描述高光谱图像中像素点内信息的分布情况[2]. 仅仅依靠一个高斯分布模型很难描述更为复杂多变的场景,在现实环境中的适用性受限. 监督学习方法又面临带准确标注的样本量不足的问题. 因此,学界目前采用无监督方式进行训练. 仅使用正常数据训练的深度网络理论上无法准确重建异常区域,在某些情况下,网络可能过于泛化,以至于可以将异常输入重建为正常信息,从而导致误检. 总的来说,图像异常检测领域目前的问题在于无监督方法对于图像异常检测的准确度不够,而监督学习虽然可以得到较高的准确度,但在实际生产中没有足够数据集来支撑监督学习.
为了解决这个问题,提出异常定位和检测网络EDA,其具有出色的异常检测性能. 分为2个阶段,第1个阶段利用少量异常样本,初步学习异常特征,生成模拟异常图像以解决带标注样本数量不足的问题,第2个阶段进行监督训练,充分利用图像浅层纹理信息,获取最佳的像素级分割效果.
1. 相关工作
目前工业异常检测领域常用方法可以分为基于重建、基于嵌入、基于知识蒸馏以及基于生成模型. 不同方法各有优劣,具体总结如表1所示.
表 1 工业异常检测常用方法对比
Tab.1
| 方法类别 | 关键技术 | 优点 | 缺点 |
| 基于重建 | 编码器将输入的工业图像压缩成低维特征向量;解码器再根据该特征向量重建图像 | 无须对缺陷进行标注,通用性较强 | 精度及准确度不足,容易误判 |
| 基于嵌入 | 将图像映射到低维的特征空间,计算其特征嵌入与正常图像特征嵌入之间的距离 | 能够有效提取图像的深层特征,在特征空间中进行距离计算,可量化图像的异常程度,便于分析和决策 | 若训练数据不足或存在偏差, 会影响模型的泛化能力 |
| 基于知识蒸馏 | 将教师模型的知识迁移到轻量级的学生模型中 | 降低模型的计算成本,内存需求低 | 蒸馏效果依赖超参数, 缺乏泛化能力 |
| 基于生成模型 | 通过生成器和判别器的对抗训练,生成器逐渐学习到正常图像的分布特征 | 能够生成与真实图像相似的样本,可用于数据增强 | 训练过程不稳定,容易出 现梯度消失、爆炸的问题 |
2. 方 法
本研究提出新的检测框架,即通过利用少量的异常图像,来学习并理解异常区域在纹理、色彩、亮度等多个特征上的分布特性,进而运用这些异常特征,扩充带有标注的异常图像数据集,使其样本量足以支撑监督训练. 如图1所示,EDA主要分为异常学习和嵌入阶段与异常检测阶段,其中图1(a)表示异常学习和嵌入阶段,使用少量真实异常图像及其掩码进行训练,仅学习异常区域的特征. 在预测模块中,输入大量正常图像,随机选择一块区域并使用SAM (segment anything)[3]进行细分,将其输入到模型中将正常特征转化为异常特征,得到大量模拟异常图像及相应掩码;图1(b)表示异常检测阶段,输入的异常图像经过网络得到异常分值图和正常分值图,当异常得分大于正常得分时判定为异常从而得到二值化输出;图1(c)表示图像在网络中的特征图,模拟异常和真实异常具有相似的特征,并且与正常区域有着显著差别.
图 1
2.1. 异常学习和嵌入阶段
此阶段经多轮迭代,重构正常区域以模拟异常区域的特征分布. 随后,利用学习到的异常表征,结合SAM在大量正常图像中选取特定区域将其重构为异常形态,从而有效扩增异常数据集的规模. 首先,利用少量带注释的异常图像分割异常区域作为GT,同时分割正常图像相应区域作为输入. 异常区域占比小,模型输入数据较小,因此减少了模型中的参数数量,降低了计算资源. 为了获得更好的结果,对生成对抗网络进行了一些修改,以更好地适应实际需求. 网络结构如图2所示. 在生成器的编码器部分,为了保留更多的空间特征信息,增加了瓶颈模块和传输模块[4]. 瓶颈模块结构图如图3所示,采用实例归一化,使网络具有更好的训练稳定性,避免梯度爆炸. 传输模块放置在最后一层,以增强从瓶颈模块获得的特征. 鉴于异常区域仅占正常图像很小的比例且分辨率较低,为了增强异常信息并捕捉更多细节,在网络中融入了亚像素卷积[5],以显著提升图像处理敏锐度,确保精准捕捉并放大异常特征. 当真实摄像机捕捉图像时,物理世界中的连续图像被离散化. 成像平面上的每个像素只表示它周围的颜色. 在微观层面上,它们之间存在着无限小的实体. 将这些较小的实体称为“亚像素”. 本研究在解码器中加入了亚像素卷积,其表达式如下:
图 2
图 3
式中:
MVTec数据集[6]中的异常图像数量有限,每种异常类型只有16张图像,因此选择使用实例规范化(IN)而不是批处理规范化. IN对每个样本的每个特征通道进行独立归一化,能更好地保留图像细节,适合小批量训练.
使用L1损耗来测量模拟异常与真实异常之间逐像素的差异,其表达式如下:
式中:
为了进一步强化模拟异常图像与真实异常图像之间的特征相似性,借助模型参数进行损失计算. 其核心目的在于促使模拟异常图像在网络中的特征值逼近真实异常图像特征值,表达式如下:
式中:
对抗损失(adversarial loss)是生成对抗网络(GANs)中常见的损失函数,用于增强生成图像的真实性,表达式如下:
式中:
在此阶段的训练过程结束后,开始进行异常信息的嵌入. 在正常图像上选择各自一块区域,分割正常图像的选定区域并对其进行重构,目标是将其分布特征与异常区域的分布特征对齐,从而将正常图像转化为异常图像. 为了确保所选区域的边界与原始图像的纹理分布相匹配,防止突然的边缘过渡,采用SAM模型来划分出正常图像中的随机一个不规则区域,以嵌入异常. 其网络结构如图4所示,包括编码器、提示编码器和轻量级、部分注释的解码器. 其中编码器将输入图像编码为高维特征表示. 提示编码器把用户提示(点、框、文本、掩码)编码为向量. 掩码解码器是SAM的核心组件,负责将图像编码和提示编码结合,生成最终的分割掩码. 其结构基于Transformer的解码器,参考MVTec数据集异常区域占比,在图像中随机选长和宽为原图1/20~1/5的区域,用SAM 划分不规则掩模,模拟实际异常位置和大小不定的情况. 将该掩模输入异常学习模块,生成异常图像.
图 4
2.2. 异常检测阶段
在异常检测阶段,针对于一些特定场合中异常区域的颜色、锐度及色调特征可能与正常区域并无显著区别的情况,聚焦于纹理特征的显著差异,引入Contrast U-Net作为异常检测主干网络,该网络能对于图像浅层纹理信息充分提取和利用,准确学习到目标区域的纹理特性,从而达到较好的分割效果. 这在笔者之前的工作[7]得到了验证,在颈动脉超声图像斑块检测任务中,该网络实现了对颈动脉斑块的高精度分割,展现了其处理纹理复杂数据的卓越性能. 针对工业图像异常检测任务,异常区域的纹理信息通常与正常区域具有明显偏差,基于Contrast U-Net在纹理特征处理方面的优势,本研究将其作为异常检测主干网络. 考虑到工业图像包含更丰富的浅层信息,将Contrast U-Net进行细微优化调整,取消第1层的挤压和激励(SE)模块[8],保留第2层与第3层,在保证关键纹理特征提取的前提下,有效减少了模型的参数量. 该网络架构如图5所示,将对比度算子
图 5
图 6
FL作为主要损失函数来衡量预测映射与真实值之间的关系. FL降低了分类良好的示例的权重,更多地关注难分类、错误分类的样本,有效解决了正常和异常区域分布的不平衡,确保网络优先从更具挑战性的异常区域学习. 表达式如下:
式中:
除了FL之外,此模块还融合了LL以进一步提高网络的性能. 通过优化IoU, LL会使模型得到更准确和精确的分割结果,特别是在像素级精度至关重要的场景中. 表达式如下:
式中:
通过结合Focal Loss和Lovasz Loss,模型可以有效地处理正常区域和异常区域的不平衡,同时优化准确的分割结果. 这种双损失策略确保了此模型是鲁棒的,能够从简单和具有挑战性的例子中学习,并产生高质量的异常检测结果. 最后,总损失函数表达式如下:
式中:
3. 实 验
3.1. 实验数据集
图 7
3.2. 实验平台及评价指标
本算法在Ubuntu18.04平台Pytorch框架下实现,GPU为NVIDIA
采用异常检测的标准度量AUROC (area under the ROC curve)[12]以及平均精度AP (average precision)进行检测效果评价,ROC曲线是一种图形表示,其横轴为假阳率(FPR),纵轴为真阳率(TPR). AP为PR曲线下方的面积,其中PR曲线是一个二维坐标系,其中横轴表示召回率(Recall),纵轴表示精度(Precision). 指标相关计算公式如下:
式中:TP表示真正异常且被正确预测的实例数量,FN表示被错误预测为正常的异常实例数量,FP表示被错误标记为异常的正常实例的数量, TN表示正确识别的正常实例的数量.
3.3. 对比实验
挑选8种近期在异常检测领域表现突出的算法进行比较,分别为US[13]、AESSIM[14]、RIAD[15]、PaDim[12]、CutPaste[16]、CLGAN[17]、MB-PFM[18]和ATSNM[19]. 与本研究实验设置相同,最大迭代轮数为150,初始学习率为
表 2 不同方法图像级/像素级AUROC结果对比
Tab.2
| 类别 | AUROC | ||||||||
| US | AE-SSIM | RIAD | PaDim | CutPaste | CLGAN | MB-PFM | ATSNM | 本研究算法 | |
| 1)注:斜线前、后数据分别表示图像级以及像素级AUROC结果 | |||||||||
| bottle | 99.0/97.81) | 88.0/93.0 | 99.9/98.4 | 99.9/98.3 | 98.2/97.6 | 97.6/92.6 | 100.0/98.4 | 100.0/98.3 | 96.8/98.5 |
| capsule | 86.1/96.8 | 61.0/94.0 | 88.4/92.8 | 91.3/98.5 | 98.2/97.4 | 98.2/98.4 | 94.5/94.3 | 93.7/98.5 | 96.2/97.3 |
| grid | 81.0/89.9 | 69.0/94.0 | 99.6/98.8 | 96.7/97.3 | 100.0/97.5 | 99.3/98.7 | 98.0/98.8 | 95.2/98.7 | 100.0/99.6 |
| leather | 88.2/97.8 | 46.0/78.0 | 100.0/99.4 | 100.0/99.2 | 100.0/99.5 | 100.0/99.7 | 100.0/96.4 | 100.0/99.5 | 100.0/99.9 |
| pill | 87.9/96.5 | 60.0/91.0 | 83.8/95.7 | 93.3/95.7 | 94.9/95.7 | 98.1/97.3 | 96.5/95.2 | 93.7/96.5 | 98.2/96.5 |
| tile | 99.1/92.5 | 52.0/59..0 | 98.7/89.1 | 98.1/98.1 | 94.6/90.5 | 96.5/94.1 | 99.6/96.2 | 95.9/97.9 | 100.0/98.6 |
| transistor | 81.8/97.8 | 52.0/90.0 | 90.9/87.7 | 97.4/97.5 | 96.1/93.0 | 96.4/93.3 | 97.8/97.8 | 91.6/87.5 | 95.0/92.1 |
| zipper | 91.9/95.6 | 80.0/88.0 | 98.1/97.8 | 90.3/98.5 | 99.9/99.3 | 99.3/97.8 | 97.4/98.2 | 96.3/98.5 | 100.0/99.1 |
| cable | 86.2/91.9 | 61.0/82.0 | 81.9/84.2 | 92.7/96.7 | 81.2/90.0 | 98.3/95.6 | 98.8/96.7 | 91.3/96.8 | 93.2/96.7 |
| carpet | 91.6/93.5 | 67.0/87.0 | 84.2/96.3 | 99.8/99.1 | 93.9/98.3 | 98.2/97.8 | 100.0/99.2 | 97.8/98.3 | 96.5/99.2 |
| hazelnut | 93.1/98.2 | 54.0/97.0 | 83.3/96.1 | 92.0/98.2 | 98.3/97.3 | 99.0/98.1 | 100.0/99.1 | 99.8/98.4 | 100.0/98.8 |
| metalnut | 82.0/97.2 | 54.0/89.0 | 88.5/92.5 | 98.7/97.2 | 99.9/93.1 | 97.9/96.8 | 100.0/97.2 | 98.6/96.7 | 98.9/97.8 |
| screw | 54.9/97.4 | 51.0/92.0 | 84.5/98.8 | 85.8/98.5 | 88.7/96.7 | 95.2/94.9 | 91.8/97.7 | 92.1/98.9 | 96.6/98.9 |
| toothbrush | 95.3/97.9 | 74.0/96.0 | 100.0/98.9 | 96.1/98.8 | 99.4/98.1 | 98.2/96.6 | 88.6/98.6 | 91.4/98.9 | 100.0/97.9 |
| wood | 97.7/92.1 | 83.0/73.0 | 93.0/85.8 | 99.2/94.9 | 99.1/95.5 | 98.9/96.9 | 99.5/95.6 | 98.8/96.9 | 97.6/94.5 |
| 平均 | 89.7/95.3 | 63.4/88.0 | 91.3/94.2 | 95.3/97.5 | 96.1/96.0 | 97.5/95.1 | 97.5/97.3 | 95.7/97.4 | 98.2/97.8 |
表 3 不同方法像素级AU-PR结果对比
Tab.3
| 类别 | US[9] | AE-SSIM | RIAD | PaDim | CutPaste | CLGAN | MB-PFM | ATSNM | 本研究算法 |
| bottle | 74.2 | — | 76.4 | 73.0 | 77.9 | 79.6 | 76.7 | 78.7 | 86.6 |
| capsule | 25.9 | — | 38.2 | 33.4 | 32.3 | 69.6 | 46.2 | 52.7 | 72.8 |
| grid | 10.1 | — | 36.4 | 58.0 | 42.6 | 64.9 | 45.3 | 45.1 | 68.5 |
| leather | 40.9 | — | 49.1 | 45.2 | 54.6 | 75.4 | 46.8 | 57.4 | 76.3 |
| pill | 62.0 | — | 51.6 | 60.2 | 51.8 | 76.3 | 78.6 | 66.4 | 72.5 |
| tile | 65.3 | — | 52.6 | 51.7 | 67.2 | 87.6 | 80.3 | 89.1 | 95.6 |
| transistor | 27.1 | — | 39.2 | 71.3 | 70.8 | 67.7 | 56.8 | 70.3 | 77.5 |
| zipper | 36.1 | — | 63.4 | 16.6 | 68.5 | 68.7 | 55.6 | 72.6 | 86.3 |
| cable | 48.2 | — | 24.4 | 34.3 | 55.6 | 73.8 | 67.7 | 69.4 | 75.3 |
| carpet | 52.2 | — | 61.4 | 49.7 | 57.3 | 87.6 | 58.3 | 80.2 | 90.7 |
| hazelnut | 57.8 | — | 33.8 | 37.4 | 53.7 | 68.4 | 60.7 | 76.3 | 96.3 |
| metalnut | 83.5 | — | 64.3 | 39.4 | 62.5 | 67.7 | 78.1 | 77.6 | 75.6 |
| screw | 17.8 | — | 43.9 | 51.7 | 58.6 | 69.3 | 52.6 | 69.4 | 74.2 |
| toothbrush | 37.7 | — | 50.6 | 40.6 | 46.8 | 59.6 | 53.4 | 54.9 | 67.4 |
| wood | 53.3 | — | 38.2 | 42.3 | 79.3 | 77.3 | 46.7 | 78.7 | 76.8 |
| 平均 | 46.14 | — | 48.2 | 47.0 | 58.6 | 67.5 | 61.1 | 68.92 | 81.1 |
图 8
3.4. 消融实验
为了评估基于异常学习和嵌入阶段的工作以及Contrast U-Net对异常检测性能的影响,进行了3种消融实验设计,如表4所示.
表 4 消融实验设计
Tab.4
| 设计 | 第1阶段 | 第2阶段 |
| 设计1 | — | Contrast U-Net |
| 设计2 | √ | U-Net |
| 设计3 | √ | Contrast U-Net |
在设计1中,仅直接引用Contrast U-Net于异常检测阶段;在设计2中,在主干网络中加入异常学习和嵌入阶段,并且将异常检测阶段中的Contrast U-Net替换为U-Net;在设计3中,融合异常学习模块和对比U-Net. 通过对比设计1、3的实验结果,清晰地展示异常学习和嵌入阶段的关键作用. 设计2、3的对比结果则凸显了Contrast U-Net在增强异常识别能力、提高检测精度方面的优势.
如表5所示展示了相应的实验结果,针对每个类别,表格分别列出了3种设计在图像级AUROC和像素级AUROC方面的表现. 结果表明,在加入了异常学习和嵌入阶段后,整体效果有了显著提升,凸显了其基础有效性和在提高模型区分正常与异常模式能力中的关键作用. 此外,采用Contrast U-Net替换传统U-Net架构进一步提升了检测精度. 这一发现凸显了Contrast U-Net的固有优势,特别是其在减少参数使用量的限制下仍能有效提升检测效果的能力. 这一结果强调了Contrast U-Net在异常检测任务中高效且强大的潜力.
表 5 消融实验图像级/像素级AUROC结果
Tab.5
| 类别 | AUROC | ||
| 设计1 | 设计2 | 设计3 | |
| 1)注:斜线前、后数据分别表示图像级以及像素级AUROC结果 | |||
| bottle | 98.2/69.71) | 96.8/97.2 | 97.2/98.5 |
| capsule | 77.5/63.7 | 94.9/91.0 | 97.0/97.3 |
| grid | 75.6/66.3 | 100.0/99.4 | 100.0/99.6 |
| leather | 83.1/57.7 | 100.0/97.4 | 100.0/99.9 |
| pill | 89.0/65.7 | 96.2/96.4 | 98.2/97.5 |
| tile | 98.5/78.7 | 99.8/99.3 | 100.0/98.6 |
| transistor | 91.4/59.6 | 92.7/88.9 | 96.3/92.1 |
| zipper | 94.3/64.2 | 100.0/98.4 | 100.0/99.1 |
| cable | 54.0/69.4 | 88.3/93.4 | 86.2/96.7 |
| carpet | 52.5/56.1 | 90.6/93.8 | 97.6/99.2 |
| hazelnut | 94.3/64.2 | 99.9/99.6 | 100.0/98.8 |
| metalnut | 89.5/86.5 | 99.0/99.1 | 98.9/97.8 |
| screw | 84.5/54.6 | 97.3/99.5 | 96.6/98.9 |
| toothbrush | 86.6/76.9 | 100.0/97.7 | 100.0/97.9 |
| wood | 91.0/67.9 | 99.6/94.9 | 97.6/94.5 |
| 平均 | 84.0/66.75 | 97.0/96.4 | 98.2/97.8 |
本研究对于生成对抗网络的改进,相较于原始网络具有明显优势,结果如表6所示. 改进后生成图像的平均SSIM由0.76提升至0.92,PNSR由18.54 dB提升至24.36 dB.
表 6 生成对抗网络消融实验结果
Tab.6
| 方法 | SSIM | PSNR/dB |
| 原始网络 | 0.76 | 18.54 |
| 改进后 | 0.92 | 24.36 |
3.5. 时间复杂度
表 7 时间复杂度对比
Tab.7
| Methods | Param/106 | MACs/109 |
| US | 18.62 | 3.44 |
| AE-SSIM | 62.37 | 12.61 |
| RIAD | — | — |
| PaDim | 68.88 | 11.46 |
| CutPaste | 11.77 | 1.82 |
| CLGAN | — | — |
| MB-PFM | 22.86 | 3.62 |
| ATSNM | — | — |
| 本研究算法 | 0.95 | 2.64 |
3.6. 实验分析
如图8所示,对于被油渍污染的瓷砖,由于油渍的通透性,其异常区域与正常区域的纹理特征差异并不显著,仅在油污的边缘地带存在细微的突变. 这无疑给异常检测算法带来了不小的挑战. 然而本研究模型依然可以准确检测到异常区域并且检测效果优于其他方法,这得益于EDA中的异常检测模块对于纹理信息的敏感性,准确地识别到了油污边缘的纹理信息的异常性,进而准确地分割出了油污区域.
针对其他几类材料,其异常区域的纹理特征与正常区域存在显著的差异. 在这种情境下,与其他算法相比,EDA仍展现出最优秀的性能. 这主要得益于其异常学习模块为异常检测模块提供了丰富且精确的异常特征信息.
如图9所示为真实/模拟异常图像特征分布相似性示意. 其中,f、g分别为频率和特征值. 对比真实异常图像与模拟异常图像在模型中的特征值分布,可以发现两者相似度极高,均与正常特征之间存在显著的差异性,证明了异常检测模块在训练阶段已经成功地掌握了异常特征和正常特征的信息,在面对未知的异常信息时,也可以准确利用其与正常信息的偏差而准确识别和定位到异常区域. 相比之下,其他检测算法仅仅掌握了正常信息. 更进一步,EDA的异常检测模块建立在U-Net网络之上,它与其他基于CNNs的异常检测算法有所不同,能够进行像素级别的异常图像处理,从而确保了模型在异常区域的精细分割上具有优越的性能. 如图10所示为纹理图像定性结果示例,更直观地展示了本研究所提算法对于纹理特征明显的异常图像的精确和细致的分割效果.
图 9
图 9 真实/模拟异常图像特征分布相似性示意
Fig.9 Illustration of similarity of real and simulated abnormal image feature distribution
图 10
4. 结 语
提出新的异常检测方法 EDA,旨在解决现有方法因依赖噪声或外部数据而引发的语义鸿沟问题,该问题限制了模型对真实异常的识别能力. EDA采用2阶段策略:第1阶段,利用少量真实异常样本,通过精心设计的生成网络学习并嵌入逼真且多样化的异常特征至正常图像中,从而丰富训练集并确保生成特征与真实异常高度一致. 第2阶段,基于这些高质量的异常图像数据,检测模型在有监督环境下得到充分训练,展现出优异的检测性能. EDA在训练阶段易用且灵活,仅须少量标注异常样本,大大降低了计算需求,提升了方法的实用性和效率,为工业缺陷检测领域提供了新的研究思路和实践方法. 不过,目前模型仅应用于实验室环境中,未来将考虑在真实生产检测环境中部署模型并结合其表现进行模型的优化,进一步提升其实用性与稳定性.
参考文献
图像异常检测研究现状综述
[J].
Review of image anomaly detection
[J].
Deep industrial image anomaly detection: a survey
[J].DOI:10.1007/s11633-023-1459-z [本文引用: 1]
Contrast U-Net driven by sufficient texture extraction for carotid plaque detection
[J].DOI:10.3934/mbe.2023697 [本文引用: 1]
Reconstruction by inpainting for visual anomaly detection
[J].DOI:10.1016/j.patcog.2020.107706 [本文引用: 1]
基于对比学习生成对抗网络的无监督工业品表面异常检测
[J].
Unsupervised surface anomaly detection of industrial products based on contrastive learning generative adversarial network
[J].
Unsupervised image anomaly detection and segmentation based on pretrained feature mapping
[J].DOI:10.1109/TII.2022.3182385 [本文引用: 1]
/
| 〈 |
|
〉 |

