<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 基于特征过滤与特征解耦的域泛化模型

Fig.1 Feature filtering and feature decoupling based domain generalization model

1.1. 亮度过滤-残差模块

为了降低实例级归一化无任务性造成的缺陷特征鉴别信息丢失的问题，提出亮度过滤-残差模块，如图2所示.

图 2

图 2 亮度过滤-残差模块

Fig.2 Luminance filtering-residual module

如图3所示为同一张光伏电池图像不同通道的浅层特征在经过实例级归一化前后的可视化结果. 可以看出，实例级归一化虽然引入了外观不变性，但实例级归一化后特征中缺陷的鉴别性信息有所下降.

图 3

图 3 实例级归一化前后的特征对比

Fig.3 Feature comparison before and after instance normalization

对于所提出的亮度过滤-残差模块，输入特征F、F_CN$ \left(\boldsymbol{F},\;{\boldsymbol{F}}_{\mathrm{C}\mathrm{N}}\in {\bf{R}}^{{C}\times{H}\times {W}}\right) $首先经过实例级归一化^[23]初步剔除亮度带来的影响. 经过实例级归一化的结果如下：

(1)$ \left. \begin{aligned} &{\boldsymbol{F}}_{{\mathrm{IN}},i}=\dfrac{{\boldsymbol{F}}_{i}-\mu \left({\boldsymbol{F}}_{i}\right)}{\sigma \left({\boldsymbol{F}}_{i}\right)}\text{，}\\ &{\boldsymbol{F}}_{{\mathrm{CN}}\_{\mathrm{IN}},i}=\dfrac{{\boldsymbol{F}}_{{\mathrm{CN}},i}-\mu \left({\boldsymbol{F}}_{{\mathrm{CN}},i}\right)}{\sigma \left({\boldsymbol{F}}_{{\mathrm{CN}},i}\right)}.\end{aligned}\right\} $

式中：$ {\boldsymbol{F}}_{i} $为第$ i $层特征图，$ \sigma \left({\boldsymbol{F}}_{{i}}\right) $和$ \mu \left({\boldsymbol{F}}_{i}\right) $分别表示原特征第$ {i} $层特征图的标准差和均值，F_CN,i为经过特征级风格调换模块后的第i层特征图，$ \sigma \left({\boldsymbol{F}}_{\mathrm{C}\mathrm{N},i}\right) $和$ \mu \left({\boldsymbol{F}}_{\mathrm{C}\mathrm{N},i}\right) $分别表示经过特征级风格调换模块后第$ i $层特征图的标准差和均值.

特征级风格调换模块^[20]的表达式如下：

(2)$ {\boldsymbol{F}}_{\mathrm{C}\mathrm{N},i}=\sigma \left({\boldsymbol{F}}_{j}\right)\frac{{\boldsymbol{F}}_{i}-\mu \left({\boldsymbol{F}}_{i}\right)}{\sigma \left({\boldsymbol{F}}_{i}\right)}+\mu \left({\boldsymbol{F}}_{j}\right). $

经过实例级归一化后$ {\boldsymbol{F}} $和$ {{\boldsymbol{F}}}_{{\mathrm{CN}}} $被剔除的信息可以表示为

(3)$ \left.\begin{split} &{\boldsymbol{F}}_{\mathrm{s}\mathrm{u}\mathrm{b}}=\boldsymbol{F}-{\boldsymbol{F}}_{\mathrm{I}\mathrm{N}},\\ &{\boldsymbol{F}}_{\mathrm{C}\mathrm{N}\_\mathrm{s}\mathrm{u}\mathrm{b}}={\boldsymbol{F}}_{\mathrm{C}\mathrm{N}}-{\boldsymbol{F}}_{\mathrm{C}\mathrm{N}\_\mathrm{I}\mathrm{N}}.\end{split}\right\} $

式中：$ {\boldsymbol{F}}_{\mathrm{I}\mathrm{N}} $为$ \boldsymbol{F} $经过实例级归一化后的结果，$ {\boldsymbol{F}}_{\mathrm{C}\mathrm{N}\_\mathrm{I}\mathrm{N}} $为$ {\boldsymbol{F}}_{\mathrm{C}\mathrm{N}} $经过实例级归一化的结果.

通道注意力机制可以自适应地提高关注点的表示，从而关注重要特征并抑制不必要的特征，为了从被实例级归一化滤除的信息中提取缺陷相关的特征，使用通道注意力对任务相关特征进行自适应精馏，通道注意力的蒸馏向量可以表示为

(4)$ {\boldsymbol{a}}=\mathrm{S}\mathrm{i}\mathrm{g}\mathrm{m}\mathrm{o}\mathrm{i}\mathrm{d}\;\left({\omega }_{1}\mathrm{R}\mathrm{e}\mathrm{l}\mathrm{u}\;\right({\omega }_{2}\mathrm{p}\mathrm{o}\mathrm{o}\mathrm{l}\;\left({{\boldsymbol{F}}}_{\mathrm{s}\mathrm{u}\mathrm{b}}\right)\left)\right) . $

式中：$ {\boldsymbol{\omega }}_{1} $和$ {\boldsymbol{\omega }}_{2} $为全连接层参数，$ \mathrm{R}\mathrm{e}\mathrm{l}\mathrm{u} $为$ \mathrm{R}\mathrm{e}\mathrm{l}\mathrm{u} $激活函数，$ \mathrm{S}\mathrm{i}\mathrm{g}\mathrm{m}\mathrm{o}\mathrm{i}\mathrm{d} $为$ \mathrm{S}\mathrm{i}\mathrm{g}\mathrm{m}\mathrm{o}\mathrm{i}\mathrm{d} $激活函数，$ \mathrm{p}\mathrm{o}\mathrm{o}\mathrm{l} $为全局平均池化. 由于$ \boldsymbol{F} $和$ {\boldsymbol{F}}_{\mathrm{C}\mathrm{N}} $为同一图像仅经过不同层风格调换的结果，对于$ {\boldsymbol{F}}_{\mathrm{s}\mathrm{u}\mathrm{b}} $和$ {\boldsymbol{F}}_{\mathrm{C}\mathrm{N}\_\mathrm{s}\mathrm{u}\mathrm{b}} $使用同一$ \boldsymbol{a} $对任务相关特征进行自适应精馏从而降低非必要的计算开销:

(5)$ \left.\begin{array}{l}{\tilde {\boldsymbol{F}}}_{\mathrm{s}\mathrm{u}\mathrm{b}}={\boldsymbol{F}}_{\mathrm{s}\mathrm{u}\mathrm{b}}\boldsymbol{a},\\ {\tilde{\boldsymbol{F}}}_{\mathrm{C}\mathrm{N}\_\mathrm{s}\mathrm{u}\mathrm{b}}={\boldsymbol{F}}_{\mathrm{C}\mathrm{N}\_\mathrm{s}\mathrm{u}\mathrm{b}}\boldsymbol{a}.\end{array}\right\} $

为了从被剔除信息中优选出亮度不变特征，根据$ {\tilde{\boldsymbol{F}}}_{\mathrm{s}\mathrm{u}\mathrm{b}} $和$ {\tilde{\boldsymbol{F}}}_{\mathrm{C}\mathrm{N}\_\mathrm{s}\mathrm{u}\mathrm{b}} $之间的差距，从$ {\tilde{\boldsymbol{F}}}_{\mathrm{s}\mathrm{u}\mathrm{b}} $优选并恢复任务相关且亮度不变的特征，特征$ {\tilde{\boldsymbol{F}}}_{\mathrm{s}\mathrm{u}\mathrm{b}} $和$ {\tilde{\boldsymbol{F}}}_{\mathrm{C}\mathrm{N}\_\mathrm{s}\mathrm{u}\mathrm{b}} $之间的距离度量结果如下:

(6)$ A_{i,j}=\mathrm{e}\mathrm{x}\mathrm{p}\;\left(-\frac{\left|\right|{\tilde{\boldsymbol{F}}}_{\mathrm{s}\mathrm{u}\mathrm{b}}^{{i}}-{\tilde{\boldsymbol{F}}}_{\mathrm{C}\mathrm{N}\_\mathrm{s}\mathrm{u}\mathrm{b}}^{{j}}\left|\right|}{2{\rho }^{2}}\right) . $

式中：$ {\tilde{\boldsymbol{F}}}_{\mathrm{s}\mathrm{u}\mathrm{b}}^{i} $表示$ {\tilde{\boldsymbol{F}}}_{\mathrm{s}\mathrm{u}\mathrm{b}} $第$ i $通道上的特征，$ {\tilde{\boldsymbol{F}}}_{\mathrm{C}\mathrm{N}\_\mathrm{s}\mathrm{u}\mathrm{b}}^{j} $表示$ {\tilde{\boldsymbol{F}}}_{\mathrm{C}\mathrm{N}\_\mathrm{s}\mathrm{u}\mathrm{b}} $第$ j $通道上的特征，$ \rho $为高斯核计算中控制$ {\boldsymbol{A}} $的稀疏性的标准差参数. 由于本研究考虑的是同层特征的差距，这里仅需要$ {\boldsymbol{A}} $对角线上的结果即$ {A}_{i}={A}_{i,i} $，即经过亮度过滤-残差模块后的特征$ {\boldsymbol{F}}_{\mathrm{L}\mathrm{F}\mathrm{R}}. $

(7)$ {\boldsymbol{F}}_{\mathrm{L}\mathrm{F}\mathrm{R}}={\boldsymbol{F}}_{{\mathrm{IN}}}+\left(1+\mathrm{s}\mathrm{i}\mathrm{g}\mathrm{m}\mathrm{o}\mathrm{i}\mathrm{d}\;\left({\boldsymbol{\omega }}_{3}\left({A}_{i}\right)\right)\right){\tilde{\boldsymbol{F}}}_{{{\mathrm{CN}}}\_{{\mathrm{sub}}}}. $

式中：$ {\boldsymbol{\omega }}_{3} $为全连接层.

1.2. 对比白化损失函数

为了解耦特征中的亮度变化特征和纹理特征，引导模型学习缺陷纹理特征，提升模型的泛化能力，设计了对比白化损失，其计算流程如图4所示. 图中，下标S表示拉伸.

图 4

图 4 对比白化损失计算流程

Fig.4 Calculation process of contrast whitening loss

具体而言，分别计算原特征$ \boldsymbol{F} $和其经过特征级风格调换模块后所得到的特征$ {\boldsymbol{F}}_{\mathrm{C}\mathrm{N}} $的协方差矩阵：

(8)$ \left.\begin{array}{l}\boldsymbol{X}=\dfrac{1}{HW}{\mathrm{IN}}\left(\boldsymbol{F}\right){\left({\mathrm{IN}}\right(\boldsymbol{F}\left)\right)}^{\mathrm{T}},\\ {\boldsymbol{X}}_{\mathrm{C}\mathrm{N}}=\dfrac{1}{HW}{\mathrm{IN}}\left({\boldsymbol{F}}_{\mathrm{C}\mathrm{N}}\right){\left({\mathrm{IN}}\left({\boldsymbol{F}}_{\mathrm{C}\mathrm{N}}\right)\right)}^{\mathrm{T}}.\end{array} \right\} $

式中：${\mathrm{ IN}} $为式(1)的实例级归一化，$ H $和$ W $分别为特征图的高度和宽度. 2个协方差矩阵的方差矩阵V$ \left({\boldsymbol{V}}\in {\bf{R}}^{C\times C}\right) $可以表示为

(9)$ \boldsymbol{V}=\frac{1}{2}\left[\mathrm{s}\mathrm{q}\mathrm{r}\mathrm{t}{\left(\boldsymbol{X}-\mu \;\left(\boldsymbol{X}\right)'\right)}^{2}+\mathrm{s}\mathrm{q}\mathrm{r}\mathrm{t}\;{\left({\boldsymbol{X}}_{{\mathrm{CN}}}-\mu \left(\boldsymbol{X}\right)'\right)}^{2}\right]. $

式中：$ \mathrm{s}\mathrm{q}\mathrm{r}\mathrm{t} $为算数平方根，$ \mu \left(\boldsymbol{X}\right)' $为$ {\boldsymbol{X}} $和$ {\boldsymbol{X}}_{\mathrm{C}\mathrm{N}} $的均值.

(10)$ \mu \left(\boldsymbol{X}\right)'=\frac{1}{2}\left(\mu \left(\boldsymbol{X}\right)+\mu \left({\boldsymbol{X}}_{\mathrm{C}\mathrm{N}}\right)\right). $

式中：$ \mu \left(\boldsymbol{X}\right) $和$ \mu \left({\boldsymbol{X}}_{\mathrm{C}\mathrm{N}}\right) $为协方差矩阵$ \boldsymbol{X} $和$ {\boldsymbol{X}}_{\mathrm{C}\mathrm{N}} $的均值. 方差矩阵$ {\boldsymbol{V }}$表示相应的协方差对亮度变换的敏感性，更高的方差值表示该部分特征包含更多的特定领域风格，即与亮度变化相关的信息. 为了识别这些元素，将方差矩阵$ {\boldsymbol{V}} $修改为上三角矩阵，即仅保留主对角线元素和主对角线上方元素:

(11)$ {{V}}_{i,j}=\left\{\begin{array}{*{20}{l}}{V}_{i,j}， &i\leqslant j；\\0， &{\text{其他}}.\end{array}\right. $

对比白化损失的掩码矩阵$ {\boldsymbol{M}}（{\boldsymbol{M}}\in {\bf{R}}^{{C}\times {C}}） $可以表示为

(12)$ {{M}}_{i,j}=\left\{\begin{array}{*{20}{l}}1,&{V}_{i,j} > Q;\\0,&其他.\end{array}\right. $

式中：$ Q $为方差矩阵$ {\boldsymbol{V}} $中所有数值的前$ n\text{%} $的最小的数值.

对比白化损失可以表示为

(13)$ {L}_{\mathrm{C}\mathrm{W}\mathrm{L}}={E}\left[{\left|\right|\boldsymbol{X} \odot \boldsymbol{M}\left|\right|}_{1}\right]. $

式中：$ {E} $表示算术平均值，$ \odot $表示矩阵对应位置相乘，$ {\left|\right|\cdot \left|\right|}_{1} $表示矩阵的一阶范数.

最终的损失函数定义如下:

(14)$ {L}_{\mathrm{t}\mathrm{o}\mathrm{t}\mathrm{a}\mathrm{l}}={L}_{\mathrm{d}\mathrm{e}\mathrm{t}}+\lambda \left(\frac{1}{N}\sum _{i=1}^{N}{L}_{\mathrm{C}\mathrm{W}\mathrm{L}}^{i}\right) . $

式中：$ {L}_{\mathrm{d}\mathrm{e}\mathrm{t}} $为不同检测器的检测损失，$ \lambda $为对比白化损失的权重，$ N $为对比白化损失所添加到的层数.

2. 实验验证

2.1. 光伏电池采集设备及缺陷数据介绍

为了验证所提出的方法的有效性，在生产场景采集的光伏电池片缺陷数据上进行实验，光伏电池缺陷检测图像采集设备如图5所示.

图 5

图 5 光伏电池缺陷检测图像采集设备

Fig.5 Acquisition equipment for photovoltaic cell defect detection image

光伏电池电致发光（electroluminescence， EL）图像由近红外相机捕获光伏电池通电后发出的近红外光得到. 光伏电池的发电效率不同，且不同成像设备参数也并不完全一致，因此不同光伏电池图像存在亮度差异. 不同图像亮度场景下的光伏电池EL缺陷图像如图6所示. 图中，c为亮度均值，p为归一化后各个数据集图像亮度均值的分布情况.

图 6

图 6 不同亮度图像实例及其亮度分布

Fig.6 Instances of images with different brightness and corresponding brightness distribution

不同图像亮度场景下的光伏电池EL缺陷图像示例如图6(a)所示，该数据集包含3种不同亮度场景的光伏电池EL缺陷图像，其中SEL_1包含图像1688张， SEL_2包含图像1309张，为了在更加广泛的亮度变换情况下进行实验验证，通过图像亮度操作生成了与SEL_1和SEL_2亮度差异较大的SEL_3图像951张. 该数据集共包含4类缺陷:开焊、漏焊、碎片以及隐裂，图像的分辨率为398×380像素. 由图6(b)3个场景下的图像亮度分布情况可以看出，SEL_1的图像具备最低的亮度均值，SEL_3的图像具备最高的亮度均值，同时3个场景图像亮度统计曲线的峰值之间存在较大差距，即不同场景下采集到的数据具备较大的亮度差异.

2.2. 实验环境及参数设置

实验使用的CPU为I7-11700K，GPU为NVIDIA GeForce RTX 3090O24G，操作系统为Win10，网络模型使用PyTorch框架搭建. 当检测框架为YOLOv7^[24]时，batch size=4，epoch=200，根据经验设置损失函数中的λ=0.2，对比白化损失所添加到的层数N=3. 当检测框架为Faster-RCNN^[25]时，batch size=4，epoch=100，考虑到检测框架中骨干网络的改变，根据经验设置损失函数中的λ=0.3，对比白化损失所添加到的层数N=2.

2.3. 评价指标

为了对所提出方法的性能进行统计性能评估，采用置信度为0.5， IoU为0.3情况下的平均精度 (average precision， AP)的和在所有类别下AP的均值 (mean average precision，mAP)评估不同方法在数据集上的有效性:

(15)$ \left.\begin{array}{*{20}{l}}{\mathrm{AP}}=\dfrac{1}{100}\displaystyle{\sum}_{{{r}_{1}},{{r}}_{2},{{r}}_{3},\;\cdots,\; {{{r}}_{100}}}{{P}}_{\mathrm{s}\mathrm{m}\mathrm{o}\mathrm{o}\mathrm{t}\mathrm{h}}\left({i}\right),\\ {\mathrm{mAP}}=\dfrac{1}{{k}}\displaystyle{\sum} _{{i}=1}^{{k}}{\mathrm{A}\mathrm{P}}_{{i}}.\end{array} \right\} $

式中: $ {{P}}_{\mathrm{s}\mathrm{m}\mathrm{o}\mathrm{o}\mathrm{t}\mathrm{h}}\left({i}\right) $为平滑处理的PR曲线第$ {i} $个均分点的Precision；${{{r}_{1}},{{r}}_{2},{{r}}_{3},\;\cdots,\; {{{r}}_{100}}} $为按升序排列的Precision插值段第1个插值处对应的recall值；$ {k} $为类别数，在本研究中$ {k} $=4；$ {\mathrm{A}\mathrm{P}}_{{i}} $表示第$ {i} $类缺陷的AP.

2.4. 统计性能对比

为了验证所提出方法的有效性，分别以YOLOv7和Faster-RCNN这2个检测框架为基线1和基线2，利用不同场景的光伏电池缺陷数据集进行实验，并将所提方法与域泛化方法（实例级归一化(IN)^[13]、SNR^[16]和CNSN^[17]）做比较. 在每个检测框架下设计6组实验，分别为SEL_1$ \Rightarrow $SEL_2，SEL_1$\Rightarrow $SEL_3，SEL_2$\Rightarrow $SEL_1，SEL_2$\Rightarrow $SEL_3，SEL_3$\Rightarrow $SEL_1以及SEL_3$\Rightarrow $SEL_2，每组实验均使用单一亮度场景数据进行训练，其余亮度数据进行测试. 比如，SEL_1$ \Rightarrow $SEL_2表示以SEL_1为训练数据，以SEL_2为测试数据. 统计性能结果如表1、2所示. 定义后文中的跨场景平均mAP为该方法在6组跨场景实验情况下的mAP均值.

表 1 YOLOv7上不同场景及不同检测模型下的统计性能结果

Tab.1 Statistical performance results for different scenarios and different detectors on YOLOv7 %

方法	SEL_1$\Rightarrow $SEL_2					SEL_1$\Rightarrow $SEL_3
	AP				mAP	AP				mAP
	开焊	漏焊	碎片	隐裂	mAP	开焊	漏焊	碎片	隐裂	mAP
YOLOv7^[24]	72.63	77.65	86.32	62.16	74.69	18.02	56.59	71.00	30.97	44.14
IN^[13]	79.25	75.86	84.19	71.22	77.63	47.08	67.83	71.46	41.25	56.91
SNR^[16]	88.84	88.36	87.02	60.06	81.07	37.17	70.74	77.42	50.68	59.00
CNSN^[17]	70.66	76.37	77.28	80.23	76.14	73.10	83.49	62.63	47.62	66.71
FF-FDDG	91.20	89.54	87.34	78.03	86.53	78.72	90.32	71.69	56.69	74.36

方法	SEL_2$\Rightarrow $SEL_1					SEL_2$\Rightarrow $SEL_3
	AP				mAP	AP				mAP
	开焊	漏焊	碎片	隐裂	mAP	开焊	漏焊	碎片	隐裂	mAP
YOLOv7^[24]	86.22	76.66	81.62	74.74	79.81	84.70	81.90	87.33	66.63	80.14
IN^[13]	95.04	82.55	85.50	69.18	83.07	93.23	79.32	90.31	72.38	83.81
SNR^[16]	93.52	79.90	82.53	72.86	82.20	91.50	85.79	91.79	73.87	85.74
CNSN^[17]	80.07	72.73	62.94	56.61	68.09	77.79	74.50	85.84	65.56	75.92
FF-FDDG	94.40	86.09	89.35	80.90	87.71	92.03	95.56	90.94	81.46	90.00

方法	SEL_3$\Rightarrow $SEL_2					SEL_3$\Rightarrow $SEL_1
	AP				mAP	AP				mAP
	开焊	漏焊	碎片	隐裂	mAP	开焊	漏焊	碎片	隐裂	mAP
YOLOv7^[24]	90.77	88.21	75.84	80.74	83.89	57.80	61.02	74.60	70.75	66.04
IN^[13]	92.47	87.33	76.90	82.34	84.76	81.56	75.40	69.60	70.39	74.24
SNR^[16]	92.85	87.32	85.11	81.14	86.61	84.73	74.94	71.07	71.37	75.53
CNSN^[17]	70.66	76.37	77.28	80.23	76.14	78.45	68.78	58.92	52.73	64.72
FF-FDDG	92.60	89.73	82.31	83.29	86.98	88.08	78.89	75.16	72.15	78.57

由表1可以看出，以YOLOv7为基线1的方法在跨场景情况下的平均mAP为71.45%，在基线1的基础上，实例级归一化（IN）通过降低图像亮度变化带来的影响，将跨场景情况下的平均mAP提升到76.73%;针对实例级归一化无任务性做出改进的SNR通过通道注意力从被实例级归一化滤除的特征信息中选择性地返还缺陷相关特征，在跨场景情况下的平均mAP为78.36%，相较于IN提升了1.51%;CNSN的跨场景平均mAP仅为71.29%，相较于YOLOv7下降了0.16%，可以看出，在跨场景缺陷检测任务中，对同一实例不同特征层间的风格对调不仅不能较好地扩充特征信息，还会破坏缺陷的特征表示. FF-FDDG不仅通过亮度过滤-残差模块解决了实例级归一化无任务性对缺陷特征提取的影响，并通过改进的白化损失引导模型提取亮度不变信息，使得跨场景情况下的平均mAP提升到84.02%，相较于基线1提升了12.57%.

从表2可以看出，以Faster-RCNN为基线2的方法在跨场景情况下的平均mAP为60.94%，在此基础上，实例级归一化（IN）将跨场景情况下的平均mAP提升到63.10%，但受实例级归一化无任务性的影响，在SEL_3$ \Rightarrow $SEL_2情况下，其mAP下降到了61.10%. SNR的跨场景平均mAP为61.80%，虽然相较于Faster-RCNN的有0.87% 的提升，但较IN的下降了1.29%，CNSN的则相较于Faster-RCNN的下降了5.01%. FF-FDDG在保证跨场景情况都有性能提升的同时，平均mAP提升到66.20%，相较基线2提升了5.30%. 与基线1情况下的统计性能结果相佐.

表 2 Faster-RCNN上不同场景及不同检测模型下的统计性能结果

Tab.2 Statistical performance results for different scenarios and different detectors on Faster-RCNN %

方法	SEL_1$\Rightarrow $SEL_2					SEL_1$\Rightarrow $SEL_3
	AP				mAP	AP				mAP
	开焊	漏焊	碎片	隐裂	mAP	开焊	漏焊	碎片	隐裂	mAP
Faster-RCNN^[25]	84.92	86.23	61.37	12.25	61.19	49.95	82.75	74.94	18.72	55.59
IN^[13]	86.03	86.35	64.19	15.12	62.92	85.19	85.49	63.96	16.42	62.77
SNR^[16]	89.73	86.18	65.85	18.03	64.95	93.32	81.03	63.72	15.16	63.31
CNSN^[17]	79.66	85.46	63.61	18.63	61.84	78.90	81.22	62.78	19.28	60.55
FF-FDDG	89.93	87.54	69.56	18.22	66.31	91.88	80.53	69.11	20.15	65.42

方法	SEL_2$\Rightarrow $SEL_1					SEL_2$\Rightarrow $SEL_3
	AP				mAP	AP				mAP
	开焊	漏焊	碎片	隐裂	mAP	开焊	漏焊	碎片	隐裂	mAP
Faster-RCNN^[25]	87.97	76.44	63.13	15.12	60.67	86.63	76.75	64.92	12.12	60.11
IN^[13]	87.52	82.04	59.78	15.46	61.20	91.52	79.12	67.51	16.59	63.69
SNR^[16]	90.10	84.04	61.56	14.39	62.52	91.19	72.64	66.42	13.59	60.96
CNSN^[17]	82.75	83.16	43.36	10.38	54.91	83.65	77.16	58.50	9.72	57.26
FF-FDDG	91.52	86.39	60.25	23.14	65.33	92.12	90.96	68.28	17.47	67.21

方法	SEL_3$\Rightarrow $SEL_2					SEL_3$\Rightarrow $SEL_1
	AP				mAP	AP				mAP
	开焊	漏焊	碎片	隐裂	mAP	开焊	漏焊	碎片	隐裂	mAP
Faster-RCNN^[25]	90.39	89.79	63.86	19.08	65.78	90.97	87.39	56.83	14.02	62.30
IN^[13]	91.41	87.92	69.78	18.49	66.90	83.42	89.13	57.52	14.42	61.12
SNR^[16]	90.55	89.24	46.63	15.72	60.54	89.00	83.97	49.95	11.41	58.58
CNSN^[17]	51.03	72.51	58.05	13.25	48.71	76.80	71.51	50.16	10.83	52.32
FF-FDDG	92.79	90.55	68.45	20.91	68.18	88.51	81.32	62.55	25.79	64.54

2.5. 消融实验

为了验证所提出的亮度过滤-残差模块和对比白化损失的有效性，分别以YOLOv7和Faster-RCNN为基线1和基线2对所提出亮度过滤-残差模块和对比白化损失进行消融实验，实验结果如表3、4所示. 表中，数据均为跨场景平均mAP.

表 3 以YOLOv7为基线的消融实验结果

Tab.3 Ablation experiment results with YOLOv7 as baseline %

方法	SEL1$\Rightarrow $ SEL2	SEL1$\Rightarrow $ SEL3	SEL2$\Rightarrow $ SEL1	SEL2$\Rightarrow $ SEL3	SEL3$\Rightarrow $ SEL1	SEL3$\Rightarrow $SEL2
基线1	74.69	44.14	79.81	80.14	66.00	83.89
基线1+ LFR	77.84	69.21	86.04	88.33	76.60	85.03
基线+LFR+ CWL	86.53	74.36	87.71	90.00	78.60	86.98

由表3可以看出，相较于基线1，所提出的亮度过滤-残差模块使模型性能提升了12.57%，所提出的对比白化损失使模型性能进一步提升了3.52%. 由表4可以看出，在基线2检测框架下，所提出的亮度过滤-残差模块和对比白化损失对模型的泛化都具有正向提升.

表 4 以Faster-RCNN为基线的消融实验结果

Tab.4 Ablation experiment results with Faster-RCNN as baseline %

方法	SEL1$\Rightarrow $SEL2	SEL1$\Rightarrow $SEL3	SEL2$\Rightarrow $SEL1	SEL2$\Rightarrow $SEL3	SEL3$\Rightarrow $SEL1	SEL3$\Rightarrow $SEL2
基线2	61.19	55.59	60.67	60.11	62.30	65.78
基线2+ LFR	62.59	59.63	61.77	63.52	62.93	67.51
基线2+LFR+ CWL	66.31	65.42	65.53	67.21	64.54	68.18

2.6. 特征图可视化结果

为了验证所提方法的有效性，在SEL_1$ \Rightarrow $SEL_2和SEL_1$\Rightarrow $SEL_3数据集上，以YOLOv7为基线，IN、LFR和LFR+CWL提取的浅层特征可视化结果如图7所示.

图 7

图 7 不同场景特征可视化结果

Fig.7 Visualization results of features in different scenarios

图中，图7(a)、(b)为SEL_2图像的浅层特征可视化结果，图7(c)、(d)为SEL_3图像的浅层特征可视化结果. 由图7(a)、(b)、(c)、 (d)的第2列可以看出，受跨场景亮度变化的影响，模型无法提取完整且清晰的缺陷特征. 对于大尺度的缺陷，由图7(c)第3列可以看出，实例级归一化的引入使缺陷特征完整地展现，由7(c)第4、5列可以看出，本研究所提出方法进一步降低了亮度变化所带来的影响，使缺陷特征更加完整且清晰.

对于小尺度的缺陷，由图7(a)、(b)、 (d)第3列可以看出，实例级归一化的引入降低了细小缺陷的特征表示. 由图7(a)、(b)、(d)第4列和第3列可以看出，引入所提出的亮度过滤-残差模块相比较引入实例级归一化的情况，可以更完整地提取小缺陷特征. 进一步的，从图7(a) 、(b)、 (d)第5列可以看出，在所提出的亮度过滤-残差模块和对比白化损失(CWL)函数的共同作用下，模型可以完整精细地提取细小缺陷的特征.

2.7. 不同域泛化方法检测效率对比

为了验证所提方法可以在兼顾检测效率的同时达到了较高的检测精度，在YOLOv7和Faster_RCCN检测框架下对比不同域泛化方法的检测速度v和跨场景平均mAP，结果如表5所示. 可以看出， FF-FDDG相较于性能最好的域泛化方法SNR在检测速度方面下降了0.76帧/s，但所提方法在跨场景情况下相较于SNR的平均mAP提升了5.01%，综上， FF-FDDG在兼顾检测速度的同时达到了较高的检测精度.

表 5 不同域泛化方法检测效率

Tab.5 Detection efficiency of different domain generalization methods

方法	v/(帧·s⁻¹)	平均mAP	方法	v/(帧·s⁻¹)	平均mAP
基线1(YOLOv7)	35.98	71.45	基线2(Faster-RCNN)	27.53	60.94
IN	34.75	76.74	IN	26.93	63.10
SNR	30.95	78.36	SNR	26.37	61.81
CNSN	34.23	71.29	CNSN	26.23	55.93
FF-FDDG	31.26	84.02	FF-FDDG	25.16	66.17

3. 结　语

通过分析现有基于实例级归一化的域泛化方法存在的不足，发现本研究提出的FF-FDDG通过降低实例级归一化无任务性的影响，在跨场景光伏电池表面缺陷数据上具备更强的泛化性能，能够有效缓解跨场景缺陷检测任务中由图像亮度变换引起的深度缺陷检测模型泛化能力差的问题. 不过，在更宽泛且亮度变化更复杂的情况下仍有较大的研究空间. 同时，同一类缺陷在不同图像亮度情况下边缘信息不明确的情况也会对跨场景情况下的缺陷分割任务带来更大的挑战，仍有待研究.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

CHEN H, PANG Y, HU Q, et al

Solar cell surface defect inspection based on multispectral convolutional neural network

[J]. Journal of Intelligent Manufacturing, 2020, 31 (2): 453- 468

DOI:10.1007/s10845-018-1458-z [本文引用: 1]

[2]

SU B, CHEN H, LIU K, et al

RCAG-Net: residual channel-wise attention gate network for hot spot defect detection of photovoltaic farms

[J]. IEEE Transactions on Instrumentation and Measurement, 2021, 70: 1- 14

DOI:10.1016/j.compind.2019.04.015 [本文引用: 1]

[3]

YU J, ZHENG X, LIU J

Stacked convolutional sparse denoising auto-encoder for identification of defect patterns in semiconductor wafer map

[J]. Computers in Industry, 2019, 109: 121- 133

[4]

MIAO R, GAO Y, GE L, et al

Online defect recognition of narrow overlap weld based on two-stage recognition model combining continuous wavelet transform and convolutional neural network

[J]. Computers in Industry, 2019, 112: 103115- 103125

DOI:10.1016/j.compind.2019.07.005 [本文引用: 1]

[5]

LI D, XIE Q, GONG X, et al

Automatic defect detection of metro tunnel surfaces using a vision-based inspection system

[J]. Advanced Engineering Informatics, 2021, 47: 101206- 101217

DOI:10.1016/j.aei.2020.101206 [本文引用: 1]

[6]

LI L, GAO K, CAO J, et al. Progressive domain expansion network for single domain generalization [C]// IEEE/CVF Conference on Computer Vision and Pattern Recognition . [s. l.]: IEEE, 2021: 224−233.

[7]

RAHMAN M M, FOOKES C, BAKTASHMOTLAGH M, et al. Multi-component image translation for deep domain generalization [C]// 2019 IEEE Winter Conference on Applications of Computer Vision . Waikoloa: IEEE, 2019: 579−588.

[8]

WANG Z, LUO Y, QIU R, et al. Learning to diversify for single domain generalization [C]// IEEE/CVF International Conference on Computer Vision . [s. l.]: IEEE, 2021: 834-843.

[9]

ZHOU K, YANG Y, HOSPEDALES T, et al. Learning to generate novel domains for domain generalization [C]// European conference on computer vision . Glasgow: Springer, 2020: 561−578.

[10]

FAN X, WANG Q, KE J, et al. Adversarially adaptive normalization for single domain generalization [C]// IEEE/CVF Conference on Computer Vision and Pattern Recognition . [s. l.]: IEEE, 2021: 8208−8217.

[11]

WANG H, LI Z, WANG H

Few-shot steel surface defect detection

[J]. IEEE Transactions on Instrumentation and Measurement, 2021, 71: 1- 12

[12]

DUAN G, SONG Y, LIU Z, et al

Cross-domain few-shot defect recognition for metal surfaces

[J]. Measurement Science and Technology, 2022, 34 (1): 015202

[13]

CHEN C, LI J, HAN X, et al. Compound domain generalization via meta-knowledge encoding [C]// IEEE/CVF Conference on Computer Vision and Pattern Recognition . New Orleans: IEEE, 2022: 7119−7129.

[本文引用: 8]

[14]

SHIAU Z Y, LIN W W, LIN C S, et al. Meta-learned feature critics for domain generalized semantic segmentation [C]// IEEE International Conference on Image Processing . Anchorage: IEEE, 2021: 2244-2248.

[15]

PAN X, LUO P, SHI J, et al. Two at once: enhancing learning and generalization capacities via ibn-net [C]// European Conference on Computer Vision . Munich: Springer, 2018: 464−479.

[16]

ZHOU K, YANG Y, CAVALLARO A, et al. Omni-scale feature learning for person re-identification [C]// IEEE/CVF International Conference on Computer Vision . Seoul: IEEE, 2019: 3702−3712.

[本文引用: 8]

[17]

XIE T, HUANG X, CHOI S K

Metric-based meta-learning for cross-domain few-shot identification of welding defect

[J]. Journal of Computing and Information Science in Engineering, 2023, 23 (3): 030902

DOI:10.1115/1.4056219 [本文引用: 8]

[18]

ZHOW Z, LAN C, GAO Z. Cross-domain defect detection network [C]// 2022 Asia Conference on Algorithms, Computing and Machine Learning . Hangzhou: IEEE, 2022: 272−279.

[19]

MA S, SONG K, NIU M, et al

Cross-scale fusion and domain adversarial network for generalizable rail surface defect segmentation on unseen datasets

[J]. Journal of Intelligent Manufacturing, 2022, 27: 1- 20

[20]

NAM H, KIM H E. Batch-instance normalization for adaptively style-invariant neural networks [C]// Proceedings of the 32nd International Conference on Neural Information Processing Systems . Montréal: IEEE, 2018: 2563−2572.

[本文引用: 2]

[21]

JIN X, LAN C, ZENG W, et al

Style normalization and restitution for domain generalization and adaptation

[J]. IEEE Transactions on Multimedia, 2021, 24: 3636- 3651

[22]

TANG Z, GAO Y, ZHU Y, et al. CrossNorm and SelfNorm for generalization under distribution shifts [C]// IEEE/CVF International Conference on Computer Vision . [s. l.]: IEEE, 2021: 52−61.

[23]

HUANG X, BELONGIE S. Arbitrary style transfer in real-time with adaptive instance normalization [C]// IEEE International Conference on Computer Vision . Venice: IEEE, 2017: 1501−1510.