<img src="https://www.zjujournals.com/eng/images/1008-973X/images/logo.png" class="img-responsive">

图 1 基于掩模和非局部注意力的双阶段去雨网络框架图

Fig.1 Framework of dual-stage deraining network based on mask and non-local attention

给定大小为$ {{\bf{R}}^{H \times W \times 3}} $的有雨图像，其中$H \times W$表示图像的大小，去雨网络模型工作流程如下：1）利用$ {\text{3}} \times {\text{3}} $卷积提取图像浅层特征，同时对有雨图像应用形态学运算生成雨纹掩模，将浅层特征和雨纹掩模送入编码器. 2）编码器执行多个MAB模块操作，每个MAB模块基于雨纹掩模识别雨纹像素，进行掩模注意力计算，降低雨纹对特征提取的干扰，保证后续解码过程的准确性. 3）解码器阶段执行多个级联的NAB模块操作，每个NAB模块在利用非局部相似性对像素重排后进行注意力计算，通过在更大空间范围内捕捉和利用信息，提高图像细节恢复能力，最后将像素逆映射回其原始位置以保持一致性. 同时在编码器-解码器同一级别特征之间建立跳跃连接^[27]以保持模型训练的稳定性. 4）为了提取更加丰富的多尺度特征，编码器和解码器各层均配置了特定的空间分辨率和通道数，并引入像素混洗操作^[28]执行采样操作. 最后，解码器的输出通过$ {\text{3}} \times {\text{3}} $卷积进行通道维度调整，同时构建全局残差连接得到输出图像. 上述过程可以表示为

(1)$ \boldsymbol{I}_{\mathrm{c}}=\boldsymbol{I}_{\mathrm{r}}+\left(F_{\text {decoder }}\left(F_{\text {encoder }}\left(\boldsymbol{I}_{\mathrm{r}}, \boldsymbol{M}_{\text {binary }}\right)\right)\right) . $

式中：$ {\boldsymbol {I}_{\mathrm{c}}} $和${\boldsymbol{I}_{\mathrm{r}}}$分别表示输出的重建图像和输入的有雨图像，$ {\boldsymbol{M}_{\rm{binary}}} $表示输入的雨纹掩模，${{F}_{\rm{encoder}}}( \cdot )$和${{F}_{\rm{decoder}}}( \cdot )$分别为编码器和解码器结构.

2.2. 雨纹掩模生成模块

为了动态定位雨纹区域，首先使用形态学顶帽变换提取雨纹特征图，如图2（a）所示. 基于雨纹在亮度通道中高对比度的线性特征，使用输入图像的亮度分量$ \boldsymbol{Y} \in {{\bf{R}}^{H \times W}} $，进行形态学顶帽操作，得到雨纹特征图$ {\boldsymbol{M}_{\rm{initial}}} $. 计算过程如下：

图 2

图 2 雨纹掩模生成模块

Fig.2 Rain streak mask generation block

(2)$ {\boldsymbol{M}_{\rm{initial}}} = \boldsymbol{Y} - \left( {\boldsymbol{Y} \circ \boldsymbol{B}} \right) . $

式中：$ \boldsymbol{Y} \circ \boldsymbol{B} $表示以结构元素B执行的开操作（先腐蚀后膨胀），B为$ {\text{3}} \times 5 $矩形核，其长轴方向与雨纹典型倾斜方向一致. 雨纹通常表现为图像中细小的亮线或亮斑，而顶帽变换能够提取出图像中的亮区域. 图2（b）给出了真实雨纹特征图和本研究提取雨纹特征图的对比效果，可以看到两者在形态、分布及纹理细节上均呈现高度相似性，验证了此操作在雨纹提取中的有效性. 为了适应不同分辨率的MAB模块，须对$ {{\boldsymbol{M}}_{\rm{initial}}} $进行下采样和卷积操作实现分辨率对齐，以获取第l层编码器的雨纹特征图$ {\boldsymbol{M}}^{(l)}_{\rm{aligned}} $，计算公式为

(3)$ \boldsymbol{M}^{(l)}_{\text {aligned }}=\operatorname{Conv}\left(\text { PixelUnShuffle }\left(\boldsymbol{M}_{\text {initial }}\right)\right) . $

式中： $ \text { PixelUnShuffle}\left( \cdot \right) $为像素混洗下采样操作, $ {\mathrm{Conv}}\left( \cdot \right) $为$ {\text{3}} \times {\text{3}} $的卷积操作.

为了提高掩模生成的鲁棒性，使用动态阈值$ \tau $对雨纹特征图$ {\boldsymbol{M}}^{(l)}_{\rm{aligned}} $进行二值化，获取雨纹掩模$ {\boldsymbol{M}}^{(l)}_{\rm{binary}} $作为编码器对应层的输入. 计算公式为

(4)$ {{M}}^{(l)}_{\text {binary }}(i, j)=\left\{\begin{array}{lc}1, & {{M}}^{(l)}_{\text {aligned }}(i, j)< \tau; \\0, & \text { 其他 }.\end{array} \right. $

式中：$ {{M}}^{(l)}_{\rm{aligned}}(i,j) $和$ {{M}}^{(l)}_{\rm{binary}}(i,j) $分别是雨纹特征图$ {\boldsymbol{M}}^{(l)}_{\rm{aligned}} $和雨纹掩模$ {\boldsymbol{M}}^{(l)}_{\rm{binary}} $中第i行，第j列的元素. 雨纹掩模实现了对雨纹区域和非雨纹区域的明确定位.

2.3. 雨纹掩模注意力模块

传统Transformer架构采用全局自注意力机制，会在所有图像块间形成全连接注意力映射，导致自注意力计算受到有雨像素的影响，增加模型从退化特征中恢复目标特征的难度. 为了抑制雨纹干扰，MAB模块利用雨纹掩模筛选的无雨特征，构建雨纹掩模注意力机制，通过前馈神经网络，解耦雨纹对背景特征学习的干扰，有效提取图像关键特征. MAB模块组成如图3所示. 首先，使用雨纹掩模与键矩阵K进行内积操作筛选出干净特征，得到掩模键矩阵$ {\boldsymbol{K}}'$，计算过程如下：

图 3

图 3 雨纹掩模注意力模块（MAB）结构图

Fig.3 Structure of masked attention block（MAB）

(5)$ {\boldsymbol{K}}' = {\boldsymbol{K}} \odot {\boldsymbol{M}}^{(l)}_{\rm{binary}} . $

式中： $ \odot $表示内积操作. 针对滑动窗口内查询矩阵$ {\boldsymbol{Q}} $、掩模键矩阵$ {\boldsymbol{K}}' $及值矩阵$ {\boldsymbol{V}} $，注意力计算重构为

(6)$ \operatorname{Attention}\left(\boldsymbol{Q}, \boldsymbol{K}^{\prime}, \boldsymbol{V}\right)=\operatorname{Softmax}\left(\frac{\boldsymbol{Q} \boldsymbol{K}'^ {\mathrm{T}}}{\sqrt{d'_k}}\right) \boldsymbol{V} . $

式中：$d'_k $为掩模键矩阵${\boldsymbol{K}}' $的维度.

通过上述过程，雨纹区域对应位置的权重被强制置零，抑制噪声特征通过注意力传播，同时保留了干净无雨区域的全局建模能力.

2.4. 非局部注意力模块

图像具有非局部的内在特性，具体表现为图像中存在大量重复的纹理和结构，即使空间位置不相邻的像素也可能具有相似的颜色和结构特征. 在图像去雨任务中，雨纹遮挡造成局部特征丢失，如边缘、轮廓、纹理等细节特征，因此要求网络具备强大的全局信息捕捉能力，有效建模远距离的空间依赖关系，以弥补局部相似特征的缺失.

传统空间注意力机制受限于局部窗口感受野，其远程建模能力主要通过级联滑动窗口构建逐级传递信息的传输链实现. 然而，这条传输链极易因路径缺失或中间节点特征衰减导致远程依赖关系建模失败. 为此，NAB模块构建邻域增强的非局部注意力机制，旨在通过非局部特征相似性引导像素重组，突破空间约束，增强远程依赖建模效率. NAB模块由基于非局部聚类的特征重组、非局部注意力计算和逆映射特征恢复3个关键组件构成，如图4所示.

图 4

图 4 非局部注意力模块（NAB）结构图

Fig.4 Structure of non-local attention block（NAB）

为了综合衡量特征图像素的灰度和结构相似性，首先采用均值滤波对特征图进行预处理. 然后，采用基于非局部聚类的特征重组，将远距离相似特征重排到一起，使远距离相似特征转变为局域相似特征，用于注意力计算，解决因窗口注意力计算传输链衰减引起的远距离建模失败.

具体而言，给定输入特征图$ {\boldsymbol{F}} \in {{\bf{R}}^{\hat H \times \hat W \times C}} $，其中，$ \hat H \times \hat W $表示特征图的大小，$C$表示特征图的通道数，对每个空间单元$ (m,n) $执行8邻域均值滤波操作，生成具有空间结构编码的新特征图$ {\boldsymbol{F}}' $，其中，$ m \in \{ 0,1, \cdots ,\hat H - 1\} $，$ n \in \{ 0,1, \cdots ,\hat W - 1\} $. 新特征图$ {\boldsymbol{F}}' $沿通道维度展开为$ {\boldsymbol{F}}' \in {{\bf{R}}^{\hat H\hat W \times C}} $，并通过K-means算法将其聚类为 k个类别.

(7)$ F_{m, n}^{\prime}=\dfrac{1}{9} \sum_{{a}=-1}^l \sum_{{b}=-1}^l F_{{m}+{a}, n+{b}} , $

(8)$ L_{m, n}=\underset{l \in\{1,2, \cdots, k\}}{\operatorname{argmin}}\left\|F_{m, n}^{\prime}-\mu_{{k}}\right\|_2^2 . $

式中：$ F_{m,n}^{'} $为新特征图$ {\boldsymbol{F}}' $在$ (m,n) $处的像素值，$ {\mu _k} $为聚类第 k类中心，$ {L_{m,n}} $为聚类后每个像素的类别号. 聚类完成后，同类像素按行优先顺序连续排列，生成结构重组特征图$ {{\boldsymbol{F}}_{{\mathrm{re}}}} $. 该设计通过强制相似非局部特征在空间上邻接，使后续注意力计算能够更高效地捕获长距离依赖关系. 特征重组后，对重组特征图执行非局部注意力计算，最终通过逆映射特征恢复函数将特征恢复至原始空间排布，以确保数据一致性，其数学描述如下：

(9)$ \left.\begin{array}{l}\boldsymbol{F}_{\mathrm{re}}=\operatorname{Shuffle}\left(\boldsymbol{F}^{\prime}, L\right), \\\boldsymbol{X}=\operatorname{Shuffle}^{-1}\left(\operatorname{SWA}\left(\boldsymbol{F}_{\mathrm{re}}\right), L\right).\end{array}\right\} $

式中：L为所有像素的类别号组成的集合. $ {\mathrm{Shuffle}}( \cdot ) $为非局部聚类的特征重组映射函数，$ {{\mathrm{Shuffle}}^{ - 1}}( \cdot ) $为逆映射特征恢复函数，$ {\mathrm{SWA}}( \cdot ) $为非局部注意力计算函数.

3. 实验和分析

3.1. 实验设置

数据集与评估指标：本实验在4个主流去雨基准数据集上进行验证，包括：Rain200L^[17]、Rain200H^[17]、DID-Data^[29]、DDN-Data^[15]. 具体而言，Rain200L和Rain200H各包含1800组训练图像对和200组测试图像对；DID-Data和DDN-Data分别包含12000组和12600组训练图像对，以及1200组和1400组测试图像对，上述数据集均是在干净图像上添加不同密度和强度的雨纹获得的合成数据集. 为了保持与现有研究的可比性^[24]，本实验将以在亮度通道计算的峰值信噪比（peak signal to noise ratio，PSNR）和结构相似性指数（structure similarity index measure，SSIM）作为定量评估指标.

实现细节如下：模型基于PyTorch框架实现，在训练过程中，使用Adam优化器进行端到端的学习. NMSFormer模型1~4级模块的数量设置为$ \{ 6,4,4,6\} $，初始通道设置为48. 在图像预处理阶段，输入图像被裁剪为$ 256 \times 256 $大小的像素块，批大小设置为8. 训练分为2阶段：首先在Rain200L数据集上训练，学习率被初始化为3×10⁻⁴，采用余弦退火策略在1.5×10⁵次迭代后衰减至1×10⁻⁶；在其他数据集上以初始学习率1×10⁻⁴进行微调.

3.2. 测试结果

定量评估情况如下. 本研究将NMSFormer模型与常用及近期优秀方法进行了比较，包括基于先验知识的模型（GMM^[12]、DSC^[13]），基于CNN的模型（DDN^[14]、PreNet^[16]、RCDNet^[18]、DualGCN^[19]、SPDNet^[20]），基于Transformer的方法（Restormer^[23]、DRS-foemer^[24]、Regformer^[7]、NeRD-Rain^[25]），以及基于状态空间模型的MMamba^[26]. 如表1所示呈现了本研究方法与以上方法在4个雨纹数据集上的比较结果，其中，粗体表示最优值，下划线表示次优值. 可以看出，本研究方法在不同数据集上的指标都取得了优异的成绩. 特别地，在Rain200H数据集上，NMSFormer获得了33.23 dB的PSNR，与表现最优方法Regformer相比，PSNR高出0.77 dB，表明本研究方法对去除大雨和复杂的雨纹更加有效. 在其他数据集上，PSNR和SSIM指标也接近或刷新了当前最优结果，这清楚地表明了本研究方法的有效性.

表 1 不同方法的客观评价指标对比

Tab.1 Comparison of objective evaluations of different methods

方法	Rain200L		Rain200H		DID-Data		DDN-Data		平均指标
方法	PSNR/dB	SSIM	PSNR/dB	SSIM	PSNR/dB	SSIM	PSNR/dB	SSIM	PSNR/dB	SSIM
GMM (2015)	28.66	0.8652	14.50	0.4164	25.81	0.8344	27.55	0.8479	24.13	0.7410
DSC (2016)	27.16	0.8663	14.73	0.3815	24.24	0.8279	27.31	0.8373	23.36	0.7333
DDN (2017)	34.68	0.9671	26.05	0.8056	30.97	0.9116	30.00	0.9041	30.43	0.8971
PreNet (2019)	37.80	0.9814	29.04	0.8991	33.17	0.9481	32.60	0.9459	33.15	0.9436
RCDNet (2020)	39.17	0.9885	30.24	0.9048	34.08	0.9532	33.04	0.9472	34.13	0.9484
DualGCN (2021)	40.73	0.9886	31.15	0.9125	34.37	0.9620	33.01	0.9489	34.81	0.9530
SPDNet (2021)	40.50	0.9875	31.28	0.9207	34.57	0.9560	33.15	0.9457	34.88	0.9525
Restormer (2022)	40.99	0.9890	32.00	0.9344	35.29	0.9641	34.20	0.9571	35.62	0.9612
DRSgormer (2023)	41.23	0.9894	32.17	0.9326	35.35	0.9646	34.35	0.9588	35.78	0.9614
Regformer (2024)	41.51	0.9900	32.46	0.9353	35.43	0.9651	34.38	0.9591	35.95	0.9624
NeRD-Rain(2024)	41.71	0.9903	32.40	0.9373	35.53	0.9659	34.45	0.9596	36.02	0.9630
MMamba (2025)	41.49	0.9895	32.43	0.9345	35.41	0.9655	34.46	0.9593	35.95	0.9622
本研究算法	41.71	0.9907	33.23	0.9341	35.59	0.9680	34.54	0.9618	36.26	0.9636

新窗口打开| 下载CSV

视觉评估情况如下. 如图5、6所示，详尽展示了本研究方法雨纹去除的视觉结果. 如图5所示为上述方法在DID-Data数据集上的去雨效果，其中第2、4、6行是对图像局部区域的放大展示，旨在清晰呈现图像中细节变化. 在降雨场景中，白色雨纹常常与图像中竖直白色线状细节具有相似的颜色和结构，现有图像去雨模型在处理这类情况时，由于无法准确区分而将该类细节误判为雨纹去除. 如图5所示，这种误判会导致重建图像中纹理细节丢失，严重影响图像的质量和视觉效果. 而本研究方法能够更准确地识别雨纹和真实图像细节之间的差异，从而实现对雨纹的有效去除和对竖直线状细节的保留.

图 5

图 5 不同算法在 DID-Data数据集上的去雨效果对比

Fig.5 Comparison of deraining effect of different algorithms on DID-Data

图 6

图 6 不同算法在 Rain200H数据集上的去雨效果对比

Fig.6 Comparison of deraining effect of different algorithms on Rain200H

如图6所示展示了上述方法在Rain200H数据集上的去雨效果. 在该数据集中，高强度的大雨对图像造成了严重的遮挡，导致图像局部纹理被掩盖，图中标注了矩形框以突出不同方法在重建被大雨严重遮挡的纹理细节时的表现. 如图6所示，现有模型难以利用有限的信息对远距离依赖关系进行有效建模，在最终的去雨结果中，矩形框内出现明显的细节缺失，视觉效果不佳. 本研究方法精准定位图像中的非局部相似背景信息，并在注意力计算时建立有效关联来恢复被雨纹遮盖的细节纹理，显著提升了去雨后图像的视觉效果.

3.3. 消融实验

为了验证本研究提出的双阶段优化框架及核心模块的有效性，设计了6组对照实验分别从阶段化架构设计、雨纹掩模注意力及非局部注意力3个维度进行系统性验证. 在实验中，利用Rain200L数据集来训练和评估网络，基线模型采用Swin Transformer模块（Swin Transformer block，STB）构成的编码器-解码器结构，6组实验如下. 1）模型1：基线模型，编码器-解码器均由STB块组成；2）模型2：编码器-解码器均由MAB块组成；3）模型3：编码器-解码器均由NAB块组成；4）模型4：编码器-解码器分别由MAB块和STB块组成；5）模型5：编码器-解码器分别由STB块和NAB块组成；6）本模型：采用“雨纹抑制-细节重建”双阶段结构，编码器-解码器分别由MAB块和NAB块组成.

消融实验结果如表2所示. 首先，验证了双阶段模型中雨纹掩模注意力和非局部注意力的必要性. 模型5相比本模型在PSNR上降低0.34 dB，模型4相较于本模型在PSNR上降低0.30 dB，充分证明了2个模块对模型整体性能的提升. 更进一步，设置了模型2、3，验证分阶段去雨的有效性. 实验数据表明，模型2、3的指标都远低于分阶段模型4、5，说明了雨纹掩模注意力和非局部注意力对编码器和解码器的适用性，雨纹掩模注意力在特征提取阶段作用更大，而非局部注意力在图像重建阶段更重要，充分证明了本研究分阶段优化策略的有效性. 去雨可视化结果如图7所示，其他网络架构在去雨后仍存在雨纹残留或细节恢复不完整问题，而本研究方法去雨效果明显优于其他网络.

表 2 本研究方法不同模块消融实验的结果

Tab.2 Results of ablation experiments on different modules of proposed method

模型		编码器	解码器	PSNR/dB	SSIM
不分阶段	模型1	STB	STB	40.69	0.9852
	模型2	MAB	MAB	40.99	0.9851
	模型3	NAB	NAB	41.10	0.9862
分阶段	模型4	MAB	STB	41.41	0.9869
	模型5	STB	NAB	41.37	0.9871
	本模型	MAB	NAB	41.71	0.9907

新窗口打开| 下载CSV

图 7

DOI:10.11959/j.issn.1000-436x.2017149 [本文引用: 1]

图 7 消融实验去雨效果对比

Fig.7 Comparison of deraining effect of ablation experiments

4. 结　语

提出双阶段NMSFormer图像去雨网络. 将图像去雨任务按照雨纹抑制、细节重建的分阶段递进优化实现；在编码阶段，利用雨纹掩模注意力机制，阻断雨纹噪声传播，提高特征表达质量；在解码阶段，构建非局部注意力机制，通过特征聚类重组策略捕捉像素间远程依赖关系，提高图像去雨的细节重建能力. 实验结果表明，在多个公开数据集中，本研究方法在PSNR和SSIM指标上表现优异，同时雨纹去除彻底，纹理细节恢复清晰，在密集雨纹干扰下仍能有效恢复图像的竖直线状细节，表现出了卓越的模型性能. 未来计划在保持模型性能的基础上，进一步优化网络结构，实现模型的轻量化.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[2]

汤红忠, 王翔, 张小刚, 等

面向单幅图像去雨的非相干字典学习及其稀疏表示研究

[J]. 通信学报, 2017, 38 (7): 28- 35

TANG Hongzhong, WANG Xiang, ZHANG Xiaogang, et al

Incoherent dictionary learning and sparse representation for single-image rain removal

[J]. Journal on Communications, 2017, 38 (7): 28- 35

DOI:10.11959/j.issn.1000-436x.2017149 [本文引用: 1]

[3]

YANG W, TAN R T, WANG S, et al

Single image deraining: from model-based to data-driven and beyond

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, 43 (11): 4059- 4077

DOI:10.1109/TPAMI.2020.2995190 [本文引用: 1]

[4]

CARION N, MASSA F, SYNNAEVE G, et al. End-to-end object detection with transformers [C]// The 16th European Conference on Computer Vision. Cham: Springer, 2020: 213–229.

[5]

HONG D, HAN Z, YAO J, et al

SpectralFormer: rethinking hyperspectral image classification with transformers

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 1- 15

[6]

杨军, 张琛

基于边界点估计与稀疏卷积神经网络的三维点云语义分割

[J]. 浙江大学学报: 工学版, 2024, 58 (6): 1121- 1132

YANG Jun, ZHANG Chen

Semantic segmentation of 3D point cloud based on boundary point estimation and sparse convolution neural network

[J]. Journal of Zhejiang University: Engineering Science, 2024, 58 (6): 1121- 1132

[7]

LI B, ZHANG Z, ZHENG H, et al. Diving deep into regions: exploiting regional information Transformer for single image deraining [EB/OL]. (2024-08-04) [2025 -07-01]. https://arxiv.org/abs/2402.16033.

[8]

ZENG K, LIN H, YAN Z, et al

Non-local self-attention network for image super-resolution

[J]. Applied Intelligence, 2024, 54 (7): 5336- 5352

DOI:10.1007/s10489-024-05343-y [本文引用: 1]

[9]

ZHENG X, LIAO Y, GUO W, et al. Single-image-based rain and snow removal using multi-guided filter [C]// International Conference Neural Information Processing. Berlin, Heidelberg: Springer, 2013.

[10]

KIM J H, LEE C, SIM J Y, et al. Single-image deraining using an adaptive nonlocal means filter [C]// 2013 IEEE International Conference on Image Processing. Melbourne: IEEE, 2013: 914–917.

[11]

CHEN D Y, CHEN C C, KANG L W

Visual depth guided color image rain streaks removal using sparse coding

[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2014, 24 (8): 1430- 1455

DOI:10.1109/TCSVT.2014.2308627 [本文引用: 1]

[1]

LIN C Y, TAO Z, XU A S, et al

Sequential dual attention network for rain streak removal in a single image

[J]. IEEE Transactions on Image Processing, 2020, 29: 6250- 6265

[12]

LUO Y, XU Y, JI H. Removing rain from a single image via discriminative sparse coding [C]// 2015 IEEE International Conference on Computer Vision (ICCV). Santiago: IEEE, 2015: 3397–3405.

[13]

LI Y, TAN R T, GUO X, et al. Rain streak removal using layer priors [C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016: 2736–2744.

[14]

FU X, HUANG J, DING X, et al

Clearing the skies: a deep network architecture for single-image rain removal

[J]. IEEE Transactions on Image Processing, 2017, 26 (6): 2944- 2956

DOI:10.1109/TIP.2017.2691802 [本文引用: 2]

[15]

FU X, HUANG J, ZENG D, et al. Removing rain from single images via a deep detail network [C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu: IEEE, 2017: 1715–1723.

[16]

REN D, ZUO W, HU Q, et al. Progressive image deraining networks: a better and simpler baseline [C]// 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Long Beach: IEEE, 2019: 3932-3941.

[17]

YANG W, TAN R T, FENG J, et al. Deep joint rain detection and removal from a single image [C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu: IEEE, 2017: 1685–1694.

[本文引用: 3]

[18]

WANG H, XIE Q, ZHAO Q, et al. A model-driven deep neural network for single image rain removal [C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle: IEEE, 2020: 3100–3109.

[19]

FU X, QI Q, ZHA Z, et al. Rain streak removal via dual graph convolutional network [C]// Proceedings of the AAAI Conference on Artificial Intelligence. [S. l. ]: AAAI Press, 2021: 1352–1360.

[20]

YI Q, LI J, DAI Q, et al. Structure-preserving deraining with residue channel prior guidance [C]// 2021 IEEE/CVF International Conference on Computer Vision (ICCV). Montreal: IEEE, 2021: 4218–4227.

[21]

DOAOVUTSKIY A, BEYER L, KOLESNIKOV A, et al. An image is worth 16x16 words: transformers for image recognition at scale [EB/OL]. (2021-06-03) [2025-07-01]. https://arxiv.org/abs/2010.11929.

[22]

LIU Z, LIN Y, CAO Y, et al. Swin transformer: hierarchical vision transformer using shifted windows [C]// 2021 IEEE/CVF International Conference on Computer Vision (ICCV). Montreal: IEEE, 2021: 9992–10002.

[23]

ZAMIR S W, ARORA A, KHAN S, et al. Restormer: efficient transformer for high-resolution image restoration [C]// 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New Orleans: IEEE, 2022: 5718–5729.

[24]

CHEN X, LI H, LI M, et al. Learning a sparse transformer network for effective image deraining [C]// 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver: IEEE, 2023: 5896–5905.

[本文引用: 3]

[25]

CHEN X, PAN J, DONG J. Bidirectional multi-scale implicit neural representations for image deraining [C]// 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle: IEEE, 2024: 25627–25636.

DOI:10.1016/j.neucom.2025.130161 [本文引用: 2]

[26]

OUYANG Z, LI W

MMamba: enhancing image deraining with Morton curve-driven locality learning

[J]. Neurocomputing, 2025, 638: 130161

[27]

HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition [C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016: 770–778.

[28]

SHI W, CABALLERO J, HUSZÁR F, et al. Real-time single image and video super-resolution using an efficient sub-pixel convolutional neural network [C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016: 1874–1883.

[29]

ZHANG H, PATEL V M. Density-aware single image de-raining using a multi-stream dense network [C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE, 2018: 695–704.