基于峰值感知和多尺度约束的加权引导滤波器
Weighted guided filter based on peak-aware and multi-scale constraints
通讯作者:
收稿日期: 2023-06-16
基金资助: |
|
Received: 2023-06-16
Fund supported: | 甘肃省优秀研究生“创新之星”项目(2023CXZX-592). |
作者简介 About authors
张全(1996—),男,硕士生,从事图像处理研究.orcid.org/0000-0003-4382-2947.E-mail:
引导图像滤波无法保留锐利边缘,导致平滑图像出现结构过度模糊问题, 为此提出新的加权引导图像滤波器. 利用峰值感知加权提取图像的边缘和结构信息,通过多尺度约束提高所提滤波器的鲁棒性. 基于图像方差信息将滤波损失函数的正则化项系数改进为自适应式. 边缘感知平滑、图像细节增强、纹理去除平滑以及图像去噪领域的应用实验结果表明, 所提滤波器在视觉效果、峰值信噪比以及结构相似度上均优于参与对比的引导图像滤波器. 与边缘感知平滑实验中次优滤波器的峰值信噪比和结构相似度相比,所提滤波器的峰值信噪比平均高2.62 dB, 结构相似度平均高
关键词:
A new weighted guided image filter was proposed for the problem that guided image filtering fails to preserve sharp edges and leads to excessive structural blurring in smoothed images. Peak-aware weighting was utilized to extract edge and structural information from images, and the robustness of the proposed filter was improved by multi-scale constraints. The regularization term coefficients of the filter loss function were improved to an adaptive form based on the image variance information. Application experiments were carried out in edge-aware smoothing, image detail enhancement, texture removal smoothing, and image denoising, and the results showed that the proposed filter outperformed the guided image filters involved in the comparison in terms of visualization, peak signal-to-noise ratio, and structural similarity. Compared with the peak signal-to-noise ratio and structural similarity of the suboptimal filters of the edge-aware smoothing experiments, the peak signal-to-noise ratio was 2.62 dB higher on average, and the structural similarity was
Keywords:
本文引用格式
张全, 刘海忠.
ZHANG Quan, LIU Haizhong.
图像平滑方法可以分为具有边缘保持特性滤波和没有边缘保持特性滤波2个类别. 高斯滤波器是典型的各向同性的平滑算子, 不具有保边特性, 会导致图像边缘模糊从而出现光晕和伪影. 针对这一缺陷, 出现了许多具有边缘保持特性的图像平滑方法, 比如基于全变分 (total variation, TV) 的模型[1-2]、双边滤波器[3-4]、加权最小二乘滤波器[5-6]、基于直方图均衡化的模型[7-8]、侧窗滤波器[9-10]等. 具有边缘保持特性滤波的方法在计算领域的摄影和图像处理方面应用广泛, 典型的应用包括图像去噪[11-12], 细节增强[13-14], 高动态范围的图像色调映射[15-16], 图像融合[17-18], 纹理去除[19-20]等.
引导滤波算法是具有边缘保持性能的图像平滑算法. 引导图像滤波器 (guided image filter, GIF)[21]依据从引导图像提取的信息来计算滤波输出. GIF具有保边性能且计算效率高, 但是无法保留比较锐利的边缘, 会出现边缘模糊的平滑结果. 研究人员提出GIF的改进模型[21-26]. Li等[22]提出加权引导滤波器 (weighted guided image filter, WGIF), 通过在GIF中引入边缘感知权重来提高模型提取图像结构信息的能力, 这一定程度上改善了GIF无法保留锐边的缺点. 梯度域引导图像滤波器 (gradient domain guided image filter, GGIF)[23]也是基于局部优化, 不同的是多尺度约束被引入损失函数的正则化项, 使图像的边缘与细节更好地分离, 能够进一步提升滤波器的保边性能, 但是GGIF对于结构区域附近的纹理平滑效果欠佳. 单边窗引导滤波器 (side window guided filter, SWGIF)[24]以单边窗口为局部窗口, 视每个像素为潜在边缘, 侧窗策略计算引导滤波的输出, 能够一定程度上提高滤波器的保边性能, 但是SWGIF会保留图像结构区域附近的纹理和异常噪声点. 基于Steering核的引导滤波器 (weighted guided image filtering with steering kernel, SKWGIF)[25]基于加权平均策略, 以Steering核获取引导图像的局部结构信息, 增强了滤波器的边缘保持性能. 由于Steering核算法的复杂性, SKWGIF比GIF、WGIF、GGIF等方法计算耗时多. Deng等[26]将广义伽马分布作为先验分布, 将平滑和锐化统一到单个模型中, 提出基于广义伽马分布的边缘感知平滑-锐化滤波器, 该模型的边缘保持的性能有很大的提升空间. Liu等[27]提出峰值感知引导滤波,用于噪声频谱信号的保峰平滑. 峰值感知作为引导滤波器的权重, 能够较好地保留输入频谱信号的峰值高度、峰值宽度和峰值位置, 但是峰值感知自适应对于图像中的细小结构和微弱边缘的保持能力有待提高. Li等[28]提出用于图像增强的自适应加权引导图像滤波算法, 为了更好地保持边缘和结构, 以初始深度图构建引导图像, 通过设置自适应的系数来抑制噪声和增强细节. 虽然该算法一定程度上提高了模型的边缘保持能力, 但是引导图像的构建和平滑系数的定义依赖于估计得到的深度图像, 聚焦算法本身的局限性会影响滤波结果.
针对以上问题,本研究提出基于峰值感知和多尺度约束的加权引导滤波器. 该滤波器使用峰值感知作为边缘感知加权定义方法, 引入多尺度约束以提高滤波模型的结构保留能力; 通过引导图像的方差信息实现正则化项系数的自适应, 进一步提高加权引导滤波算法的边缘保持能力.
1. 相关工作
1.1. 引导图像滤波器
假设
式中:
将式 (1) 代入式 (2) 得到
式中:
式中:
式中:
若输入图像作为引导图像, 则
输入图像的像素
在WGIF[22] 中, 权重
1.2. 峰值感知加权
在峰值感知引导滤波方法[27]中, 峰值感知权重的2种定义分别是基于二阶导数和输入信号的值. 在图像处理中, 结构和边缘区域的二阶导数明显大于非结构区域, 基于二阶导数可以定义权重w1来获得图像
式中:
2. 所提滤波器和模型分析
2.1. 峰值感知加权和多尺度约束的引导滤波器
GIF、WGIF、GGIF等和所提滤波器基于共同的假设:滤波输出满足式 (1) . 若
式中:
式中:
所提滤波器的最终输出由式(9)加权平均得到,
将
2.2. 模型分析
2.2.1. 模型系数分析
当引导图像和输入图像相同时, 模型系数表示为
若像素点位于平坦区域, 则
图 1
2.2.2. 峰值感知加权和多尺度约束模型分析
为了说明峰值感知加权和多尺度约束在模型中作用,通过图像结构相似度SSIM (structural similarity)来评估多组参数设置下WGIF(模型1)、使用峰值感知加权(模型2)以及使用峰值感知加权和多尺度约束(模型3)的图像平滑处理结果, 如表1所示. 可以看出,在9种参数设置下模型1和模型2的SSIM平均值相差0.02, 即同等平滑强度下2种加权方式的结构保持能力近似. 模型3的SSIM最大, 比模型1平均高
表 1 不同滤波器模型的结构相似度对比
Tab.1
SSIM | ||||
模型1 | 模型2 | 模型3 | ||
2 | 0.01 | |||
4 | 0.01 | |||
8 | 0.01 | |||
2 | 0.10 | |||
4 | 0.10 | |||
8 | 0.10 | |||
2 | 1.00 | |||
4 | 1.00 | |||
8 | 1.00 |
2.2.3. 正则化项系数自适应对模型性能的影响
表 2 正则化项系数自适应前后的模型性能对比
Tab.2
自适应前 | 自适应后 | |||||
PSNR/dB | SSIM | PSNR/dB | SSIM | |||
2 | 0.01 | 37.67 | 39.10 | |||
4 | 0.01 | 36.68 | 38.34 | |||
8 | 0.01 | 36.29 | 38.18 | |||
2 | 0.10 | 34.38 | 35.12 | |||
4 | 0.10 | 32.15 | 33.14 | |||
8 | 0.10 | 30.35 | 31.73 | |||
2 | 1.00 | 33.85 | 33.99 | |||
4 | 1.00 | 31.31 | 31.54 | |||
8 | 1.00 | 29.07 | 29.46 |
图 2
3. 图像滤波应用实验
在边缘感知平滑、图像细节增强、图像纹理去除平滑、图像去噪等领域进行图像滤波应用实验. 实验硬件为NVIDIA GeForce RTX 2060显卡, AMD Ryzen7-4800H CPU, 16G显存. 软件环境为Windows 10操作系统,python 环境为 python3.6.15.
3.1. 边缘感知平滑
设计2个边缘感知平滑实验,对比不同模型的保边性能. 选用PSNR, SSIM作为评价指标. 模型的引导图像均为输入图像本身, 分别取
图 3
图 3 不同滤波器模型的图像平滑结果视觉对比
Fig.3 Visual comparison of image smoothing results for different filter models
表 3 不同滤波器模型的图像平滑结果对比
Tab.3
模型 | PSNR/dB | SSIM | ||||||
0.12 | GIF | 30.98 | 30.17 | 29.71 | ||||
WGIF | 31.29 | 30.42 | 29.92 | |||||
GGIF | 36.03 | 34.99 | 34.57 | |||||
SWGIF | 37.32 | 34.47 | 32.43 | |||||
SKWGIF | 32.24 | 31.22 | 30.79 | |||||
本研究 | 39.10 | 38.34 | 38.18 | |||||
0.22 | GIF | 26.85 | 25.26 | 23.90 | ||||
WGIF | 27.26 | 25.59 | 24.14 | |||||
GGIF | 34.14 | 32.05 | 30.47 | |||||
SWGIF | 34.38 | 30.31 | 27.44 | |||||
SKWGIF | 28.46 | 26.55 | 25.11 | |||||
本研究 | 36.23 | 34.64 | 33.68 | |||||
0.42 | GIF | 24.53 | 22.53 | 20.67 | ||||
WGIF | 24.91 | 22.81 | 20.84 | |||||
GGIF | 33.51 | 30.80 | 28.39 | |||||
SWGIF | 32.96 | 28.02 | 24.58 | |||||
SKWGIF | 26.28 | 23.83 | 21.78 | |||||
本研究 | 34.73 | 32.60 | 31.01 |
将图2(b)的灰度图作为6个滤波器的引导图像和输入图像, 共有参数设置为
图 4
图 4 输入图像和6个模型滤波输出的第180个水平剖面的像素强度分布
Fig.4 Pixel intensity distribution of 180th horizontal profile for input image and six model filtered outputs
3.2. 图像细节增强
图像细节增强是图像处理的任务之一, 图像增强的目标是通过处理图像, 提高图像重要细节信息或者目标的辨识度, 使增强后的图像比原始图像更适应于特定应用. 图像细节增强的基本思路是由滤波器得到输入图像
式中:
图 5
图 5 不同滤波器模型的图像细节增强效果视觉对比
Fig.5 Visual comparison of image detail enhancement effect for different filter models
3.3. 图像纹理去除平滑
图像纹理去除通过抑制输入图像中的纹理细节得到图像的结构, 是计算机视觉中具有挑战性的任务之一. 常见的纹理去除平滑通常包含基于滤波的方法[29]和基于优化的方法[1]. Zhang等[30]提出滚动引导滤波器, 在纹理去除领域有成功的应用. 参考滚动引导滤波器的思想, 在图像纹理去除时,首次平滑以输入图像本身为引导图像, 之后的每次平滑都以上次的平滑结果作为引导图像, 而输入图像保持不变. 设置6个滤波器模型的共有参数
图 6
图 6 不同滤波器模型的纹理去除效果视觉对比
Fig.6 Visual comparison of texture removal effect for different filter models
3.4. 图像去噪
图 7
表 4 不同滤波器模型的图像去噪结果对比
Tab.4
模型 | PSNR/dB | SSIM | TS/s |
GIF | 27.14 | 0.006 | |
WGIF | 28.51 | 0.006 | |
GGIF | 32.52 | 0.009 | |
SWGIF | 28.26 | 0.048 | |
SKWGIF | 27.35 | 22.795 | |
本研究 | 34.71 | 0.010 |
直观对比6种滤波器的去噪性能, 设置相同的参数, 可视化不同滤波器模型迭代不同次数的去噪结果. 如图8 (b) 所示为添加均值为0, 方差为0.1的高斯噪声得到的噪声图像. 迭代去噪每次迭代的引导图像均为无噪声图像, 第一次迭代的输入图像为待处理的噪声图像,之后每一次迭代的输入图像均为上次迭代的输出图像. 设置6个滤波器模型的共有参数
图 8
图 9
图 9 不同滤波器模型的图像去噪结果视觉对比
Fig.9 Visual comparison of image denoising results for different filter models
4. 结 语
本研究提出基于峰值感知和多尺度约束的加权引导图像滤波器, 同时将滤波模型损失函数的正则化项系数改进为基于方差的自适应参数, 提高了引导滤波模型的边缘保持能力, 解决了经典的引导滤波算法无法提取锐利的图像结构信息的问题. 实验分析显示,所提滤波器的局部线性模型的系数比GIF、GGIF、WGIF等包含的图像的边缘和结构信息更多, 表明所提滤波器保边性能更好. 将所提滤波器应用到边缘感知平滑、图像去噪、图像细节增强以及纹理去除平滑领域, 证明了所提滤波器优越性. 对比视觉效果发现, 在相同参数设置下, 所提滤波器优于对比的5种滤波器模型; 在边缘感知平滑实验中, 在相同参数设置下,所提滤波器的PSNR比GGIF的PSNR平均高2.62 dB, SSIM平均高0.0286. 在图像去噪实验中, 在相同参数设置下, 所提滤波器不增加时间复杂度且获得最大的PSNR和最高的SSIM. 提出滤波器中的权重均相等, 如何基于输入图像实现权重的自适应, 以进一步增强引导滤波器模型的边缘保持性能是未来的研究方向.
参考文献
Guided image filtering
[J].DOI:10.1109/TPAMI.2012.213 [本文引用: 2]
Structure extraction from texture via relative total variation
[J].
Hyperspectral image denoising by total variation-regularized bilinear factorization
[J].DOI:10.1016/j.sigpro.2020.107645 [本文引用: 1]
Weighted guided image filtering
[J].DOI:10.1109/TIP.2014.2371234 [本文引用: 2]
Gradient domain guided image filtering
[J].DOI:10.1109/TIP.2015.2468183 [本文引用: 2]
Side window guided filtering
[J].DOI:10.1016/j.sigpro.2019.07.026 [本文引用: 1]
Weighted guided image filtering with steering kernel
[J].DOI:10.1109/TIP.2019.2928631 [本文引用: 1]
On fast bilateral filtering using fourier kernels
[J].DOI:10.1109/LSP.2016.2539982 [本文引用: 1]
Structure-preserving texture filtering for adaptive image smoothing
[J].DOI:10.1016/j.jvlc.2018.02.002 [本文引用: 1]
A guided edge-aware smoothing-sharpening filter based on patch interpolation model and generalized gamma distribution
[J].DOI:10.1109/OJSP.2021.3063076 [本文引用: 2]
Peak-aware guided filtering for spectrum signal denoising
[J].DOI:10.1016/j.chemolab.2022.104508 [本文引用: 2]
Edge-preserving decompositions for multi-scale tone and detail manipulation
[J].
Medical images fusion by using weighted least squares filter and sparse representation
[J].DOI:10.1016/j.compeleceng.2018.03.037 [本文引用: 1]
Adaptive weighted guided image filtering for depth enhancement in shape-from-focus
[J].DOI:10.1016/j.patcog.2022.108900 [本文引用: 1]
Adaptive bilateral texture filter for image smoothing
[J].DOI:10.3389/fnbot.2022.729924 [本文引用: 1]
Adaptive histogram equalization of wavelet sub bands for the enhancement of contrast in aerial images
[J].
Image smoothing based on histogram equalized content-aware patches and direction-constrained sparse gradients
[J].DOI:10.1016/j.sigpro.2021.108037 [本文引用: 1]
Fast and efficient implementation of image filtering using a side window convolutional neural network
[J].DOI:10.1016/j.sigpro.2020.107717 [本文引用: 1]
Image denoising by sparse 3-D transform-domain collaborative filtering
[J].DOI:10.1109/TIP.2007.901238 [本文引用: 1]
Real-time image smoothing via iterative least squares
[J].
Dynamic range compression and detail enhancement algorithm for infrared image
[J].DOI:10.1364/AO.53.006013 [本文引用: 1]
Visual-salience-based tone mapping for high dynamic range images
[J].DOI:10.1109/TIE.2014.2314066 [本文引用: 1]
Detail-preserving multi-exposure fusion with edge-preserving structural patch decomposition
[J].DOI:10.1109/TCSVT.2021.3053405 [本文引用: 1]
Detail-enhanced exposure fusion
[J].DOI:10.1109/TIP.2012.2207396 [本文引用: 1]
/
〈 |
|
〉 |
