浙江大学学报(工学版), 2025, 59(10): 2078-2085 doi: 10.3785/j.issn.1008-973X.2025.10.008

交通工程、水利工程、土木工程

自动驾驶样本库中雪天场景融合构建方法

董兆龙,, 黄鹤,, 李战一, 杨澜, 王会峰

1. 长安大学 电子与控制工程学院,陕西 西安 710064

2. 长安大学 西安市智慧高速公路信息融合与控制重点实验室,陕西 西安 710064

3. 长安大学 信息工程学院,陕西 西安 710064

Snowy scene integration construction method in autonomous driving sample library

DONG Zhaolong,, HUANG He,, LI Zhanyi, YANG Lan, WANG Huifeng

1. School of Electronics and Control Engineering, Chang’an University, Xi’an 710064, China

2. Key Laboratory of Intelligent Expressway Information Fusion and Control, Chang’an University, Xi’an 710064, China

3. School of Information Engineering, Chang’an University, Xi’an 710064, China

通讯作者: 黄鹤,男,教授. orcid.org/0000-0002-7149-0460. E-mail:huanghe@chd.edu.cn

收稿日期: 2024-10-14  

基金资助: 国家自然科学基金资助项目(52472446);国家重点研发计划项目(2021YFB2501200);陕西省留学人员科技活动择优资助项目(2023001);中央高校基本科研业务费资助项目(300102325501).

Received: 2024-10-14  

Fund supported: 国家自然科学基金资助项目(52472446);国家重点研发计划项目(2021YFB2501200);陕西省留学人员科技活动择优资助项目(2023001);中央高校基本科研业务费资助项目(300102325501).

作者简介 About authors

董兆龙(2001—),男,硕士生,从事图像处理和信息融合研究.orcid.org/0009-0008-4426-8830.E-mail:2023132006@chd.edu.cn , E-mail:2023132006@chd.edu.cn

摘要

自动驾驶感知性能训练所需的雪天场景样本库数据收集难度大,样本数量较少,为此提出基于感知估计的雪天场景构建算法. 将雪天场景划分为积雪模型和雪线模型,提出基于空间感知的积雪平面构建算法,分析图像细微的梯度变化,估计初步积雪区域. 使用连通域分析方法细化初步积雪区域,将积雪区域与原图融合,获得积雪场景图像. 提出基于随机雪线模型的雪天场景构建算法,生成不同运动方向的雪花. 将积雪模型和雪线模型融合,利用多种基础雪线形态构建雪天场景. 多帧交通视频数据对比实验结果表明,在使用雪天场景融合方法构建的雪天场景中,随着雪量增加,图像的干扰信息和细节都明显增强,主观上接近实际雪天场景;随积雪和雪线密度的增加,加雪图像质量客观评价指标不断降低.

关键词: 自动驾驶 ; 雪天场景样本 ; 积雪场景 ; 雪线模型 ; 图像质量

Abstract

A snow scene construction algorithm based on perception estimation was proposed to address the problems of difficulty in collecting data from existing snow scene sample libraries and limited sample sizes during the training of autonomous driving perception performance. The snow scene was divided into two models: snow-covered model and snow-line model, and a snow-covered plane construction algorithm based on spatial perception was proposed to analyze the subtle gradient changes in the image and estimate the preliminary snow area. The preliminary snow areas were refined using connected domain analysis, and the areas were fused with the original image to obtain snow-covered scene images. A snow scene construction algorithm based on a random snow-line model was proposed to generate different motion directions for snowflakes. Snow-covered model and snow-line model were integrated, and various basic snow-line forms were utilized to construct snow scenes. Experimental results from the comparison of multi-frame traffic video data show that, in the snowy scenes constructed using the snowy scene fusion method, as the amount of snow increases, both the interference information and the details of the image are significantly enhanced, subjectively approaching the actual snow scene. Moreover, objective evaluation metrics for snow image quality decrease with the increase of snow cover and snow-line density.

Keywords: autonomous driving ; snowy scene sample ; snow-covered scene ; snow-line model ; image quality

PDF (5769KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

董兆龙, 黄鹤, 李战一, 杨澜, 王会峰. 自动驾驶样本库中雪天场景融合构建方法. 浙江大学学报(工学版)[J], 2025, 59(10): 2078-2085 doi:10.3785/j.issn.1008-973X.2025.10.008

DONG Zhaolong, HUANG He, LI Zhanyi, YANG Lan, WANG Huifeng. Snowy scene integration construction method in autonomous driving sample library. Journal of Zhejiang University(Engineering Science)[J], 2025, 59(10): 2078-2085 doi:10.3785/j.issn.1008-973X.2025.10.008

自动驾驶技术面临雪天视觉感知的挑战,有效的样本数据是测试视觉感知性能的关键. 雨雾天气里空气中的水雾颗粒折射或者反射导致场景信息的损失[1];在雪天场景中,雪花会直接阻挡光线传播,积雪覆盖还可能遮挡视野.

雪天样本库较少,已有的雪天样本库研究以雪线模型为主. Liu等[2]提出的Snow100k样本库包括合成样本数据和真实数据集,提供了100 000个合成雪天场景样本对和1 329个真实雪天场景样本. Chen等[3]提出的SRRS(snow removal in realistic scenario)样本库包含15 000个合成数据和1 000个来自网络的真实数据,其中合成原始数据集取自RESIDE(realistic single image dehazing)[4]数据集. Chen等[5]提出的CSD(comprehensive snow dataset)样本库包含10 000张合成图像,这些合成图像取自RESIDE数据集,采用图像编辑软件(如PhotoShop)进行雪线的数据合成. Chen等[6]提出的RVSD(realistic video desnowing dataset)视频样本库中有110组雪天视频数据,每组数据均包含雪、雾、晴朗场景数据,通过渲染引擎和各种增强技术生成具有多种逼真物理属性的雪. Zhang等[7]使用Photoshop建立基于公共数据集KITTI2012[8]的SnowKITTI2012数据集,它包含训练图片1 500张,测试图片1 000张. Zhang等[7]还提出基于Cityscapes[9-10]数据集的SnowCityScapes数据集,其中训练和测试图片各2 000张.

雪天模拟领域缺乏可任意控制雪量的仿真算法,本研究以自动驾驶视觉感知测试系统样本库中的雪天场景为对象,提出积雪区域与雪线模型结合的基于景深估计的雾天场景构建算法. 设定积雪模型为模拟地面积雪场景构建的模型,雪线模型为模拟不同雪花飘落形态场景构建的模型,开展不同模型条件下的多帧交通视频数据对比试验,测试所提算法性能.

1. 基于空间感知的积雪平面构建算法

1.1. 积雪区域感知

积雪是常见的雪天场景,积雪覆盖物体表面会阻碍目标观察,积雪较强的反光特性还可能影响感知周围物体[11-12]. 定义px,y为像素值,分析如图1所示的晴天场景图像可知,平坦物体表面的色彩变化较小,甚至很难被观测到;物体边缘区域的色彩变化明显. 图1中,路面区域相对平坦,像素整体变化较小,护栏和树木的像素变化较大.

图 1

图 1   晴天场景图像的像素波动情况

Fig.1   Pixel fluctuations in sunny scene images


积雪通常出现在图像像素波动平缓的区域,积雪区域感知即图像像素波动平缓区域提取工作,具体操作如下. 获取图像梯度,计算式为

$ G = \frac{1}{3}\sum\limits_{c \in \{ R,G,B{\text{\} }}} {\sqrt {{{\left( {\frac{{\partial {I_{{c}}}}}{{\partial x}}} \right)}^2}+{{\left( {\frac{{\partial {I_{{c}}}}}{{\partial y}}} \right)}^2}} } . $

式中:$ {{\partial {I_c}}}/{{\partial x}} $$ {{\partial {I_c}}}/{{\partial y}} $分别为图像在通道c中沿xy方向的梯度幅值. 选取梯度波动较小的区域作为可积雪区域,计算式为

$ {\text{Ma}}{{\text{p}}_{\text{s}}} = \left| G \right| < {G_{\text{l}}}. $

式中:Maps为积雪区域;Gl为波动阈值,在本研究中取为G的中位数. 梯度波动较小的区域包括天空,须将其从可积雪区域中消除. 天空受大气层散射影响,且图像主要呈现蓝色或者灰白色,通道B的数值往往高于通道RG的数值,为此简化求解过程为

$ {\text{Ma}}{{\text{p}}_{\text{s}}} = (G < {G_{\text{l}}}) \cap ({I_B} < ({I_R}+{I_G})/2+\omega ). $

式中:IBIGIR分别为图像通道RGBɷ为色彩偏差参数,在本研究中取为0.1. 如图2所示,图像经式(3)处理后,受天空区域的影响明显降低.

图 2

图 2   去除天空区域影响前后的图像对比

Fig.2   Image comparison before and after removing influence of sky region


1.2. 积雪场景构建

在完成可积雪区域感知后,图像的部分区域光线较暗、细节不清晰,导致这部分区域的信息精度不高. 进行可积雪区域的细化,具体方法的伪代码见算法1. 将细化后的积雪区域与原图融合,得到积雪场景图像,融合计算式为

$ {I_{{\text{SG}}}} = J \times {\text{Ma}}{{\text{p}}_{\text{s}}}'+(1 - {\text{Ma}}{{\text{p}}_{\text{s}}}'). $

式中:ISG为雪天积雪图像,Maps′为细化后的积雪区域,J为原图. 如图3所示,地面区域存在较多积雪.

图 3

图 3   积雪区域的图像细化处理及图像融合

Fig.3   Image refinement process for snow-covered areas and image fusion


算法1  Maps细化算法伪代码

输入 Maps图像.

输出 细化后的Maps′图像.

1. 计算Map连通域,根据连通域大小排序,记各连通域内坐标为Oc,像素点数为Nc.

2. 计算各连通域内的区域利用率,vi=Nc/(max(Oc)−min(Oc)).

3. 取利用率大于vi区域,作为细化后的Maps′图像,取vi=0.5.

2. 基于随机雪线模型的场景构建算法

2.1. 雪线模型

与雨线模型[13]相似,雪线模型是模拟场景干扰物在空气中运动的视觉画面;不同的是,雨滴受重力因素影响较大,尺寸几乎相同,运动方向相对统一;雪花受重力影响较小,受空气阻力的影响较大,运动方向和轨迹变化较大,下落形式也有单片成团之分. 如图4所示,雪花会将原本物体的反射光线吸收或反射,产生视觉上的白亮效果. 构建雪线模型,表达式为

图 4

图 4   白亮效果产生原理

Fig.4   Principle of white reflection effect


$ {I_{{\text{SS}}}} = J+\sum\limits_{i = 1}^n {{S_{{i}}}} . $

式中:ISS为雪天场景图像,Sii层雪线影响效果. 雪花的反射能力较强,雪线场景中雪花亮度受景深影响的衰减较少,因此不考虑场景深度对雪花亮度的影响.

2.2. 多源融合的雪天场景设计

2.2.1. 随机雪线生成算法设计

随机模拟雪线分布的位置,通过设计雪线滤波器对位置分布图进行滤波,获得单层雪线. 通过随机设置雪核信息(如雪线大小方向),融合多个单层雪线,获得多层雪天图像.

$ {S_{{\text{S}},i}} = {\text{SF}}\;({R_{\text{s}}},{\text{Map}}). $

式中:SS,i为雪线层;SF为雪线滤波器;Rs为滤波雪核,为基础雪线形态;Map为雪线分布图. 考虑到雪花下落的形态各异,雪花的基础形态随机从雨滴形态中选择,如图5所示.

图 5

图 5   雪线滤波示意图

Fig.5   Schematic diagram of snow line filtering


2.2.2. 雪天场景构建

在真实场景中,雪花受重力影响较小,飘落方向多变,雪花或雪团大小不一,在视觉中其大小与场景深度相关,景深越大,雪花尺寸越小,雪花感知密度越大. 通过多层雪线融合模拟不同景深下的雪线,计算式为

$ {S_{\text{S}}} = \sum\limits_{i = 1}^{{n_\delta }} {{S_{{\text{S}},i}}({\delta _{{\text{s}},i}},{\theta _{\text{r}}})} . $

式中:SS为多源融合后的雪线效果,θr为随机角度,δs,i为单层雪线中的雪花形态. 如图6所示为不同雪线密度δs的效果图. 将积雪平面构建算法与随机雪线模型结合,得到雪天场景构建算法,计算式为

图 6

图 6   雪线密度效果图

Fig.6   Outcome image of snow-line density


$ {I_{\text{s}}} = J \times {\text{Ma}}{{\text{p}}_{\text{s}}}'+(1+{\text{Ma}}{{\text{p}}_{\text{s}}}')+\sum\limits_{i = 1}^{{n_\delta }} {{S_{{\text{S}},i}}({\delta _{{\text{s}},i}},{\theta _{\text{r}}})} . $

基于感知估计的雪天场景构建流程如图7所示.

图 7

图 7   基于感知估计的雪天场景构建算法流程图

Fig.7   Flowchart of snow scene construction algorithm based on perception estimation


3. 实验结果分析

3.1. 雪天模型效果及评价

3.1.1. 主观评价

为了充分展示积雪前后图像差距,对交通视频数据中的部分关键帧分别进行加雪和积雪实验,雪线密度分别设置为10、20、30、40、50. 其中加雪实验对比不同雪线密度下图像质量的差距,可视化结果如图8所示;积雪实验在加雪实验基础上生成积雪效果,可视化结果如图9所示. 由图8可以看出,雪花飘落位置近乎随机,且大小与透视关系不一,不同雪花的边缘信息不同,较为符合雪花的实际形态. 由图9可以看出,本研究提出的积雪场景构建算法能够较好地模拟真实场景的积雪情况,很好地排除了天空区域的影响,与加雪实验中的雪花结合,构造出的雪天场景符合实际情况.

图 8

图 8   交通视频关键帧加雪实验可视化结果

Fig.8   Visualization results of snow addition experiment on traffic video key frames


图 9

图 9   交通视频关键帧积雪实验可视化结果

Fig.9   Visualization results of snow-covered scene experiment on traffic video key frames


3.1.2. 客观评价

选用无参评价指标:信息熵E[14]、平均梯度AG[15]、雾感知密度评估FADE[16];有参评价指标:峰值信噪比PSNR[17]、结构相似性指数SSIM[18]、模糊系数FC[19-20]对所提算法的性能进行客观评价,各帧图像在不同雪线密度下客观评价指标曲线如图10所示. 受雪线影响,图像信息熵不断降低,FADE不断增加,由于雪线总体覆盖面积较小,平均梯度下降不明显. PSNR及SSIM均随雪线密度增大而降低,模糊系数不断增大. 由于受积雪影响,雪线对图像质量的影响降低,导致积雪条件下PSNR、SSIM及模糊系数变化缓慢. 如表1所示为各帧图像在不同雪线密度下客观评价指标的平均值. 可以看出,随着δs的增加,信息熵、平均梯度、PSNR、SSIM逐步减小,FADE和模糊系数不断增大,与实际情况相符合. 结果表明,所提算法处理可有效获得不同雪量下的雪天场景效果.

图 10

图 10   不同雪线密度条件下,2种实验场景的算法性能评价曲线(含4个交通视频关键帧)

Fig.10   Algorithm performance evaluation curves for two experimental scenarios under different snow-line density conditions (contains four traffic video key frames)


表 1   不同雪线密度条件下,2种实验场景的算法性能评价结果

Tab.1  Algorithm performance evaluation results for two experimental scenarios under different snow-line density conditions

δs加雪实验积雪实验
EAGFADEPSNRSSIMFCEAGFADEPSNRSSIMFC
1014.4077.7190.63133.7190.9710.99413.10019.3650.41928.8810.5070.198
2014.4997.6840.65928.5350.9201.01013.13819.1370.42228.5890.4890.201
3014.3887.5780.71625.7140.8721.03712.97518.7450.44028.3250.4710.207
4014.1567.4600.80024.4570.8231.06112.71818.2160.46828.0790.4560.214
5013.8167.2030.89124.2380.7761.11213.41417.6340.49127.7950.4370.221

新窗口打开| 下载CSV


3.2. 多场景下雪天模型效果及评价

使用交通视频数据集之外的图像测试所提算法的性能,2组实验的可视化结果如图11所示. 如表2所示为图11原图在不同雪线密度下的客观评价指标. 可以看出,图像的各项评价指标与在交通视频数据集中的变化趋势相同,表明在不同场景下加雪和积雪模型均能够很好地模拟图像质量变化情况.

图 11

图 11   不同雪线密度条件下,2种实验的可视化结果(使用其他数据集图像)

Fig.11   Visualization results of two experiments under different snow-line density conditions (using other dataset image)


表 2   不同雪线密度条件下,2种实验的算法性能评价结果(使用其他数据集图像)

Tab.2  Algorithm performance evaluation results for two experiments under different snow-line density conditions (using other dataset image)

δs加雪实验积雪实验
EAGFADEPSNRSSIMFCEAGFADEPSNRSSIMFC
1012.0642.7641.33933.9340.9640.85010.24115.6390.82227.0920.4010.048
2012.1802.8921.34133.0210.9280.87310.32715.5890.84526.9960.3810.048
3012.2932.9461.35228.7520.9030.88210.26115.0960.87526.6430.3580.049
4012.2913.0971.35425.7530.8520.89012.29114.9250.89826.4320.3530.049
5012.1903.2331.42724.1520.7710.90112.19014.5770.92826.1250.3340.049

新窗口打开| 下载CSV


4. 结 语

本研究针对雪天场景提出基于感知估计的雪天场景构建算法(包括积雪场景构建算法和雪线模型算法),分别完成积雪场景和雪花飘落成像的场景构建. 实验结果表明,经所提算法处理后,图像质量随雪线密度不断降低,主观上场景变化明显. 所提算法可大量扩展雪天数据样本库,应用价值明显. 在后续的工作中,将利用本研究构建的雪天场景对自动驾驶领域的相关算法进行测试,完成在实际应用场景中的测试环节.

参考文献

KARAVARSAMIS S, GKIKA I, GKITSAS V, et al

A survey of deep learning-based image restoration methods for enhancing situational awareness at disaster sites: the cases of rain, snow and haze

[J]. Sensors, 2022, 22 (13): 4707- 4751

[本文引用: 1]

LIU Y F, JAW D W, HUANG S C, et al

DesnowNet: context-aware deep network for snow removal

[J]. IEEE Transactions on Image Processing, 2018, 27 (6): 3064- 3073

DOI:10.1109/TIP.2018.2806202      [本文引用: 1]

CHEN W T, FANG H Y, DING J J, et al. JSTASR: joint size and transparency-aware snow removal algorithm based on modified partial convolution and veiling effect removal [C]// Computer Vision – ECCV 2020. [S.l.]: Springer, 2020: 754–770.

[本文引用: 1]

LI B, REN W, FU D, et al

Benchmarking single-image dehazing and beyond

[J]. IEEE Transactions on Image Processing, 2019, 28 (1): 492- 505

DOI:10.1109/TIP.2018.2867951      [本文引用: 1]

CHEN W T, FANG H Y, HSIEH C L, et al. All snow removed: single image desnowing algorithm using hierarchical dual-tree complex wavelet representation and contradict channel loss [C]// Proceedings of the IEEE/CVF International Conference on Computer Vision. Montreal: IEEE, 2021: 4176–4185.

[本文引用: 1]

CHEN H, REN J, GU J, et al. Snow removal in video: a new dataset and a novel method [C]// Proceedings of the IEEE/CVF International Conference on Computer Vision. Paris: IEEE, 2023: 13165–13176.

[本文引用: 1]

ZHANG K, LI R, YU Y, et al

Deep dense multi-scale network for snow removal using semantic and depth priors

[J]. IEEE Transactions on Image Processing, 2021, 30: 7419- 7431

DOI:10.1109/TIP.2021.3104166      [本文引用: 2]

GEIGER A, LENZ P, STILLER C, et al

Vision meets robotics: the KITTI dataset

[J]. International Journal of Robotics Research, 2013, 32 (11): 1231- 1237

DOI:10.1177/0278364913491297      [本文引用: 1]

CORDTS M, OMRAN M, RAMOS S, et al. The Cityscapes dataset for semantic urban scene understanding [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 3213–3223.

[本文引用: 1]

JANOSOVITS J. Cityscapes TL++: semantic traffic light annotations for the Cityscapes dataset [C]// Proceedings of the International Conference on Robotics and Automation. Philadelphia: IEEE, 2022: 2569–2575.

[本文引用: 1]

HAO J, JIANG M, HUANG Y, et al. Scatter inpainting algorithm for rain or snow removal in a single image [C]// Proceedings of the IEEE 4th International Conference on Computer and Communications. Chengdu: IEEE, 2018: 1700–1704.

[本文引用: 1]

黄鹤, 李文龙, 吴琨, 等

动态自适应特征融合的MFOPA跟踪器

[J]. 电子学报, 2023, 51 (5): 1350- 1358

[本文引用: 1]

HUANG He, LI Wenlong, WU Kun, et al

MFOPA tracker with dynamic adaptive feature fusion

[J]. Acta Electronica Sinica, 2023, 51 (5): 1350- 1358

[本文引用: 1]

HAO Z, YOU S, LI Y, et al. Learning from synthetic photorealistic raindrop for single image raindrop removal [C]// Proceedings of the IEEE/CVF International Conference on Computer Vision Workshop. Seoul: IEEE, 2019: 4340–4349.

[本文引用: 1]

黄鹤, 李战一, 胡凯益, 等

融合大气光值-图估计的无人机航拍图像去雾

[J]. 哈尔滨工业大学学报, 2023, 55 (5): 88- 97

DOI:10.11918/202111001      [本文引用: 1]

HUANG He, LI Zhanyi, HU Kaiyi, et al

UAV aerial image dehazing by fusion of atmospheric light value and graph estimation

[J]. Journal of Harbin Institute of Technology, 2023, 55 (5): 88- 97

DOI:10.11918/202111001      [本文引用: 1]

HUANG H, LI Z, NIU M, et al

A sea fog image defogging method based on the improved convex optimization model

[J]. Journal of Marine Science and Engineering, 2023, 11 (9): 1775

DOI:10.3390/jmse11091775      [本文引用: 1]

BOVIK A C

Referenceless prediction of perceptual fog density and perceptual image defogging

[J]. IEEE Transactions on Image Processing, 2015, 24 (11): 3888- 3901

DOI:10.1109/TIP.2015.2456502      [本文引用: 1]

WANG T, YANG X, XU K, et al. Spatial attentive single-image deraining with a high quality real rain dataset [C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach: IEEE, 2019: 12262–12271.

[本文引用: 1]

WANG Z, BOVIK A C, SHEIKH H R, et al

Image quality assessment: from error visibility to structural similarity

[J]. IEEE Transactions on Image Processing, 2004, 13 (4): 600- 612

DOI:10.1109/TIP.2003.819861      [本文引用: 1]

黄鹤, 胡凯益, 宋京, 等

雾霾线求解透射率的二次优化方法

[J]. 西安交通大学学报, 2021, 55 (8): 130- 138

[本文引用: 1]

HUANG He, HU Kaiyi, SONG Jing, et al

A twice optimization method for solving transmittance with haze-lines

[J]. Journal of Xi’an Jiaotong University, 2021, 55 (8): 130- 138

[本文引用: 1]

黄莺, 胡凯益, 李战一, 等

含明亮区域的无人机遥感定位图像去雾方法

[J]. 火力与指挥控制, 2024, 49 (5): 130- 136

DOI:10.3969/j.issn.1002-0640.2024.05.018      [本文引用: 1]

HUANG Ying, HU Kaiyi, LI Zhanyi, et al

Dehazing method for the remote sensing and positioning image of UAV with bright area

[J]. Fire Control and Command Control, 2024, 49 (5): 130- 136

DOI:10.3969/j.issn.1002-0640.2024.05.018      [本文引用: 1]

/