浙江大学学报(工学版), 2026, 60(3): 574-584 doi: 10.3785/j.issn.1008-973X.2026.03.013

计算机技术、控制工程

基于双偏振雷达的高时空分辨率临近降水预报

林乐平,, 李量, 欧阳宁,

1. 桂林电子科技大学 认知无线电与信息处理省部共建教育部重点实验室,广西 桂林 541004

2. 桂林电子科技大学 信息与通信学院,广西 桂林 541004

High spatio-temporal resolution precipitation forecast based on dual-polarization radar

LIN Leping,, LI Liang, OUYANG Ning,

1. Ministry of Education Key Laboratory of Cognitive Radio and Information Processing, Guilin University of Electronic Technology, Guilin 541004, China

2. School of Information and Communication, Guilin University of Electronic Technology, Guilin 541004, China

通讯作者: 欧阳宁,男,教授. orcid.org/0000-0003-1667-0028. E-mail: ynou@guet.edu.cn

收稿日期: 2025-01-10  

基金资助: 国家自然科学基金资助项目(62001133);广西科技基地和人才专项资助项目(桂科 AD19110060);广西自然科学基金资助项目(2017GXNSFBA198212);广西无线宽带通信与信号处理重点实验室基金资助项目(GXKL06200114).

Received: 2025-01-10  

Fund supported: 国家自然科学基金资助项目(62001133);广西科技基地和人才专项资助项目(桂科AD19110060);广西自然科学基金资助项目(2017GXNSFBA198212);广西无线宽带通信与信号处理重点实验室基金资助项目(GXKL06200114).

作者简介 About authors

林乐平(1980—),女,教授,从事机器学习、图像信号处理的研究.orcid.org/0000-0002-9842-8421.E-mail:linleping@guet.edu.cn , E-mail:linleping@guet.edu.cn

摘要

针对现有算法在复杂快变降水外推中的局限性及Z-R转换带来的误差叠加问题,提出联合双偏振雷达变量的多模态临近降水预报模型DPRF-UNet. 该预报模型利用双偏振雷达变量中的反射率因子、差分反射率和比差分相移,直接对降水量进行预测. 通过纳入降水粒子微物理特性的信息,采用端到端的降水预报框架,该模型避免了因经验性转换带来的误差,实现了降水的直接预测. 研究结果表明,与仅使用雷达反射率因子作为输入的主流模型相比,提出DPRF-UNet模型在所有降水阈值下的临界成功指数、Heidke技巧评分和命中率的平均值分别提高了2.6%、2.7%和1.0%,达到0.64、0.72和0.74.

关键词: 临近降水预报 ; 双偏振雷达 ; 深度学习 ; 时空预测 ; 时空分辨率

Abstract

The DPRF-UNet model, a multimodal precipitation forecasting model that integrated dual-polarization radar variables, was proposed aiming at the problems that existing algorithms had limitations in extrapolating complex and rapidly changing precipitation and the Z-R conversion led to the error accumulation. Dual-polarization radar variables such as reflectivity, differential reflectivity, and specific differential phase were used to directly predict precipitation. The error introduced by empirical conversion was avoided by incorporating microphysical characteristics and employing an end-to-end precipitation forecasting framework, enabling direct precipitation prediction. The research results show that the proposed DPRF-UNet model demonstrates superior performance compared with mainstream models that solely utilize radar reflectivity as input. The average critical success index, Heidke skill score and probability of detection of the DPRF-UNet model across all precipitation thresholds were increased by 2.6%, 2.7% and 1.0%, reaching 0.64, 0.72 and 0.74.

Keywords: precipitation forecast ; dual-polarization radar ; deep learning ; spatio-temporal prediction ; spatio-temporal resolution

PDF (2664KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

林乐平, 李量, 欧阳宁. 基于双偏振雷达的高时空分辨率临近降水预报. 浙江大学学报(工学版)[J], 2026, 60(3): 574-584 doi:10.3785/j.issn.1008-973X.2026.03.013

LIN Leping, LI Liang, OUYANG Ning. High spatio-temporal resolution precipitation forecast based on dual-polarization radar. Journal of Zhejiang University(Engineering Science)[J], 2026, 60(3): 574-584 doi:10.3785/j.issn.1008-973X.2026.03.013

临近降水预报通过高时空分辨率预测服务于防灾减灾[1]. 相比受限于启动时间而难以满足实时需求的数值天气预报(numerical weather prediction,NWP)[2-3],效率更高的雷达回波外推法在业务中应用更广. 该方法基于回波移动特征[4],利用经验性Z-R关系反演降水[5]. 该方法通常基于经验性[4]ZR关系,将雷达反射率因子反演为降水强度[5]. 由于该方法依赖于固定的经验参数,难以充分刻画降水系统在微物理过程中的非线性变化,预报误差会随外推时效的延长而持续累积[6].

深度学习技术在捕捉降水时空特征方面优势明显[7]. 其中,RNN类模型适合处理时空序列[8],代表性工作包括ConvLSTM、TrajGRU [9]以及改进了时空记忆流的PredRNN [10]和缓解图像模糊的DB-RNN [11]. CNN类模型多基于UNet[12]架构,如大幅提升效率的RainNet [13]、轻量化的SmaAt-UNet [14]以及融合Transformer或多尺度特征的AA-TransUNet [15]和Broad-UNet [16].

随着双偏振雷达的普及,差分反射率和比差分相移提供了关键的微物理信息[17]. Pan等[18-19]研究通过融入这些变量有效提升了预报精度,Rombeek等[20]实现了多目标预报.

尽管如此,现有研究仍存在以下局限. 1)依赖经验性Z-R关系进行回波-降水转换,易导致误差叠加[21-22]. 2)单一反射率因子难以全面地表征强对流系统的微物理过程[23]. 针对上述问题,本文提出联合双偏振雷达变量的多模态临近降水预报模型DPRF-UNet,旨在通过端到端的方式实现高精度降水预测,具体的创新点如下.

(1)纳入双偏振雷达变量作为输入,设计交叉注意力空频融合模块. 该模块通过约束不同偏振变量间的自相似性映射,能够增强模态间互补特征的交互与融合,从而有效提升了模型对降水微信息的表征与提取能力.

(2)采用端到端的学习框架,实现从双偏振雷达变量到地面实际降水的直接预测,避免了因经验性转换导致的累计误差.

(3)在NJU-CPOL数据集上开展的实验结果表明,提出的DPRF-UNet模型在不同降水强度阈值下的临界成功指数、Heidke技巧评分和命中率均优于主流方法,验证了该模型在临近降水预报任务中的有效性.

1. 研究数据与预处理

1.1. 研究数据

采用由南京大学制作的C波段双偏振天气雷达数据集(NJU-CPOL)[18],该数据集涵盖2014—2019年间共计258个降水过程. 该数据集对原始雷达数据进行了严格的质量控制[24],处理后的双偏振雷达数据被插值到不同等高面(1、3、7 km)的笛卡尔坐标系中. 数据以水平分辨率为1 km,时间分辨率为6 min,覆盖面积为256 km×256 km的三维双偏振雷达观测数据和降水格点数据的形式呈现. 由于3 km高度的等高平面位置指示器(constant altitude plan position indicator,CAPPI)数据能够较好地反映降水系统的主体结构和特征[25],使用3 km高度的CAPPI数据分析和预测降水特征.

1.2. 数据预处理

在雷达波束的传播过程中,由于地面杂波、异常传播和电磁干扰等因素,容易产生噪声,对数据质量造成干扰. 为了降低噪声对模型训练和测试过程的影响,仿照Shi等[5]的做法,将马氏距离大于均值加3倍标准差的观测数据归类为异常值,对水平反射率因子$ {Z}_{\text{H}} $、比差分相移$ {K}_{\text{DP}} $、差分反射率$ {Z}_{\text{DR}} $和降水强度$ R $采用中值滤波处理,减少数据的异常与随机波动[25].

为了构建样本序列数据集,采用长度为20,步长为5的滑动窗口生成样本序列. 考虑到有雨和无雨的数据之间的高度不平衡问题,研究仿照Pan等[18]的做法,对数据集进行筛选,剔除部分“非雨样本”以保持数据的平衡性. 具体而言,在每个时间步长中,设定面积阈值$ {I}_{\text{thr}} $和降水频次阈值$ {A}_{\text{eva}} $,若后10帧降雨面积小于面积阈值的频次$ {A}_{\text{eva}} $低于降水频次阈值$ {I}_{\text{thr}} $,则该样本被认为是“非雨样本”,并从数据集中剔除. 将面积阈值和降水频次阈值分别设置为38 km×38 km和5. 经过筛选后,最终数据集包含788个样本,按照9∶1的比例随机地划分为训练集和测试集. 训练集包含710个样本序列,测试集包含78个样本序列.

2. 研究方法

2.1. 问题描述和网络架构

任务定义为利用在当前时间之前1 h的双偏振雷达变量($ {Z}_{\text{H}} $$ {K}_{\text{DP}} $$ {Z}_{\text{DR}} $)来预测未来6 min的地面实际降水强度,如下所示:

$ \mathop R\nolimits_{{\rm{true}}}^{t + 1} = M\left( {\begin{array}{*{20}{l}}{{Z_{\text{H};t - T + 1}}, \cdots ,{Z_{\text{H};t}}}\\{{K_{\text{DP};t - T + 1}}, \cdots ,{K_{\text{DP};t}}}\\{{Z_{\text{DR};t - T + 1}}, \cdots ,{Z_{\text{DR};t}}}\end{array}} \right). $

式中:$ M $为临近降水预报模型;$ T $为输入的时间步长. 因为雷达观测的时间间隔为6 min,$ T $设为10.

为了实现精准的降水预报,提出基于端到端的临近降水预报框架DPRF-UNet,旨在直接预测未来的降水. 具体架构如图1所示. 其中,$\mathop R\nolimits_{{\rm{true}}}^{t + 1} $$\mathop R\nolimits_{{\rm{pred}}}^{t + 1} $分别为t+1时刻的降水真实值和预测值.

图 1

图 1   DPRF-UNet模型参数的优化过程示意图

Fig.1   Optimization process diagram of DPRF-UNet model parameter


该框架包含2个核心模块:交叉注意力空频融合模块和融合降水生成模块. 交叉注意力空频融合模块负责从多模态双偏振雷达数据($ {\boldsymbol{I}}_{\text{ZH}} $$ {\boldsymbol{I}}_{\text{KDP}} $$ {\boldsymbol{I}}_{\text{ZDR}}\in {{\bf{R}}}^{T\times H\times W} $)中提取关键时空特征,实现多源特征融合. 融合降水生成模块负责建模融合特征在时间和空间维度上的复杂演变规律,生成精准的降水预报$ {\boldsymbol{R}}_{\text{pre}}\in {{\bf{R}}}^{1\times H\times W} $.

2.2. 交叉注意力空频融合模块

为了高效融合双偏振雷达变量中所蕴含的降水微物理信息. 受Gu等[26]的启发,引入交叉注意力机制,增强特征融合阶段对模态间互补信息的利用能力. 该机制的核心思想是通过约束不同偏振变量间的自相似性映射,引导模型更加充分地利用不同模态之间的互补性特征. 如图2所示,利用卷积层将不同模态的特征$ {\boldsymbol{I}}_{{i}} $切分为不重叠的嵌入向量$ {\boldsymbol{\psi }}_{{i}}\in {\bf{R}}^\left( {h/p} \right) \times \left( {w/p} \right) \times ({p^2} \times c) $,通过线性映射和3个可学习的权重矩阵$ {\boldsymbol{W}}^{{\boldsymbol{Q}}}、{\boldsymbol{W}}^{{\boldsymbol{K}}}、{\boldsymbol{W}}^{{\boldsymbol{V}}}\in {\bf{R}}^{\left({p}^{2}\times c\right)\times d} $将嵌入向量映射为查询向量$ {\boldsymbol{Q}}_{{i}} $、键向量$ {\boldsymbol{K}}_{{i}} $和值向量$ {\boldsymbol{V}}_{{i}}\in {\bf{R}}^\left( {\left( {h/p} \right) \times \left( {w/p} \right)} \right) \times d $. 计算不同模态特征的点积相似性得分$ {S}_{i} $. 采用交叉注意力机制,交互利用$ {Z}_{\text{DR}} $$ {K}_{\text{DP}} $的特征相似性得分作为对方的自适应权重,实现特征结构间的一致性约束. 通过与对应的值向量进行矩阵运算,实现偏振变量间的互补信息融合. 上述过程的表达式如下.

图 2

图 2   交叉注意力空频融合模块的示意图

Fig.2   Schematic diagram of cross-attention spatial-frequency fusion module


$ \left. {\begin{array}{*{20}{r}}{{\boldsymbol{Q}}}_{i}=\text{LN}\left({{{\boldsymbol{\varPsi}}} }_{i}\right){{\boldsymbol{W}}}^{{\boldsymbol{Q}}},&\\{{\boldsymbol{K}}}_{i}=\text{LN}\left({{{\boldsymbol{\varPsi}}} }_{i}\right){{\boldsymbol{W}}}^{{\boldsymbol{K}}},\\{{\boldsymbol{V}}}_{i}=\text{LN}\left({{{\boldsymbol{\varPsi}}} }_{i}\right){{\boldsymbol{W}}}^{{\boldsymbol{V}}};\;i=1,2,3.\end{array}} \right\} $

$ {S}_{i}=\text{Softmax}\left(\frac{{{\boldsymbol{Q}}}_{i}{{\boldsymbol{K}}}_{i}{}^\text{T}}{\sqrt{d}}\right). $

$ {{\boldsymbol{I}}}_\text{f}=\text{Conv}({S}_{1}{{\boldsymbol{V}}}_{1}+{S}_{2}{{\boldsymbol{V}}}_{3}+{S}_{3}{{\boldsymbol{V}}}_{2}). $

式中:$ {{\boldsymbol{\varPsi }}}_{1} $$ {{\boldsymbol{\varPsi }}}_{2} $$ {{\boldsymbol{\varPsi }}}_{3} $分别为$ {\boldsymbol{I}}_{\text{ZH}} $$ {\boldsymbol{I}}_{\text{KDP}} $$ {\boldsymbol{I}}_{\text{ZDR}} $的嵌入向量,“$+$”表示逐元素的加法操作,$ \text{softmax} $表示归一化函数,$ \text{Conv} $表示$ 3\times 3 $卷积.

为了进一步提升多模态数据的融合效果,采用空间注意力机制自适应地增强频率信息,实现有效的信息增强. 如图2所示,将来自不同模态的特征$ {\boldsymbol{I}}_{\text{i}} $进行$ \text{Concat} $得到初步融合特征$ {\boldsymbol{I}}_{\text{in}} $,应用快速傅里叶变换$ {F}(\cdot ) $将特征$ {\boldsymbol{I}}_{\text{in}} $从空间域转换到频域[27]. 通过一组卷积层、批归一化($ \text{BN} $)和$ \text{ReLU} $激活函数组成的操作,将频率特征映射到高维空间中,并表示为$ {\tilde{\boldsymbol{I}}}_{\text{in}} $. 为了在频域自适应地增强融合特征,对频率特征$ {\tilde{\boldsymbol{I}}}_{\text{in}} $分别应用平均池化和最大池化来生成空间注意力矩阵,与频率特征相乘得到增强频域特征$ {\hat{\boldsymbol{I}}}_{\text{in}} $. 应用快速傅里叶逆变换$ {{F}}^{-1}(\cdot ) $,将增强后的频率特征$ \hat{\boldsymbol{I}} $映射回空间域,得到频域信息增强的融合特征$ {\boldsymbol{I}}_{\text{s}} $. 上述过程的表达式为

$ {{\boldsymbol{I}}}_\text{in}=[{{\boldsymbol{I}}}_{1},{{\boldsymbol{I}}}_{2},{{\boldsymbol{I}}}_{3}] , $

$ {\tilde{{\boldsymbol{I}}}}_\text{in}=\text{ReLU}\;(\text{BN}\;(\text{Conv}\;({F}({{\boldsymbol{I}}}_{{\mathrm{in}}})))) , $

$ {\hat{{\boldsymbol{I}}}}_{{\mathrm{in}}}={\tilde{{\boldsymbol{I}}}}_{{{{\mathrm{in}}}}}\times \sigma \;({\mathrm{Conv}}\;([{\mathrm{Avgpool}}\;({\tilde{{\boldsymbol{I}}}}_{{{{\mathrm{in}}}}}),{\mathrm{Maxpool}}\;({\tilde{{\boldsymbol{I}}}}_{{\mathrm{in}}})])) , $

$ {{\boldsymbol{I}}}_{{\mathrm{s}}}={{F}}^{-1}({\hat{{\boldsymbol{I}}}}_{{\mathrm{in}}}) . $

式中:$ [\;] $表示$ \text{Concat} $$ \text{Avgpool}(\cdot ) $表示平均池化,$ \text{Maxpool}(\cdot ) $表示最大池化,σ表示$ \text{Sigmoid}(\cdot ) $函数. 最后生成的融合特征表示为

$ {{\boldsymbol{I}}}_{{\mathrm{fusion}}}={{\boldsymbol{I}}}_{{\mathrm{f}}}+{{\boldsymbol{I}}}_{{\mathrm{s}}} . $

2.3. 融合降水生成模块

为了实现对降水的直接预测,基于UNet结构[13]构建融合降水生成模块. 如图3所示,该模块包含2个主要模块,其中多尺度注意力卷积模块作为重新设计的U型主干,通过引入多尺度特征提取机制,能够在不同尺度上捕捉降水预报中的细节,增强模型对降水系统结构的表征能力. 信息跨层融合模块采用轻量级特征融合策略,增强不同层级时空特征的结合,提升模型对小尺度降水现象的敏感性.

图 3

图 3   融合降水生成模块的示意图

Fig.3   Schematic diagram of integrated precipitation generation module


2.3.1. 多尺度注意力卷积模块

在经典UNet框架中,每层通常采用固定大小的卷积核进行特征编码和解码,但这种固定尺度的特征提取方式在捕获降水系统中尺度多样的空间分布方面存在一定的局限性. 基于多尺度卷积和软注意力选择策略来改进U型主干,增强模型对多尺度降水分布的建模能力. 如图4所示,该模块采用4个不同大小的卷积核并行提取多尺度降水特征$ {\boldsymbol{X}}_{1} $$ {\boldsymbol{X}}_{2} $$ {\boldsymbol{X}}_{3} $$ {\boldsymbol{X}}_{4} $. 使用多层注意力结构,对不同尺度的特征进行自适应融合. 在每层中,对不同尺度的特征进行逐元素相加操作,通过$ {\mathrm{CA}}(\cdot ) $得到坐标注意力权重$ \boldsymbol{W} $. 采用软注意力选择策略,将生成的注意力权重$ \boldsymbol{W} $分别作用于$ {\boldsymbol{X}}_{1} $$ {\boldsymbol{X}}_{2} $,增强模型对关键降水区域的识别能力. 将加权后的特征相加,作为当前层的输出特征. 上述过程的表达式为

图 4

图 4   多尺度注意力卷积模块的示意图

Fig.4   Schematic diagram of multi-scale attention convolution module


$ \hat{X}={\boldsymbol{W}}\times {{\boldsymbol{X}}}_{{1}}+({\bf{1}}-{\boldsymbol{W}})\times {{\boldsymbol{X}}}_{2} , $

$ \tilde{X}={\mathrm{CA}}({\boldsymbol{X}}_1)\times {{\boldsymbol{X}}}_{1}+({\bf{1}}-{\mathrm{CA}}({\boldsymbol{X}}_2))\times {{\boldsymbol{X}}}_{2} . $

式中:$ {\mathrm{CA}}(\cdot ) $为轻量级信道注意机制,它通过将空间信息分解为2个独立的方向,生成水平和垂直方向上的注意力矩阵,增强重要区域的表达[28]. 该过程的表达式为

$ {Y}^{h}=\frac{1}{W}\sum\limits_{0\leqslant i < W}Y(h,i),\;{Y}^{w}=\frac{1}{H}\sum\limits_{0\leqslant j < W}Y(j,w) ; $

$ {f}^{h},{f}^{w}={\mathrm{Split}}\;({\mathrm{ReLu}}\;({\mathrm{Conv}}\;[{Y}^{h},{Y}^{w}])) ; $

$ {{L}}={\mathrm{Sigmoid}}({\mathrm{Conv}}({f}^{h}))\times {\mathrm{Sigmoid}}({\mathrm{Conv}}({f}^{w})) . $

2.3.2. 跨层融合模块

当处理小尺度降水时,由于小尺度降水具有较强的时间和空间不连续性,通过跳跃连接将编码器特征直接融合到解码器中. 若不加选择地融合,则可能会导致小尺度降水信息被“平滑”处理. 为了应对这一问题,提出跨层融合模块,旨在增强不同层级间的时空特征交互能力. 如图5所示,对解码器的特征上采样生成$ {{\boldsymbol{Y}}}_{i} $,使空间分辨率与对应编码器层的特征保持一致. 将编码器的特征$ {\boldsymbol{X}}_{{i}} $与上采样的特征$ {\boldsymbol{Y}}_{{i}} $相加,得到初步融合特征$ \boldsymbol{Z} $. 为了突出小尺度降水特征,通过$ {\mathrm{CA}}(\cdot ) $得到坐标注意力权重$ \boldsymbol{W} $,将其与$ \boldsymbol{Z} $进行逐元素相乘,生成加权特征$ \tilde{\boldsymbol{Z}} $. 为了减少融合带来的信息损失,通过残差连接将$ \tilde{\boldsymbol{Z}} $$ {\boldsymbol{Y}}_{{i}} $相加,得到最终的输出特征. 上述过程的表达式为

图 5

图 5   跨层融合模块的示意图

Fig.5   Schematic diagram of cross-layer fusion module


$ {{\boldsymbol{Y}}}_{i}={\mathrm{Upsample}}\;({{\boldsymbol{Y}}}_{i+1}) , $

$ \hat{{\boldsymbol{Z}}}={{\boldsymbol{Y}}}_{i}+{\mathrm{CA}}({{\boldsymbol{X}}}_{i}+{{\boldsymbol{Y}}}_{i})\times {{\boldsymbol{X}}}_{i} . $

3. 实验设置和评价指标

3.1. 实验设置

本实验的环境配置如表1所示. 由于在临近降水预报任务中是对每个网络格点数据进行回归预测,采用均方误差(MSE)作为损失函数. 在模型训练的过程中,将批次大小(batch size)设为8,优化器选择Adam[29],设定训练3000个轮次. 为了加速模型收敛的过程,引入学习率调度器[30]. 根据训练的步长动态调整学习率的大小和变化速度,将最大学习率设定为0.001.

表 1   深度学习实验的硬件平台及软件环境

Tab.1  Hardware platform and software environment for deep learning experiment

名称环境配置
操作系统Ubuntu20.04
处理器Intel(R)Xeon(R)Gold6248CPU@2.50 GHz
显卡Tesla A100
CUDA版本11.6
深度学习框架PyTorch1.13.0
Python版本3.9
显存80 GB

新窗口打开| 下载CSV


为了提升模型的泛化能力,在训练过程中,对所有的偏振雷达变量和降水量数据应用随机水平翻转、随机垂直翻转和随机旋转3种数据增强技术,增大训练数据的多样性.

3.2. 评估指标

为了全面评估模型的预报能力,特别是对不同降水级别的预测准确性,采用多种性能评估指标,包括命中率(POD)[5]、临界成功指数(CSI)及Heidke技巧评分(HSS)[31]. 这3项指标可以从不同角度衡量模型在不同降水阈值下的预测性能,计算公式如下:

$ {\mathrm{POD}}=\frac{{\mathrm{TP}}}{{\mathrm{TP}}+{\mathrm{FN}}} , $

$ {\rm{CSI = }}\frac{{{\rm{TP}}}}{{{\rm{TP + FN + FP}}}}{\rm{,}} $

$ {\rm{HSS = }}\frac{{{\rm{2 \times }}\left( {{\rm{TP \times TN - FN \times FP}}} \right)}}{{\left( {{\rm{TP + FN}}} \right)\left( {{\rm{FN + TN}}} \right){\rm{ + }}\left( {{\rm{TP + FP}}} \right)\left( {{\rm{FP + TN}}} \right)}}{\rm{.}} $

在计算指标前,先设定降水阈值$ \tau $,若降水量大于该阈值,则赋值为1;反之,则赋值为0. 根据预测结果与实际观测值计算4类统计量:$ {\mathrm{TP}} $((预测值=1,实际值=1)、$ {\mathrm{FN}} $(预测值=0,实际值=1)、$ {\mathrm{FP}} $(预测值=1,实际值=0)和$ {\mathrm{TN}} $(预测值=0,实际值=0).

表2所示为NJU-CPOL数据集中不同降水强度的具体分布情况. 其中,R为降水强度,P为比例. 考虑到本研究的重点是各类临近降水预报方法在不同降水级别下的预测能力,参照文献[5],自定义0.5、5和10 mm为检验阈值,分别用于评估和分析小雨、中雨及大雨的预报性能.

表 2   NJU-CPOL数据集的降水强度分类统计

Tab.2  Rain rate statistics in NJU-CPOL dataset

R/(mm·(6 min)−1)P/%降水等级
[0, 0.5)75.86无降雨
[0.5, 5)13.98小雨
[5, 10)5.23中雨
[10, 30)3.93大雨
[30, +$ \infty $)0.97暴雨

新窗口打开| 下载CSV


4. 结果及分析

为了全面评估提出的DPRF-UNet模型性能,设计4组基线实验,分别为ZH_Rain(基于Ayzel等[12]提出的RainNet模型)、ZH_SmaAt(基于Trebing等[14]提出的SmaAt-UNet模型)、ZH_AATrans(基于Yang等[15]提出的AA-TransUNet模型)和ZH_Broad(基于Fernández等[16]提出的Broad-UNet模型),这些实验均以$ {Z}_{\text{H}} $为输入. 为了客观评估增加$ {K}_{\text{DP}} $$ {Z}_{\text{DR}} $作为输入对模型性能的影响,针对DPRF-UNet设计ZHKDP_DPRF和ZHZDR_DPRF 2组实验. 其中,ZHKDP_DPRF以$ {Z}_{\text{H}} $$ {K}_{\text{DP}} $为输入,ZHZDR_DPRF以$ {Z}_{\text{H}} $$ {Z}_{\text{DR}} $为输入.

为了深度评估模型在不同前置时间内的综合性能表现,对所有的临近降水预报模型开展不同前置时间(0.5、1和1.5 h)下的分时段预报实验. 由于数据集、评价指标及具体任务的差异,对比模型的预测结果与原始文献结果可能存在一定的差异.

4.1. 总体效果的评估

表3~5所示分别为所有模型在不同前置时间(0.5、1和1.5 h)内的指标值. 其中,每列数据分别表示不同模型在3个降水强度阈值Rth下的CSI、HSS和POD的测试集样本平均值,加粗的数值表示在相应指标上取得最佳性能的模型结果. 在与4个基线模型的对比实验中,提出的DPRF-UNet模型在前置时间为0.5和1 h时表现出相对优势. 特别是在前置时间为0.5 h的预报实验中,该模型在不同级别降水阈值(小雨、中雨和大雨)下的CSI相对单变量模型(ZH_Rain、ZH_SmaAt、ZH_AATrans和ZH_Broad)性能的最优值分别提高了1.6%、4.1%和2.0%,平均提高了2.6%. HSS分别提高了1.5%、3.5%和3.0%,平均提高了2.7%. POD分别提高了−2.1%、4.2%和1.0%,平均提高了1.0%. 这些结果表明,DPRF-UNet模型在小雨、中雨和大雨的预报中均表现优异,尤其是在中雨和大雨的预报中,性能提升更显著. 尽管在小雨阈值下POD指标略有下降,但整体性能的提升证明了DPRF-UNet模型的优越性.

表 3   不同模型在0.5 h前置时间下的实验结果对比

Tab.3  Comparison of experimental result for different models at 0.5 hour ahead time

模型CSIHSSPOD
Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值
ZH_Rain0.55290.22390.22870.33510.58320.29290.31020.39540.91970.26510.26160.4821
ZH_SmaAt0.67160.48970.50480.55530.72840.59550.61400.64590.88950.57380.57640.6799
ZH_AATrans0.69770.57620.58350.61910.75550.67200.67880.70210.89050.67600.66880.7451
ZH_Broad0.70920.58090.56600.61870.76750.67080.65780.69870.87260.67110.64120.7283
ZHKDP_DPRF0.72570.60260.58230.63680.78520.68260.68810.71860.86710.69530.66380.7420
ZHZDR_DPRF0.71650.60040.58190.63290.77380.68070.66580.70670.85580.68880.65760.7340
DPRF-UNet0.72060.60500.59530.64030.77870.69590.69930.72460.89980.70480.67550.7489

新窗口打开| 下载CSV


表 4   不同模型在1 h前置时间下的实验结果对比

Tab.4  Comparison of experimental result for different models at 1 hour ahead time

模型CSIHSSPOD
Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值
ZH_Rain0.55010.24610.26600.35400.57950.32440.35900.42090.91720.28550.29870.5004
ZH_SmaAt0.67330.49710.51910.56310.72790.60330.62870.65330.89990.57820.58320.6871
ZH_AATrans0.68820.57770.57670.61420.74340.67070.67200.69530.89390.68240.65850.7449
ZH_Broad0.72150.60730.59260.64040.77950.69590.68460.72000.87350.69770.66610.7457
ZHKDP_DPRF0.73360.61390.59950.64900.78810.70120.69380.72770.90140.71110.67840.7636
ZHZDR_DPRF0.72890.61330.59970.64730.78360.69640.68930.72310.87190.70250.67410.7495
DPRF-UNet0.72910.61710.59620.64740.78470.70790.69280.72840.90020.72390.68590.7680

新窗口打开| 下载CSV


表 5   不同模型在1.5 h前置时间下的实验结果对比

Tab.5  Comparison of experimental result for different models at 1.5 hour ahead time

模型CSIHSSPOD
Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值
ZH_Rain0.54480.18740.15490.29570.57340.24140.21470.34310.91280.23710.19590.4486
ZH_SmaAt0.63090.31770.25430.40090.68380.39410.33620.47130.88130.42310.33140.5452
ZH_AATrans0.63710.33300.26160.41050.69190.41360.34300.48280.84250.44680.33540.5415
ZH_Broad0.61200.30990.22550.38240.66730.37740.29220.44560.79770.42020.27690.4982
ZHKDP_DPRF0.62000.32770.26550.40440.67520.40320.34800.47540.82850.44750.34810.5413
ZHZDR_DPRF0.62180.31890.24690.39580.67750.38880.32020.46210.82060.43010.31560.5221
DPRF-UNet0.62650.33510.26690.40950.68240.41400.34570.48070.83120.46470.35780.5513

新窗口打开| 下载CSV


当前置时间为1 h时,提出的DPRF-UNet模型在所有级别降水阈值下的评价指标均达到最高值. 随着前置时间的延长,模型的预报性能没有持续提升,反而出现了显著的下降. 这一现象表明,DPRF-UNet模型在相对较短的前置时间内能够充分利用双偏振雷达数据的时空特征,实现对降水的高精度预报. 前置时间的增加虽然可以为降水预报提供更多的时间窗口,但过长的前置时间可能导致观测数据的不确定性增大,影响预报的准确性.

4.2. 敏感性试验

为了评估增加双偏振雷达变量对实际降水的拟合能力的提升效果,如图6所示为单变量模型和多变量模型(ZHKDP_DPRF、ZHZDR_DPRF和DPRF-UNet)在连续降水过程中的降水强度散点图. 可以看出,单变量模型的散点分布较离散,表明该模型对实际降水的拟合能力有限,而多变量模型的散点图不仅呈现出较集中的分布趋势,而且在预测精度上显著优于单变量模型. 以单变量模型中表现最佳的Broad-UNet为基准,多变量模型中表现最佳的ZHZDR_DPRF在MAE上降低了7.2%,达到0.89. ZHKDP_DPRF和DPRF-UNet的MAE分别降低了2.0%,达到0.94. 这些结果表明,引入双偏振雷达变量,显著提升了模型对降水强度的拟合能力,验证了增加双偏振雷达变量在降水预测中的有效性和鲁棒性.

图 6

图 6   不同模型在连续降水过程中的预测散点图对比

Fig.6   Comparison of predictive scatterplot of different models in continuous precipitation process


表3~5可知,分别增加偏振变量的多变量模型ZHKDP_DPRF和ZHZDR_DPRF在评估指标(POD、CSI和HSS)上均明显优于单变量模型,增加KDPZHKDP_DPRF性能高于增加ZDRZHZDR_DPRF. 这一差异可能源于$ {K}_{\text{DP}} $作为与降水强度和粒子形态密切相关的参数,能够更好地捕捉降水过程的动态变化. $ {K}_{\text{DP}} $参数不受雷达定标误差和衰减的影响,因此对于中到大雨的降水,估测精度较高. 这些结果进一步表明,双偏振雷达变量的引入,尤其是$ {K}_{\text{DP}} $,显著提升了降水预报的准确性、稳定性和可靠性.

4.3. 可视化结果

为了进一步展示提出模型的实际预报效果,随机选取并可视化了2个连续的极端暴雨降水过程. 如图7所示,单变量模型(ZH_Rain、ZH_SmaAt、ZH_AATrans和ZH_Broad)在不同前置时间tp内预测雨带形状、降水强度和落区时均出现了明显的偏差,相比之下,增加$ {K}_{\text{DP}} $$ {Z}_{\text{DR}} $作为输入的多变量模型(ZHKDP_DPRF、ZHZDR_DPRF和DPRF-UNet)不仅能够很好地再现降水分布和落区,而且在模拟强降水区域时能够更准确地刻画降水的局部增强点. 当前置时间为1.5 h时,由于难以捕获大气系统的长期非线性降水模式,所有模型均出现“回归到平均”的问题,预报结果趋于模糊. 利用提出的ZHKDP_DPRF、ZHZDR_DPRF和DPRF-UNet模型预报出的降水分布相对于其他模型更加准确.

图 7

图 7   不同前置时间下的模型预测可视化结果对比

Fig.7   Comparison of model prediction visualization result at different lead time


在另外一个降水过程中,模型表现出与前一过程相类似的预测特征. 如图8所示,单变量模型在不同的前置时间内对大范围的降水分布预报时,该模型的预测结果不仅存在较大的偏差和不确定性,而且无法准确地模拟大范围降水事件的落区和强度. 相反,增加$ {K}_{\text{DP}} $$ {Z}_{\text{DR}} $作为输入的多变量模型,不仅准确地刻画出大范围降水区域,而且有效地缓解了模糊现象. 这一结果与多参数模型在评价指标上显著提高的发现一致,证明双偏振雷达变量的引入为降水粒子形态和微物理过程提供了关键信息,帮助捕捉降水系统的细节变化,提升了降水预报的准确性与稳定性.

图 8

图 8   不同前置时间下的模型预测可视化结果对比

Fig.8   Comparison of model prediction visualization result at different lead time


4.4. 消融实验

为了评估提出的交叉注意力空频融合模块及跨层融合模块的有效性,对交叉注意力空频融合模块和跨层融合模块进行独立实验验证. 实验设置如下:将1 h前置时间下的DPRF-Unet预测结果作为基准(baseline). 采用简单的特征堆叠方式替代交叉注意力空频融合模块,构建DPRF-UNet-F模型. 采用简单的上采样(upsample)和特征堆叠替代跨层融合模块,构建DPRF-UNet-C模型. 从表6可知,与采用简单特征堆叠方式的DPRF-UNet-F模型相比,提出的交叉注意力空频融合模块在不同级别降水阈值下的CSI分别提升了2.5%、11.6%和10.2%,平均提高了8.1%. HSS分别提高了1.9%、8.1%和6.8%,平均提高了5.6%. POD分别提高了4.7%、15.5%和13.9%,平均提高了11.3%. 在跨层融合模块的对比实验中,与采用简单的上采样(upsample)和特征堆叠来替代跨层融合模块的DPRF-UNet-C相比,提出的跨层融合模块在不同级别降水阈值下的CSI分别提升了1.6%、3.0%和2.1%,平均提高了2.2%. HSS分别提高了1.3%、2.1%和1.5%,平均提高了1.6%. POD分别提高了0.4%、2.7%和2.0%,平均提高了1.7%.

表 6   1 h前置时间下的消融实验结果对比

Tab.6  Comparison of ablation experiment result at 1 hour ahead time

模型CSIHSSPOD
Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值Rth = 0.5 mm/
(6 min)
Rth = 5 mm/
(6 min)
Rth = 10 mm/
(6 min)
平均值
DPRF-UNet0.72910.61710.59620.64740.78470.70790.69280.72840.89430.72390.68590.7680
DPRF-UNet-F0.71120.55250.54100.60150.76940.65430.64810.69060.85360.62460.60200.6934
DPRF-UNet-C0.71720.59900.58380.63330.77250.69310.68250.71600.89020.70460.67190.7569

新窗口打开| 下载CSV


5. 结 语

本文利用双偏振雷达变量所提供的降水粒子微物理信息,构建多模态临近降水预报模型. 该模型采用端到端预报框架,避免了经验性转换带来的误差. 通过设计交叉注意力空频融合模块,模型能够充分挖掘双偏振雷达变量中的关键信息,提升了降水预测精度. 实验表明,该模型在不同降水强度下均表现出较高的预测准确性.

在实际应用中,雷达观测数据通常具有明显的空间异质性,可能对预报效果产生影响. 未来可在输入数据中引入更多与空间位置相关的信息,如雷达观测高度、方位角及地形因素,以进一步提高雷达降水预报精度.

参考文献

RAVURI S, LENC K, WILLSON M, et al

Skilful precipitation nowcasting using deep generative models of radar

[J]. Nature, 2021, 597 (7878): 672- 677

[本文引用: 1]

李扬, 刘玉宝, 许小峰

基于深度学习改进数值天气预报模式和预报的研究及挑战

[J]. 气象科技进展, 2021, 11 (3): 103- 112

[本文引用: 1]

LI Yang, LIU Yubao, XU Xiaofeng

Advances and challenges for improving numerical weather prediction models and forecasting using deep learning

[J]. Advances in Meteorological Science and Technology, 2021, 11 (3): 103- 112

[本文引用: 1]

REINOSO-RONDINEL R, REMPEL M, SCHULTZE M, et al

Nationwide radar-based precipitation nowcasting: a localization filtering approach and its application for Germany

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2022, 15: 1670- 1691

DOI:10.1109/JSTARS.2022.3144342      [本文引用: 1]

AYZEL G, HEISTERMANN M, WINTERRATH T

Optical flow models as an open benchmark for radar-based precipitation nowcasting (rainymotion v0.1)

[J]. Geoscientific Model Development, 2019, 12 (4): 1387- 1402

DOI:10.5194/gmd-12-1387-2019      [本文引用: 2]

SHI X, CHEN Z, WANG H, et al. Convolutional LSTM network: a machine learning approach for precipitation nowcasting [C]∥Advances in Neural Information Processing Systems 28. Montreal: Curran Associates, Inc, 2015: 802-810.

[本文引用: 5]

俞小鼎, 周小刚, 王秀明

雷暴与强对流临近天气预报技术进展

[J]. 气象学报, 2012, 70 (3): 311- 337

[本文引用: 1]

YU Xiaoding, ZHOU Xiaogang, WANG Xiuming

The advances in the nowcasting techniques on thunderstorms and severe convection

[J]. Acta Meteorologica Sinica, 2012, 70 (3): 311- 337

[本文引用: 1]

黄兴友, 马玉蓉, 胡苏蔓

基于深度学习的天气雷达回波序列外推及效果分析

[J]. 气象学报, 2021, 79 (5): 817- 827

[本文引用: 1]

HUANG Xingyou, MA Yurong, HU Suman

Extrapolation and effect analysis of weather radar echo sequence based on deep learning

[J]. Acta Meteorologica Sinica, 2021, 79 (5): 817- 827

[本文引用: 1]

马志峰, 张浩, 刘劼

基于深度学习的短临降水预报综述

[J]. 计算机工程与科学, 2023, 45 (10): 1731- 1753

[本文引用: 1]

MA Zhifeng, ZHANG Hao, LIU Jie

A survey of precipitation nowcasting based on deep learning

[J]. Computer Engineering and Science, 2023, 45 (10): 1731- 1753

[本文引用: 1]

SHI X, GAO Z, LAUSEN L, et al. Deep learning for precipitation nowcasting: a benchmark and a new model [C]//Advances in Neural Information Processing Systems 30. Red Hook, NY: Cur Associates, Inc., 2017.

[本文引用: 1]

WANG Y, LONG M, WANG J, et al. PredRNN: recurrent neural networks for predictive learning using spatiotemporal LSTMs [C]//Proceedings of the Neural Information Processing Systems. Long Beach: Curran Associates, Inc, 2017: 879-888.

[本文引用: 1]

MA Z, ZHANG H, LIU J

DB-RNN: an RNN for precipitation nowcasting deblurring

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2024, 17: 5026- 5041

[本文引用: 1]

AYZEL G, SCHEFFER T, HEISTERMANN M

RainNet v1.0: a convolutional neural network for radar-based precipitation nowcasting

[J]. Geoscientific Model Development, 2020, 13 (6): 2631- 2644

[本文引用: 2]

RONNEBERGER O, FISCHER P, BROX T. U-Net: convolutional networks for biomedical image segmentation [C]//Medical Image Computing and Computer-Assisted Intervention. Cham: Springer, 2015: 234–241.

[本文引用: 2]

TREBING K, STAǸCZYK T, MEHRKANOON S

SmaAt-UNet: precipitation nowcasting using a small attention-UNet architecture

[J]. Pattern Recognition Letters, 2021, 145: 178- 186

[本文引用: 2]

YANG Y, MEHRKANOON S. AA-TransUNet: attention augmented TransUNet for nowcasting tasks [C]//Proceedings of the International Joint Conference on Neural Networks. Padua: IEEE, 2022: 1–8.

[本文引用: 2]

FERNÁNDEZ J G, MEHRKANOON S

Broad-UNet: multi-scale feature learning for nowcasting tasks

[J]. Neural Networks, 2021, 144: 419- 427

[本文引用: 2]

REN G, SUN Y, SUN H, et al

A case study on two differential reflectivity columns in a convective cell: phased-array radar observation and cloud model simulation

[J]. Remote Sensing, 2024, 16 (3): 460

[本文引用: 1]

PAN X, LU Y, ZHAO K, et al

Improving nowcasting of convective development by incorporating polarimetric radar variables into a deep-learning model

[J]. Geophysical Research Letters, 2021, 48 (21): e2021GL095302

[本文引用: 3]

ZHU K, CHEN H, HAN L. MCT U-Net: a deep learning nowcasting method using dual-polarization radar observations [C]//IEEE International Geoscience and Remote Sensing Symposium. Kuala Lumpur: IEEE, 2022: 4665–4668.

[本文引用: 1]

ROMBEEK N, LEINONEN J, HAMANN U

Exploiting radar polarimetry for nowcasting thunderstorm hazards using deep learning

[J]. Natural Hazards and Earth System Sciences, 2024, 24 (1): 133- 144

[本文引用: 1]

RYZHKOV A, ZHANG P, BUKOVČIĆ P, et al

Polarimetric radar quantitative precipitation estimation

[J]. Remote Sensing, 2022, 14 (7): 1695

[本文引用: 1]

庄潇然, 郑玉, 王亚强, 等

基于深度学习的融合降水临近预报方法及其在中国东部地区的应用研究

[J]. 气象学报, 2023, 81 (2): 286- 303

[本文引用: 1]

ZHUANG Xiaoran, ZHENG Yu, WANG Yaqiang, et al

Research on fusion precipitation prediction method based on deep learning and its application in Eastern China

[J]. Acta Meteorologica Sinica, 2023, 81 (2): 286- 303

[本文引用: 1]

CREMONINI R, VOORMANSIK T, POST P, et al

Estimation of extreme precipitation events in Estonia and Italy using dual-polarization weather radar quantitative precipitation estimations

[J]. Atmospheric Measurement Techniques, 2023, 16 (11): 2943- 2956

[本文引用: 1]

HUANG H, ZHAO K, ZHANG G, et al

Quantitative precipitation estimation with operational polarimetric radar measurements in Southern China: a differential phase–based variational approach

[J]. Journal of Atmospheric and Oceanic Technology, 2018, 35 (6): 1253- 1271

[本文引用: 1]

张永华. 基于深度学习的华南登陆台风偏振雷达定量降水估测研究 [D]. 南京: 南京信息工程大学, 2022.

[本文引用: 2]

ZHANG Yonghua. Research on quantitative precipitation estimation of landfalling typhoons in South China based on deep learning and polarimetric radar [D]. Nanjing: Nanjing University of Information Science and Technology, 2022.

[本文引用: 2]

GU X, WANG L, DENG Z, et al

Adaptive spatial and frequency experts fusion network for medical image fusion

[J]. Biomedical Signal Processing and Control, 2024, 96: 106478

[本文引用: 1]

COOLEY J W, TUKEY J W

An algorithm for the machine calculation of complex Fourier series

[J]. Mathematics of Computation, 1965, 19 (90): 297- 301

[本文引用: 1]

HOU Q, ZHOU D, FENG J. Coordinate attention for efficient mobile network design [C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Nashville: IEEE, 2021: 13708–13717.

[本文引用: 1]

KINGMA D P, BA J. Adam: a method for stochastic optimization [EB/OL]. (2014-12-22). https://arxiv.org/abs/1412.6980.

[本文引用: 1]

SMITH L N, TOPIN N. Super-convergence: very fast training of neural networks using large learning rates [C]//Proceedings of the Artificial Intelligence and Machine Learning for Multi-Domain Operations Applications. Baltimore: SPIE, 2019: 36.

[本文引用: 1]

RUZANSKI E, CHANDRASEKAR V

Scale filtering for improved nowcasting performance in a high-resolution X-band radar network

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2011, 49 (6): 2296- 2307

[本文引用: 1]

/