浙江大学学报(工学版), 2026, 60(3): 468-477 doi: 10.3785/j.issn.1008-973X.2026.03.002

交通工程、土木工程

基于HMARU-net的隧道渗漏水轻量化检测方法

武晓春,, 郭宁

兰州交通大学 自动化与电气工程学院,甘肃 兰州 730070

Lightweight detection method of water leakage in tunnel based on HMARU-net

WU Xiaochun,, GUO Ning

School of Automation and Electrical Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China

收稿日期: 2025-04-2  

基金资助: 国家自然科学基金资助项目(61661027);中央引导地方科技发展资金资助项目(24ZYQA044);甘肃省重点研发计划资助项目(22YF7GA141).

Received: 2025-04-2  

Fund supported: 国家自然科学基金资助项目(61661027);中央引导地方科技发展资金资助项目(24ZYQA044);甘肃省重点研发计划资助项目(22YF7GA141).

作者简介 About authors

武晓春(1973—),女,教授,从事交通信息工程及控制的研究.orcid.org/0009-0005-9874-452X.E-mail:369038806@qq.com , E-mail:369038806@qq.com

摘要

针对现有地铁隧道衬砌渗漏水检测模型检测精度较低、检测速度较慢、抗干扰能力较差的问题,提出轻量化分割模型HMARU-net. 采用结合自校准卷积的HC-MobileNetV3作为主干特征提取网络,轻量化模型并提升多尺度特征提取能力. 设计部分注意力卷积聚合网络PACANet,通过注意力机制和残差结构,增强全局信息建模和复杂细节特征提取的能力. 构建残差模块RAEPC Block组成解码器,减少计算需求,提高分割精度和抗干扰能力. 在跳跃连接层引入Attention Gate,有效降低编、解码器之间的语义差异. 实验结果表明,HMARU-net的平均交并比、平均像素准确度和准确率分别达到86.0%、93.07%和98.33%. 模型复杂度大幅降低,参数量、计算量仅为3.134×106和6.872×109,图片处理速度达到78.967 帧/s. 与其他主流语义分割模型相比,HMARU-net显著提升了检测精度与效率,具有较强的轻量化优势.

关键词: 渗漏水 ; 语义分割 ; 轻量化 ; 病害检测 ; 深度学习

Abstract

The lightweight segmentation model HMARU-net was proposed in order to address the issues of low detection accuracy, slow detection speed, and poor interference resistance in existing subway tunnel lining water leakage detection models. HC-MobileNetV3 combined with self-calibrating convolution was employed as the backbone feature extraction network, achieving lightweight modeling while enhancing multi-scale feature extraction capability. The partial attention convolutional aggregation network was designed to enhance global information modeling and complex detail feature extraction through attention mechanism and residual structure. A residual module (RAEPC Block) was incorporated into the decoder to reduce computational demand while improving segmentation accuracy and interference resistance. An Attention Gate introduced in the skip-connection layer effectively mitigated semantic discrepancy between encoder and decoder. The experimental results demonstrated that HMARU-net achieved the mean intersection over union of 86.0%, mean pixel accuracy of 93.07%, and accuracy of 98.33%. Model complexity was significantly reduced, with only 3.134×106 parameters and 6.872×109 computations, enabling image processing speed of 78.967 frames per second. HMARU-net significantly improved detection accuracy and efficiency while offering strong lightweight advantage compared with other mainstream semantic segmentation models.

Keywords: water leakage ; semantic segmentation ; lightweight ; disease detection ; deep learning

PDF (3363KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

武晓春, 郭宁. 基于HMARU-net的隧道渗漏水轻量化检测方法. 浙江大学学报(工学版)[J], 2026, 60(3): 468-477 doi:10.3785/j.issn.1008-973X.2026.03.002

WU Xiaochun, GUO Ning. Lightweight detection method of water leakage in tunnel based on HMARU-net. Journal of Zhejiang University(Engineering Science)[J], 2026, 60(3): 468-477 doi:10.3785/j.issn.1008-973X.2026.03.002

我国城市轨道交通发展迅速,截至2024年12月31日,内地地铁运营里程为9 281.77 km,占城市轨道交通运营线路总长度的76.27%[1]. 随着运营里程和客运量的增加,地铁基础设施损耗加剧,隧道基础设施的养护对于保障列车的运行安全尤为重要. 衬砌渗漏水作为地铁隧道最常见的病害之一,会导致隧道内产生金属结构锈蚀、衬砌脱落、电气设施故障等情况,严重危及列车运行安全[2-4]. 目前,地铁隧道衬砌渗漏水病害的检测仍以人工巡检为主,高度依赖人工经验,存在效率低、主观性强和漏检、错检等问题,因此亟需高效、准确的渗漏水病害自动检测技术.

近年来,深度学习以其优良的特征提取能力、较强的泛化性和鲁棒性,被引入隧道病害检测领域. 黄宏伟等[5]基于全卷积网络(FCN),实现了盾构隧道表征病害的高效检测. 宋娟等[6]通过引入Mobile ViT网络、TP Block和CA注意力机制,提出TDD-YOLO,实现隧道衬砌病害的高精度检测. 王健等[7]结合点云数据,在Mask RCNN中引入空洞卷积和可变形卷积,实现了隧道渗漏水病害的快速检测. 周中等[8]基于DeepLabV3+,引入EfficientNetv2和CBAM注意力机制,在轻量化模型的同时,实现渗漏水检测的高效检测. Tan等[9]将ShuffleNetv2作为编码器,应用跳跃连接结构,设计轻量化渗漏水检测网络(LSNet). Wang等[10]引入自定义侧面引导和并行注意力模块,设计CSG-Unet,实现复杂环境下的高效渗漏水区域分割. 诸多学者基于编码器-解码器结构的语义分割算法实现对隧道病害的精细化检测,但此类算法需要多次卷积和采样操作,参数量、计算量较大且检测速度慢. 地铁隧道环境复杂,渗漏水形态多样,在检测过程中存在精度低、抗干扰能力差的问题. 此外,由于地铁系统维护的窗口期短,隧道渗漏水数据集的获取较困难. 本文选用在小样本数据集上效果较好的U-net[11]为基础,从轻量化角度出发,在提高模型检测效率的同时,提高渗漏水区域检测的精度和抗干扰能力.

本文基于U-net设计HMARU-net,提出HC-MobileNetV3轻量化主干特征提取网络. 设计部分注意力卷积聚合网络,构建残差模块用于组成U-net解码器. 引入Attention Gate,应对跳跃连接层存在的语义鸿沟问题. 该模型具有高精度且能够满足实际工程检测的实时性需求,为地铁隧道衬砌渗漏水的实际检测提供技术支持.

1. HMARU-net网络

选取U-net作为基线网络,该网络的U型对称结构由编码器与解码器2部分构成,是基于全卷积神经网络(fully convolutional network, FCN)的像素级语义分割模型. 编码器通过多次卷积和下采样操作提取输入图像的多层级特征表示,解码器通过多次卷积与上采样的逆向操作,将特征图的空间分辨率逐步恢复至原始尺寸,并在最终层通过1×1卷积实现区域的像素级精确分割. 此外,编码器与解码器之间通过跳跃连接将编码阶段特征直接传递给解码部分,弥补了上采样过程可能导致的特征信息流失. U-net网络的对称性和跳跃连接设计使其在小样本语义分割任务中表现出良好的性能,因此被广泛应用于各种分割场景[12-13].

U-net常用VGG[14]、ResNet和EfficientNet等作为主干特征提取网络,尽管此类网络使得U-net在图像语义分割中具备较高的精确度,但其较深的卷积层导致模型的参数量和计算量较高,不利于资源受限环境下的图像快速处理. 在实际地铁隧道的检修场景中,由于夜间检修窗口期仅约为4 h,且硬件资源有限,轻量化的语义分割模型更具实际应用价值.

为了满足衬砌渗漏水病害检测的要求,对U-net进行轻量化改进,使其更适用于实际工程应用的场景. 改进后的轻量化模型HMARU-net结构如图1所示. 模型的左侧结构为HC-MobileNetV3组成的编码器;右侧是由RAEPC Block组成的解码器,且在跳跃连接层加入了注意力门机制.

图 1

图 1   HMARU-net的结构

Fig.1   Structure of HMARU-net


1.1. HC-MobileNetV3轻量化主干特征提取网络

主干网络作为特征提取的重要组成部分,对目标特征的提取能力直接影响整个模型的分割效果. 为了保证模型精度并降低参数量和计算量,提出HC-MobileNetV3特征提取网络.

MobileNet系列网络是由Google团队提出的专为移动设备优化的高效网络结构,能够在计算资源受限的条件下实现较优异的性能表现. 综合考虑模型精度与推理效率,选择MobileNetV3-Large[15]作为基础主干特征提取网络. 渗漏水区域的形状、大小各异,受限于深度卷积的局部感受野特性,核心特征提取单元bneck难以充分捕捉渗漏水区域的多尺度空间特征. 引入自校准卷积(self-calibrated convolution,SCConv)[16],替换bneck中的深度卷积. 设计SC-bneck,提高网络在渗漏水检测中的多尺度特征提取能力.

自校准结构通过围绕扩展感受野、多尺度信息融合以及增强通道间的依赖性进行设计,能够在不增加大量参数的前提下,提升卷积网络的特征提取能力. 改进后的SC-bneck结构如图2所示.

图 2

图 2   SC-bneck结构

Fig.2   Structure of SC-bneck


自校准结构如图3所示,原理如下.

图 3

图 3   自校准结构

Fig.3   Structure of self-calibration


1) ${{{K}}_1}$分支对输入特征进行下采样,将空间分辨率降为原始的1/2. 通过深度卷积进行空间特征建模,捕获更大的感受野. 通过上采样操作恢复特征尺寸,通过残差连接与输入特征相加,经过sigmoid函数得到注意力权重.

$ {K_1}\left( {\boldsymbol{s}} \right) = {{\mathrm{Up}}} \left( {{{\mathrm{DWConv}}} \left( {{{\mathrm{Pool}}} \left( {\boldsymbol{s}} \right)} \right)} \right), $

$ {\boldsymbol{A}}\left( {\boldsymbol{s}} \right) = \sigma \left( {{\boldsymbol{s}}+{K_1}\left( {\boldsymbol{s}} \right)} \right). $

式中:$ {{\mathrm{Up}}} $$ {{\mathrm{Pool}}} $分别表示上采样操作和平均池化,$ \sigma $为sigmoid函数,$ {{\mathrm{DWConv}}} $为深度卷积操作,$ {\boldsymbol{A}}\left( {\boldsymbol{s}} \right) $为注意力权重.

2) ${{{K}}_2}$分支直接对输入特征进行局部特征建模,利用深度卷积保留局部空间信息,专注于精细的局部特征建模,并将局部特征和注意力权重进行加权融合.

$ {\boldsymbol{\delta }} = {{\mathrm{DWConv}}} \left( {\boldsymbol{s}} \right) \cdot {\boldsymbol{A}}\left( {\boldsymbol{s}} \right). $

式中:$ {\boldsymbol{\delta }} $为局部特征和动态注意力权重加权融合后的特征.

3) ${{{K}}_3}$分支对经过自校准的特征进行进一步处理,通过卷积操作调整通道维度,实现多尺度信息互补.

$ {{\mathrm{SCConv}}} \left( {\boldsymbol{s}} \right) = {{\mathrm{DWConv}}} \left( {\boldsymbol{\delta }} \right). $

图3可知,自校准结构共有K1K2K3 3个分支. 其中K1分支通过下采样、卷积和上采样操作及残差连接,获取注意力权重. 通过K1分支得到的注意力权重,对K2分支进行动态校准. 在K3分支进行通道调整,实现多尺度信息互补. 相比于深度卷积,自校准结构通过多分支和深度卷积的联合设计,平衡轻量化和特征表征能力,使得SC-bneck在具有较高的渗漏水多尺度特征提取能力的同时,仅增加少量的参数量和计算量.

主干网络中的浅层网络主要处理低级特征,深层次网络负责提取较高级的语义信息,需要更多的上下文信息和全局理解. 随着网络层数的加深,MobileNetV3-Large中第12~15层bneck负责提取高级语义信息,将MobileNetV3-Large第12~15层的bneck替换为SC-bneck,提出HC-MobileNetV3轻量化主干特征提取网络,在提高多尺度特征提取能力的同时保持网络的轻量化. 网络层数的配置如表1所示. 其中,e为扩张因子,c为输出的通道个数,s为步长,“—”表示没有使用SE注意力机制,“+”表示该层使用了SE注意力机制. 由于U-net网络拼接层要求2个张量尺寸匹配,根据网络结构选择第1、3、6、12、15层的输出作为U-net编码器部分的5个输出特征层,传递给后续的解码器进行特征拼接.

表 1   HC-MobileNetV3网络配置

Tab.1  HC-MobileNetV3 network configuration

序号输入特征尺寸操作类型ecSE激活函数s
06402×3Conv2d16HS2
13202×16bneck, 3×31616RE1
23202×16bneck, 3×36424RE2
31602×24bneck, 3×37224RE1
41602×24bneck, 5×57240+RE2
5802×40bneck, 5×512040+RE1
6802×40bneck, 5×512040+RE1
7802×40bneck, 3×324080HS2
8402×80bneck, 3×320080HS1
9402×80bneck, 3×318480HS1
10402×80bneck, 3×318480HS1
11402×80bneck, 3×3480112+HS1
12402×112SC-bneck, 3×3672112+HS1
13402×112SC-bneck, 5×5672160+HS2
14202×160SC-bneck, 5×5960160+HS1
15202×160SC-bneck, 5×5960160+HS1

新窗口打开| 下载CSV


1.2. RAEPC Block

在U-net中,解码器由多个3×3标准卷积组成. 标准卷积的使用导致模型的参数量和计算量较大,同时由于标准卷积是对所有区域进行均匀处理,对特征细节和边界的关注度不够. 在渗漏水区域与背景特征相似的情况下,这种局限性使得模型对目标区域和背景噪声的区分能力不足,导致渗漏水区域边界模糊、漏检或错检等问题. 针对上述问题,设计残差注意力增强部分卷积块(residual attention-enhanced partial convolution block,RAEPC Block)用于构建解码器,进一步轻量化模型并提高分割精度和抗干扰能力,结构如图4所示.

图 4

图 4   RAEPC Block的结构

Fig.4   Structure of RAEPC Block


输入的2种特征图通过Concat拼接后,采用部分注意力卷积聚合网络(partial attention convolution and aggregation network,PACANet),在复杂背景环境中聚焦渗漏水区域. 通过Hardswish激活函数和BatchNorm,加速模型训练,提高泛化能力和稳定性. 利用1×1逐点卷积进行跨通道整合特征,处理不同尺度的渗漏水特征. 通过引入残差连接,解决深层网络中信息丢失和退化的问题. RAEPC Block能够在降低模型的参数量和计算量的同时,提高模型的多尺度特征融合能力和复杂隧道场景下的抗干扰能力.

RAEPC Block的核心模块PACANet是基于部分卷积[17]进行改进. 部分卷积对输入特征进行通道划分并对部分通道进行卷积运算,有效减少了计算量和内存需求,但无法区分重要特征通道,对渗漏水区域细节特征的提取能力较弱. 通过融合通道注意力和像素注意力机制,结合残差连接对部分卷积进行改进,提出PACANet,结构如图5所示.

图 5

图 5   PACANet的结构

Fig.5   Structure of PACANet


具体原理如下. 将输入特征图${\boldsymbol{X}} \in {{\bf{R}}^{C \times W \times H}}$划分为$ {{\boldsymbol{X}}_1} \in {{\bf{R}}^{{C_\text{p}} \times W \times H}} $${{\boldsymbol{X}}_2} \in {{\bf{R}}^{{C_\text{u}} \times W \times H}}$${{\boldsymbol{X}}_1}$经过3×3卷积操作,${{\boldsymbol{X}}_2}$保持不变,经过concat拼接. 利用通道注意力机制,通过全局池化和1×1卷积生成通道权重,区分重要通道. 利用像素注意力原理,将通道加权后的特征通过1×1卷积生成像素级空间权重图. 通过残差连接,将原始特征、通道注意力特征和像素注意力特征融合,增强模型的特征表达能力,如下所示.

$ {{\boldsymbol{X}}^{'}} = {{\mathrm{Concat}}} \left( {{{{{\mathrm{Conv}}} }_{3 \times 3}}\left( {{{\boldsymbol{X}}_1}} \right),{{\boldsymbol{X}}_2}} \right), $

$ {\boldsymbol{w}} = \sigma \left( {{{{{\mathrm{Conv}}} }_{1 \times 1}} \cdot {{\mathrm{ReLU}}} \left( {{{{{\mathrm{Conv}}} }_{1 \times 1}} \cdot {{\mathrm{GAP}}} \left( {{{\boldsymbol{X}}{'}}} \right)} \right)} \right), $

$ {\boldsymbol{Y}} = {{\boldsymbol{X}}{'}}+{{\boldsymbol{X}}{'}} \cdot {\boldsymbol{w}}+{{\boldsymbol{X}}{'}} \cdot \sigma \left( {{{{{\mathrm{Conv}}} }_{1 \times 1}}\left( {{{\boldsymbol{X}}{'}} \cdot {\boldsymbol{w}}} \right)} \right). $

式中:$ {\boldsymbol{w}} $为经过通道注意力和像素注意力机制的特征权重,$ \sigma $为sigmoid函数,${{\boldsymbol{X}}_1}$${{\boldsymbol{X}}_2}$分别为划分后的2个特征图,GAP为全局池化,Concat为拼接操作.

PACANet利用通道注意力增强重要特征通道的动态感知能力,有效区分渗漏水特征通道和背景冗余通道. 引入像素注意力机制,提高网络对复杂空间细节特征的敏感性,精确定位渗漏水区域. 结合残差结构,融合全局、局部和原始信息,实现特征的多维度增强. 通过以上改进,PACANet具有较高的全局上下文信息建模能力和复杂细节特征提取能力,适用于渗漏水病害检测任务.

1.3. 注意力门机制

U-net在上采样过程中存在语义信息丢失的问题,且跳跃连接层将深层和浅层特征简单拼接,导致语义鸿沟问题. 为了解决该问题,在上采样和跳跃连接层中间引入Attention Gate[18],利用深层特征图对浅层特征图进行注意力加权激活,动态抑制隧道背景及无关信息,突出渗漏水区域的显著特征.

Attention Gate在提高特征选择性的同时,有效降低了编解码器之间的语义差异,增强了浅层空间细节与深层语义信息的融合效果,从而提高网络对渗漏水目标区域的识别与检测能力. 结构如图6所示,原理如下.

图 6

图 6   Attention Gate的结构

Fig.6   Structure of Attention Gate


1) 将深层特征${\boldsymbol{g}}$和浅层特征${\boldsymbol{x}}$分别通过1×1卷积和BatchNorm进行特征映射和通道压缩.

$ {{\boldsymbol{W}}_{\boldsymbol{g}}}\left( {\boldsymbol{g}} \right) = {{\mathrm{BN}}} \left( {{{{{\mathrm{Conv}}} }_{1 \times 1}}\left( {\boldsymbol{g}} \right)} \right), $

$ {{\boldsymbol{W}}_{\boldsymbol{x}}}\left( {\boldsymbol{x}} \right) = {{\mathrm{BN}}} \left( {{{{{\mathrm{Conv}}} }_{1 \times 1}}\left( {\boldsymbol{x}} \right)} \right). $

2) 将压缩后的特征结果进行逐元素相加,通过${\text{ReLU}}$激活函数引入非线性映射,得到注意力中间特征${\boldsymbol{\psi }}$. 通过1×1卷积和sigmoid函数,生成权重矩阵${\boldsymbol{\alpha }}$.

$ {\boldsymbol{\psi }} = {{\mathrm{ReLU}}} \left( {{{\boldsymbol{W}}_{\boldsymbol{g}}}\left( {\boldsymbol{g}} \right)+{{\boldsymbol{W}}_{\boldsymbol{x}}}\left( {\boldsymbol{x}} \right)} \right), $

$ {\boldsymbol{\alpha }} = \sigma \left( {{{\mathrm{BN}}} \left( {{{{{\mathrm{Conv}}} }_{1 \times 1}}\left( {\boldsymbol{\psi }} \right)} \right)} \right). $

3) 将注意力权重矩阵${\boldsymbol{\alpha }}$与浅层特征${\boldsymbol{x}}$相乘,得到对浅层特征${\boldsymbol{x}}$注意力激活后的特征图${{\boldsymbol{x}}{'}}$.

$ {{\boldsymbol{x}}{'}} = {\boldsymbol{\alpha }} \cdot {\boldsymbol{x}}. $

2. 数据集建立

2.1. 构建渗漏水数据集

利用南方测绘科技有限公司生产的MS100移动三维扫描设备,在北京某地铁隧道进行数据采集,收集地铁隧道内正射全景影像,在5 m的距离上,采集到的图像分辨率达到2 mm. 如表2所示为MS100采集设备的具体参数,如图7所示为MS100数据采集设备.

表 2   MS100采集设备的参数

Tab.2  Parameter of MS100 acquisition device

类别参数
工作方式相位式
扫描距离0.6~350 m
扫描现场角水平360°,垂直300°
扫描速度106点/s
行走速度50~5000 m/h
测距精度±1 mm
角精度≥19角秒
相机同轴影像内置1.65亿像素

新窗口打开| 下载CSV


图 7

图 7   MS100移动三维扫描系统

Fig.7   MS100 mobile 3D scanning system


由于原始渗漏水数据的尺寸过大,无法直接输入算法进行学习,采用滑动图像剪裁算法对原始图像进行处理. 获取原始采集图像的分辨率为$W \times H$,其中$W$$H$分别为图像的宽和高. 根据需要选择剪裁窗口的大小为$a \times b$,其中$a$$b$分别为剪裁窗口的宽和高. 按照行和列遍历原始图像,进行裁剪. 具体的裁剪过程示意图如图8所示. 经过数据清洗和筛选后,得到127张分辨率为640×640像素的渗漏水病害图片,使用Lableme工具进行标注.

图 8

图 8   图像剪裁的示意图

Fig.8   Illustration of image cropping


2.2. 数据增强

由于数据集较小,直接用于训练会导致模型无法完全学习渗漏水特征并可能出现过拟合现象,利用Albumentations库增强数据集. 通过水平、垂直翻转、位移、缩放、旋转和转置等方式对数据集进行扩充,具体方式如图9所示. 最终得到1 200张渗漏水数据集,按照8∶1∶1的比例划分为训练集、验证集和测试集,数据增强后的部分图片及掩码图如图10所示.

图 9

图 9   具体增强方式的示意图

Fig.9   Schematic representation of specific enhancement


图 10

图 10   数据增强后的图像及标签图

Fig.10   Data-enhanced image and labeled diagram


3. 实验准备

在CPU为12th Gen Core i5-12600KF,内存为32 GB,装有NVIDIA GeForce RTX4060Ti 8G GPU的Windows11 64bit系统上进行实验. 实验环境为pycharm2023.1.3集成开发环境(IDE),python版本为3.10.11,CUDA版本为12.1,深度学习框架为PyTorch2.3.1.

检测对象为衬砌渗漏水,是二分类语义分割任务,且渗漏水区域和背景占比的差异较大. 数据集中的渗漏水像素点数为20 059 464,背景像素点数为341 270 456,渗漏水占比仅为5.55%,存在严重的正负样本不均衡现象,传统的交叉熵损失函数会导致模型分割性能较差. 采用结合了相似系数损失函数LD焦点损失函数LF的统一损失函数LU.

$ L_{\mathrm{D}} = 1 - \frac{{2\displaystyle \sum\nolimits_{i=1}^N {{p_i}{t_i}} }}{{\displaystyle \sum\nolimits_{i=1}^N {p_i^2+\displaystyle \sum\nolimits_{i=1}^N {t_i^2} } }}, $

$ L_{\mathrm{F}} = - {\alpha _\text{t}}{\left( {1 - {P_\text{t}}} \right)^\gamma }\ln {{P_\text{t}}} , $

$ L_{\mathrm{U}} = L_{\mathrm{D}}+L_{\mathrm{F}}. $

式中:${p_i}$${t_i}$分别为预测像素和目标像素;${P_\text{t}}$为预测概率;${\alpha _\text{t}}$为类别权重;$\gamma $为调节因子,$\gamma $=2[19].

使用语义分割中常用的评价指标,对分割结果进行定量分析,包括分割精度指标和模型效率指标. 精度和效率指标分别包括平均交并比(mean Intersection over Union,mIOU)、平均像素准确率(mean pixel accuracy,mPA)、分类准确率acc、模型参数量Np、每秒浮点运算次数FLOPs和图片处理速度v.

$ \text{mIOU} = {k^{-1}}\sum\nolimits_{i = 1}^k {\frac{{{p_{ii}}}}{{\displaystyle \sum\nolimits_{j = 1}^k {{p_{ij}}} +\displaystyle \sum\nolimits_{j = 1}^k {{p_{ji}} - {p_{ii}}} }}} , $

$ \text{mPA} = \frac{1}{k}\sum\nolimits_{i = 1}^k {\frac{{{p_{ii}}}}{{\displaystyle \sum\nolimits_{j = 1}^k {{p_{ij}}} }}} , $

$ \text{acc} = \frac{{\displaystyle \sum\nolimits_{i = 1}^k {p_{ii}} }}{{\displaystyle \sum\nolimits_{i = 1}^k {\displaystyle \sum\nolimits_{j = 1}^k {{p_{ij}}} } }}. $

式中:$k$为类别的总数,${p_{ii}}$为类别$i$的正确预测的像素数,${p_{ij}}$为实际类别为$i$、预测为$j$的像素总数,${p_{ji}}$为实际类别为$j$、预测为$i$的像素总数.

4. 实验结果与分析

4.1. 训练结果

为了保证模型在训练过程中收敛迅速并充分发挥网络性能,根据模型的复杂性和数据集的特点设置模型的参数. 本实验中模型迭代次数为150,采用Adam自适应学习率优化器,将验证集损失值作为优化目标,批量处理大小为8,初始学习率为0.000 1,最小学习率为0.000 001,动量为0.9. 学习率下降策略采用余弦退火衰减法,以加速收敛并防止陷入局部最优,具体公式为

$ {\eta _{\text{t}}} = {\eta _{\min }}+0.5\left( {{\eta _{\max }} - {\eta _{\min }}} \right)\left( {1+\cos \left( {\frac{{{T_{{\text{cur}}}}}}{{{T_{\max }}}}\text{π} } \right)} \right). $

式中:${\eta _\text{t}}$为当前学习率,${\eta _{\min }}$为最小学习率,${\eta _{\max }}$为最大学习率,${T_{{\text{cur}}}}$为当前轮次,${T_{\max }}$为总训练轮次.

图11所示为模型训练过程的训练和验证损失函数曲线. 其中,LtLv分别为训练集损失和验证集损失,Ni为迭代次数. 可以看出,在120轮左右模型基本趋于平稳,表明模型此时已经收敛且没有过拟合现象.

图 11

图 11   HMARU-net的损失曲线

Fig.11   Loss curve of HMARU-net


由于训练集、验证集和测试集的划分在分割任务中直接影响模型的性能,对数据集的划分比例进行对比实验,如表3所示. 可知,当训练集、验证集和测试集的比例为8∶1∶1时,模型的分割精度最高.

表 3   数据集比例的对比

Tab.3  Comparison of data set proportion

训练集、验证集、测试集的比例mIOU/%mPA/%acc/%
8∶1∶186.0093.0798.33
7∶2∶185.2591.7997.99
6∶2∶285.1391.4698.15

新窗口打开| 下载CSV


4.2. 损失函数的对比实验

分别采用交叉熵损失函数和统一损失函数作为模型损失函数进行实验对比,结果如表4所示.

表 4   损失函数的对比

Tab.4  Comparison of loss function

损失函数mIOU/%mPA/%acc/%
统一损失函数86.0093.0798.33
交叉熵损失函数83.6690.1098.07

新窗口打开| 下载CSV


从结果可知,与交叉熵损失函数相比,提出的统一损失函数能够有效地适应渗漏水检测任务,mIOU、mPA和acc分别提升了2.34%、2.97%和0.26%. 统一损失函数结合$L_{\mathrm{D}}$$L_{\mathrm{F}}$的优势,能够处理渗漏水数据集的类别不均衡问题并提高少数类样本的识别率,大幅提高渗漏水区域的检测精度.

4.3. 主干网络的对比实验

周中等[8-9]研究证明,轻量化特征提取网络能够在语义分割任务中体现出优越的性能,有效地降低模型参数量,使其适用于实际工程应用. 选择主干为VGG16的U-net模型作为基线网络,与不同的轻量化主干网络进行对比实验,实验结果如表5所示.

表 5   主干网络的对比

Tab.5  Comparison of backbone network

主干网络mIOU/%mPA/%acc/%Np/106FLOPs/109v/(帧·s-1)
VGG1681.3590.0697.6524.891705.73814.83
MobilenetV281.7990.6297.703.44912.272104.01
MobilenetV383.2891.3197.943.2958.58896.883
MobilenetV4M82.0091.2697.7111.07836.22081.23
Ghostnet83.1791.1697.932.9997.37278.36
HC-MobileNetV384.1892.5998.043.3258.65191.521

新窗口打开| 下载CSV


从结果分析可知,MobileNet和Ghostnet作为U-net网络的主干特征提取网络,均能有效地降低模型的参数量和计算量. 其中HC-MobileNetV3网络相较于其他主干网络具有显著的优势. 具体而言,MobileNetV4M能够提高模型的分割性能,但是参数量和计算量较其他轻量化网络最大. Ghostnet具有最小的计算量和参数量,但精度低于HC-MobileNetV3. MobileNetV3的效率指标略高于HC-MobileNetV3,但是精度指标明显低于HC-MobileNetV3. MobileNetV2作为主干模型,分割性能指标和效率指标均低于HC-MobileNetV3.

分析主干网络在渗漏水数据集上的数据表现可知,HC-MobileNetV3将模型参数量降为原模型的13.35%,计算量降至8.651×109,显著提高了模型的分割精度和图片处理速度,作为主干特征网络的效果最佳.

4.4. 消融实验

为了验证所提的HC-MobileNetV3、RAEPA Block和Attention Gate对本文所提模型性能的影响,以U-net作为基线模型进行消融实验,结果如表6所示.

表 6   消融实验

Tab.6  Ablation experiment

模型mIOU/%mPA/%acc/%Np/106FLOPs/109v/(帧·s-1)
U-net81.3590.0697.6524.891705.73814.830
U-net+HC-MobileNetV384.1892.5998.043.3258.65191.521
U-net+HC-MobileNetV3+RAEPC Block85.3792.7098.243.0946.43782.965
U-net+HC-MobileNetV3+Attention Gate85.4892.6998.263.3659.08589.367
U-net+HC-MobileNetV3+RAEPC Block +Attention Gate86.0093.0798.333.1346.87279.102

新窗口打开| 下载CSV


通过表6中模型的精度和效率指标并结合理论分析可得如下结论. 1) HC-MobileNetV3作为主干特征提取网络的引入,显著提高了模型的渗漏水分割精度,极大地优化了图片处理速度,mIOU、mPA和acc分别提升了2.83%、2.53%和0.39%,图片处理速度提升至91.521 帧/s. 此外,HC-MobileNetV3的轻量化设计大幅降低了模型的参数量和计算量. 2) 在轻量化主干网络的基础上引入RAEPC Block,提高了模型的分割精度,模型的参数量和计算量降至3.094×106和6.437×109. RAEPC Block内部的残差结构和注意力增强特性有效地提高了特征提取能力,但由于残差结构的引入,图片处理速度略微下降. 3) 通过在跳跃连接层引入Attention Gate,可以有效地提高模型的精度,仅略微增加模型参数量和计算量,对模型整体性能的提升效果显著.

4.5. 模型对比实验

为了全面评估HMARU-net的性能,选择目前语义分割任务中广泛使用的U-net、Deeplabv3+[20]、PSPnet[21]、Segformer[22]及轻量化模型[23-24]和TR-Unet[25]进行对比实验,从分割精度和模型效率2个方面综合分析. 其中文献[23]、[24]模型均实现了轻量化,能够满足在移动设备上部署的要求;TR-Unet采用注意力机制,具有较高的抗干扰能力. 实验结果如表7所示.

表 7   不同模型的对比实验结果

Tab.7  Comparative experimental result of different models

模型mIOU/%mPA/%acc/%Np/106FLOPs/109v/(帧·s-1)
Deeplabv3+77.9086.8097.1654.709260.68829.680
PSPnet79.8787.2697.5346.707184.98242.710
U-net81.3590.0697.6524.891705.73814.830
Segformer77.3987.3297.013.71521.15261.730
文献2377.6091.4796.755.81382.60469.253
TR-Unet83.9491.3898.0626.360762.2847.356
文献2479.4489.7797.2811.72075.72969.522
HMARU-net86.0093.0798.333.1346.87278.967

新窗口打开| 下载CSV


表7可知,HMARU-net在分割精度和效率方面均优于其他7种模型. 具体而言,HMARU-net的mIOU、mPA和acc分别达到86.0%、93.07%和98.33%. 此外,模型的参数量和计算量显著减少,分别降至3.134×106和6.872×109,图片处理速度达到78.967帧/s. 与原始U-net相比,分割精度有了大幅提升,mIOU、mPA和acc分别提高了4.65%、3.01%和0.68%,参数量和计算量分别降为原模型的12.59%和0.97%,表现出显著的轻量化特性,图片处理速度提升至U-net的5.32倍. 与文献[23]、[24]的轻量化模型相比,HMARU-net的参数量和计算量均最低,图片处理速度最高,有较高的轻量化优势. 与TR-Unet相比,所提的HMARU-net具有更高的mIOU、mPA和acc,抗干扰能力更强.

通过应用多网络融合、残差结构和注意力机制,有效提高了模型的特征表达能力,在渗漏水检测任务中实现高精度分割的同时,极大降低了参数量和计算量,显著提高了图片处理速度,能够满足实际工程应用的高效、高精度检测需求.

4.6. 渗漏水区域分割结果

为了更直观地对比模型的渗漏水分割效果,选取几张具有代表性的渗漏水图像进行可视化展示,结果如图12所示. 其中,第1列为渗漏水原始图像,第2列为对应的掩码图,作为模型预测结果的对比. 第1~4行的图像分别为背景存在管线干扰的图像、简单背景的不规则渗漏水图像、存在多种形态的渗漏水图像和光线干扰不易分辨的渗漏水图像.

图 12

图 12   不同模型的分割效果可视化

Fig.12   Visualization of segmentation effects of different models


图12可以看出,8种模型在渗漏水区域分割任务中均存在不同程度的漏检问题. 其中DeeplabV3+、文献[23]、[24]模型对简单渗漏水区域的分割效果较好,但对于不规则区域和难分辨区域,漏检、错检问题严重,且抗干扰能力较差. PSPnet、U-net、Segformer和TR-Unet相比于DeeplabV3+抗干扰能力较强但存在不规则区域漏检、错检问题. 与TR-Unet相比,HMARU-net在处理复杂背景和干扰的图像时具有更强的抗干扰能力. 与上述模型相比,提出的HMARU-net模型在分割任务中表现出更强的鲁棒性和更高的分割精度,能够更准确地完成渗漏水区域的检测.

4.7. 实时性分析

模型的图片处理速度须不低于采集设备的速度,才能满足地铁隧道渗漏水检测的实时性要求. 设备行驶速度与模型图片处理速度之间的关系如下:

$ {v_{{\text{car}}}} \leqslant \frac{{v L S}}{{{A}/{{S}}}} \times \frac{{3.6}}{{1\;000}}. $

式中:$ {v_{{\text{car}}}} $为采集设备的行驶速度;$ L $为图像中单个像素对应的实际现实长度比例;$ S $为图片的像素大小,为640;$ A $为隧道断面周长相对应的图像像素数.

本文模型的图片处理速度为78.967帧/s,根据北京市建设工程质量第三检测所有限责任公司提供的工程质量检测报告,对比病害区域像素和实际面积,计算可得$ L $为4.584,$ A $25000. 模型可满足的实时检测速度达到21.35 km/h,高于采集设备的最高运行速度,可以满足实际工程运用的实时性要求.

5. 结 论

(1)提出适用于地铁隧道衬砌渗漏水检测的轻量化HMARU-net模型. 通过在构建的渗漏水数据集上训练,该模型的mIOU、mPA和acc分别达到86.0%、93.07%和98.33%. 此外,模型参数量仅为3.134×106,计算浮点数为6.872×109,图片处理速度达到78.967 帧/s. 在实现轻量化的同时保证了渗漏水分割的高精度,与主流的语义分割算法相比,能够满足实际地铁隧道衬砌渗漏水病害检测任务的高效、高精度要求.

(2) 针对渗漏水检测任务的特点,提出HC-MobileNetV3主干特征提取网络,大幅降低了模型的参数量、计算量,提高了多尺度特征提取能力. 设计PACANet,融合双注意力机制和残差连接,增强特征区分和全局信息建模能力,构建RAEPC Block组成解码器,在降低模型复杂度的同时,提高了多尺度特征融合及抗干扰能力. 引入Attention Gate注意力机制,解决跳跃连接层带来的语义鸿沟问题.

(3) 当前的渗漏水等级判定以定性分析为主,后续研究应考虑渗漏水区域面积的量化分析,并开展维修优先级的评定研究,为地铁隧道智能化运维提供科学、有效的决策依据.

参考文献

侯秀芳, 冯晨, 燕汉民, 等

2024年中国内地城市轨道交通运营线路概况

[J]. 都市快轨交通, 2025, 38 (1): 13- 19

[本文引用: 1]

HOU Xiufang, FENG Chen, YAN Hanmin, et al

Overview of urban rail transit operations in Chinese China’s mainland in 2024

[J]. Urban Rapid Rail Transit, 2025, 38 (1): 13- 19

[本文引用: 1]

TAN L, CHEN X, HU X, et al. DMDSNet: a computer vision-based dual multi-task model for tunnel bolt detection and corrosion segmentation [C]//Proceedings of the IEEE 26th International Conference on Intelligent Transportation Systems. Bilbao: IEEE, 2024: 4827–4833.

[本文引用: 1]

李健超, 柴雪松, 马学志, 等

铁路隧道衬砌表观病害等级评定研究

[J]. 铁道建筑, 2023, 63 (4): 73- 76

DOI:10.3969/j.issn.1003-1995.2023.04.17     

LI Jianchao, CHAI Xuesong, MA Xuezhi, et al

Research on evaluation of surface disease grade for railway tunnel lining

[J]. Railway Engineering, 2023, 63 (4): 73- 76

DOI:10.3969/j.issn.1003-1995.2023.04.17     

常瑞清. 襄渝线隧道渗漏水病害分析与修理工作策略优化研究 [D]. 北京: 中国铁道科学研究院, 2023: 1–10.

[本文引用: 1]

CHANG Ruiqing. Analysis of water-seepage disease and optimization of repair strategy in Xiangyu Railway Tunnel [D]. Beijing: China Academy of Railway Sciences, 2023: 1-10.

[本文引用: 1]

黄宏伟, 李庆桐

基于深度学习的盾构隧道渗漏水病害图像识别

[J]. 岩石力学与工程学报, 2017, 36 (12): 2861- 2871

DOI:10.13722/j.cnki.jrme.2017.0552      [本文引用: 1]

HUANG Hongwei, LI Qingtong

Image recognition for water leakage in shield tunnel based on deep learning

[J]. Chinese Journal of Rock Mechanics and Engineering, 2017, 36 (12): 2861- 2871

DOI:10.13722/j.cnki.jrme.2017.0552      [本文引用: 1]

宋娟, 贺龙喜, 龙会平

基于深度学习的隧道衬砌多病害检测算法

[J]. 浙江大学学报: 工学版, 2024, 58 (6): 1161- 1173

DOI:10.3785/j.issn.1008-973X.2024.06.007      [本文引用: 1]

SONG Juan, HE Longxi, LONG Huiping

Deep learning-based algorithm for multi defect detection in tunnel lining

[J]. Journal of Zhejiang University: Engineering Science, 2024, 58 (6): 1161- 1173

DOI:10.3785/j.issn.1008-973X.2024.06.007      [本文引用: 1]

王健, 郑理科, 吴斌杰, 等

改进Mask RCNN的盾构隧道渗漏水检测方法

[J]. 测绘通报, 2024, (2): 170- 177

DOI:10.13474/j.cnki.11-2246.2024.0232      [本文引用: 1]

WANG Jian, ZHENG Like, WU Binjie, et al

Improved Mask RCNN method for shield tunnel leakage detection

[J]. Bulletin of Surveying and Mapping, 2024, (2): 170- 177

DOI:10.13474/j.cnki.11-2246.2024.0232      [本文引用: 1]

周中, 张俊杰, 龚琛杰, 等

基于深度语义分割的隧道渗漏水智能识别

[J]. 岩石力学与工程学报, 2022, 41 (10): 2082- 2093

DOI:10.13722/j.cnki.jrme.2022.0016      [本文引用: 2]

ZHOU Zhong, ZHANG Junjie, GONG Chenjie, et al

Automatic identification of tunnel leakage based on deep semantic segmentation

[J]. Chinese Journal of Rock Mechanics and Engineering, 2022, 41 (10): 2082- 2093

DOI:10.13722/j.cnki.jrme.2022.0016      [本文引用: 2]

TAN L, HU X, TANG T, et al

A lightweight metro tunnel water leakage identification algorithm via machine vision

[J]. Engineering Failure Analysis, 2023, 150: 107327

DOI:10.1016/j.engfailanal.2023.107327      [本文引用: 2]

WANG P, SHI G

Image segmentation of tunnel water leakage defects in complex environments using an improved Unet model

[J]. Scientific Reports, 2024, 14: 24286

DOI:10.1038/s41598-024-75723-4      [本文引用: 1]

RONNEBERGER O, FISCHER P, BROX T. U-Net: convolutional networks for biomedical image segmentation [C]//Medical Image Computing and Computer-Assisted Intervention. Cham: Springer, 2015: 234–241.

[本文引用: 1]

杨栋杰, 高贤君, 冉树浩, 等

基于多重多尺度融合注意力网络的建筑物提取

[J]. 浙江大学学报: 工学版, 2022, 56 (10): 1924- 1934

DOI:10.3785/j.issn.1008-973X.2022.10.004      [本文引用: 1]

YANG Dongjie, GAO Xianjun, RAN Shuhao, et al

Building extraction based on multiple multiscale-feature fusion attention network

[J]. Journal of Zhejiang University: Engineering Science, 2022, 56 (10): 1924- 1934

DOI:10.3785/j.issn.1008-973X.2022.10.004      [本文引用: 1]

吴泽康, 赵姗, 李宏伟, 等

遥感图像语义分割空间全局上下文信息网络

[J]. 浙江大学学报: 工学版, 2022, 56 (4): 795- 802

DOI:10.3785/j.issn.1008-973X.2022.04.019      [本文引用: 1]

WU Zekang, ZHAO Shan, LI Hongwei, et al

Spatial global context information network for semantic segmentation of remote sensing image

[J]. Journal of Zhejiang University: Engineering Science, 2022, 56 (4): 795- 802

DOI:10.3785/j.issn.1008-973X.2022.04.019      [本文引用: 1]

SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [EB/OL]. [2025-03-15]. https://arxiv.org/abs/1409.1556

[本文引用: 1]

HOWARD A, SANDLER M, CHEN B, et al. Searching for MobileNetV3 [C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul: IEEE, 2019: 1314-1324.

[本文引用: 1]

LIU J J, HOU Q, CHENG M M, et al. Improving convolutional networks with self-calibrated convolutions [C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle: IEEE, 2020: 10093–10102.

[本文引用: 1]

CHEN J, KAO S H, HE H, et al. Run, don’t walk: chasing higher FLOPS for faster neural networks [C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Vancouver: IEEE, 2023: 12021–12031.

[本文引用: 1]

OKTAY O, SCHLEMPER J, LE FOLGOC L, et al. Attention U-Net: learning where to look for the pancreas [EB/OL]. [2025-03-15]. https://arxiv.org/abs/1804.03999

[本文引用: 1]

LIN T Y, GOYAL P, GIRSHICK R, et al. Focal loss for dense object detection [C]//Proceedings of the IEEE International Conference on Computer Vision. Venice: IEEE, 2017: 2999–3007.

[本文引用: 1]

CHEN L C, ZHU Y, PAPANDREOU G, et al. Encoder-decoder with atrous separable convolution for semantic image segmentation [C]// Proceedings of the European Conference on Computer Vision. Cham: Springer, 2018: 833–851.

[本文引用: 1]

ZHAO H, SHI J, QI X, et al. Pyramid scene parsing network [C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: IEEE, 2017: 6230–6239.

[本文引用: 1]

XIE E, WANG W, YU Z, et al. SegFormer: simple and efficient design for semantic segmentation with transformers [EB/OL]. [2025-03-15]. https://arxiv.org/abs/2105.15203.

[本文引用: 1]

郭道俊, 周幸宇, 许崇帮, 等

基于DeepLabV3+网络改进的快速隧道病害分割方法

[J]. 公路交通科技, 2023, 40 (8): 127- 135

DOI:10.3969/j.issn.1002-0268.2023.08.018      [本文引用: 4]

GUO Daojun, ZHOU Xingyu, XU Chongbang, et al

Improved fast tunnel disease segmentation method based on DeepLabV3+ network

[J]. Journal of Highway and Transportation Research and Development, 2023, 40 (8): 127- 135

DOI:10.3969/j.issn.1002-0268.2023.08.018      [本文引用: 4]

WANG D, HOU G, CHEN Q, et al

Segmentation of tunnel water leakage based on a lightweight DeepLabV3+ model

[J]. Measurement Science and Technology, 2025, 36 (1): 015414

DOI:10.1088/1361-6501/ad894f      [本文引用: 4]

陈曦, 张坤, 王伟, 等

基于TR-Unet的隧道渗漏水智能识别方法

[J]. 应用基础与工程科学学报, 2025, 33 (2): 514- 525

DOI:10.16058/j.issn.1005-0930.2025.02.018      [本文引用: 1]

CHEN Xi, ZHANG Kun, WANG Wei, et al

Intelligent identification of tunnel water leakage based on TR-Unet

[J]. Journal of Basic Science and Engineering, 2025, 33 (2): 514- 525

DOI:10.16058/j.issn.1005-0930.2025.02.018      [本文引用: 1]

/