浙江大学学报(工学版), 2024, 58(6): 1161-1173 doi: 10.3785/j.issn.1008-973X.2024.06.007

土木工程、交通工程

基于深度学习的隧道衬砌多病害检测算法

宋娟,, 贺龙喜,, 龙会平

邵阳学院 土木与建筑工程学院,湖南 邵阳 422000

Deep learning-based algorithm for multi defect detection in tunnel lining

SONG Juan,, HE Longxi,, LONG Huiping

School of Civil and Architectural Engineering, Shaoyang College, Shaoyang 422000, China

通讯作者: 贺龙喜,男,高级实验师. orcid.org/0009-0000-0677-4814. E-mail: helxshaoyang@163.com

收稿日期: 2023-06-4  

基金资助: 湖南省教育厅一般项目(20C1658,21C0602).

Received: 2023-06-4  

Fund supported: 湖南省教育厅一般项目(20C1658,21C0602).

作者简介 About authors

宋娟(1977—),女,副教授,从事绿色建造及缺陷识别工作研究.orcid.org/0009-0006-1995-990X.E-mail:songjsyuniversity@163.com , E-mail:songjsyuniversity@163.com

摘要

针对已有目标检测算法在隧道衬砌病害检测中全局信息提取不充分、检测精度低的问题,提出隧道衬砌表观病害检测算法TDD-YOLO. 该算法以YOLOv7框架为基础,采用MobileViT作为主干特征提取网络,提高网络全局信息和局部信息提取能力;在特征金字塔网络的上采样和下采样后增加Coordinate attention (CA)注意力模块,突出病害的特征信息,去除背景信息的干扰;提出卷积模块TP Block,在计算量较小的情况下进一步提高网络的特征提取能力. 为了验证所提出算法的有效性,选用SSD、Faster-RCNN、EfficientDet、YOLOv5、YOLOv7这5种算法进行对比分析. 实验结果表明,TDD-YOLO算法的F1为77.43%,相对5种对比算法,分别提高了15.58%、17.36%、12.19%、6.32%、6.14%;mAP为77.52%,相对5种对比算法,分别提高了15.20%、14.24%、9.44%、7.44%、6.39%. TDD-YOLO算法病害识别精度最高,综合性能最优,适用于实际隧道工程的病害检测任务.

关键词: 隧道病害 ; 深度学习 ; 病害识别 ; 目标检测 ; 神经网络

Abstract

A tunnel lining surface defect detection algorithm TDD-YOLO was proposed, for the problems of insufficient global information extraction and low detection accuracy of existing object detection algorithms in tunnel lining defect detection. The algorithm was based on the YOLOv7 framework. Firstly, MobileViT was used as the backbone feature extraction network to improve the global and local information extraction capability of the network. Secondly, Coordinate attention (CA) module was added after the upsampling and downsampling of the feature pyramid network to highlight the feature information of defects and remove the interference of background information. Finally, a convolutional module called TP Block was proposed to further improve the feature extraction ability of the network with less computation. Five algorithms, SSD, Faster-RCNN, EfficientDet, YOLOv5 and YOLOv7, were selected for comparison and analysis, in order to verify the effectiveness of the proposed algorithm. Results showed that the F1 of TDD-YOLO algorithm was 77.43%, which had an improvement of 15.58%, 17.36%, 12.19%, 6.32%, and 6.14%, respectively, compared with the above five contrast algorithms. The mAP was 77.52%, which had an improvement of 15.20%, 14.24%, 9.44%, 7.44%, and 6.39%, respectively. The TDD-YOLO algorithm has the highest defect recognition accuracy and the best overall performance, which is suitable for defect detection task of actual tunnel projects.

Keywords: tunnel defect ; deep learning ; defect recognition ; object detection ; neural network

PDF (4841KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

宋娟, 贺龙喜, 龙会平. 基于深度学习的隧道衬砌多病害检测算法. 浙江大学学报(工学版)[J], 2024, 58(6): 1161-1173 doi:10.3785/j.issn.1008-973X.2024.06.007

SONG Juan, HE Longxi, LONG Huiping. Deep learning-based algorithm for multi defect detection in tunnel lining. Journal of Zhejiang University(Engineering Science)[J], 2024, 58(6): 1161-1173 doi:10.3785/j.issn.1008-973X.2024.06.007

截止2021年底,中国运营公路隧道为23268座,总长度为24698.9公里,运营铁路隧道为17532座,总长度为21055公里. 事实说明,中国已经成为了实至名归的超级隧道大国[1].

隧道衬砌是隧道中的重要组成部分,承担着保护隧道结构的稳定和安全的关键任务. 然而,由于长期受到地质、水文和运营条件等因素的影响,隧道衬砌可能出现各种表观病害,如裂缝、衬砌脱落、渗漏水等[2]. 及时准确地识别隧道衬砌表观病害对于隧道维护和安全管理具有重要意义[3]. 传统的隧道衬砌表观病害识别方法主要依赖于人工经验和直观判断,存在识别效率低、主观性强、易受人为因素影响等问题[4-5]. 对于一些微小病害,人眼难以准确发现,进一步降低了病害识别的准确性和及时性[6].

随着深度学习算法的快速发展,利用其在图像处理和识别方面的优势,开展基于深度学习算法的隧道衬砌表观病害智能识别成为新的研究方向. 与传统方法相比,深度学习算法[7-9]可以克服人为设计病害特征的限制,通过学习数据中的隐含特征,实现更准确和全面的病害识别,此外,深度学习算法具有较强的泛化能力,能够处理不同尺度、角度和光照条件下的图像,提高识别的鲁棒性,更适合隧道表观病害检测[10-11].

近年来,诸多学者将拥有强大数据挖掘能力的深度学习算法逐步用于实现结构病害的智能识别. 例如,Savino等[12]利用GoogLeNet网络对桥梁、隧道、路面的多种病害进行自动化精确分类. Dung[13]提出基于全卷积网络(fully convolutional network,FCN)的混凝土裂缝检测方法,在自建的病害数据集上取得了较好的检测结果. Mandal等[14]基于YOLOv2网络提出路面病害检测系统,在收集的路面裂缝图像中实现了自动化识别. Cheng等[15]利用Faster Region Convolutional Neural Network (Faster RCNN) 双阶段网络实现了隧道中裂缝和渗漏水病害的高精度识别. 周中等[16]利用DeepLabv3+网络完成了实际工程中的隧道渗漏水检测任务. 彭磊等[17]将Mask RCNN网络成功应用于隧道掌子面节理的智能检测与分割.

深度学习算法虽然学习能力强大,但其高度依赖数据集质量. 比如:在简单数据集上训练得到的模型对复杂背景的图像识别精度较低. 一些学者发现,将现有的深度学习算法直接应用于隧道病害识别任务并不完全适用,须对网络进行改进以适应隧道中的复杂环境干扰以及隧道病害的多尺度特点[18-19]. 为了提高复杂环境下隧道表观病害的识别精度与速度,许多学者将改进后的网络进行应用. 薛亚东等[20]基于既有的GoogLeNet网络,提出采用新的卷积核改进inception模块和网络结构,最终得到准确率超过95%的隧道衬砌病害分类模型. Liu等[21]利用提出的图像增强算法对病害图像进行增强,然后利用Faster RCNN网络进行病害检测,发现图像增强算法有效提高了网络的病害识别精度. Zhou等[22]对YOLOv4网络进行改进,提出新的隧道病害检测算法YOLOv4-ED,并在自建的多病害数据集上进行测试,取得了较好的检测结果. Li等[23]引入自适应空间特征融合模块改进YOLOv5,提高网络对隧道病害的识别能力,并利用网络剪枝和知识蒸馏来平衡网络的检测性能和检测效率,最后实现了隧道病害的高精度检测. 王宝坤等[24]利用残差单元和注意力机制提出新型的语义分割模型SU-ResNet++,对隧道多种表观病害完成了高精度分割. Xu等[25]在Mask RCNN网络中引入路径增强特征金字塔网络,提出新型的隧道病害检测方法,实现了对隧道渗漏水和衬砌脱落2种表观病害的精确识别.

由其他研究人员的成果可以发现,基于深度学习算法的隧道衬砌表观病害识别在实际应用中已经取得了一些进展,但其依旧存在一些不足,归纳如下. 1) 缺乏全局信息. 现有的多数隧道表观病害识别算法均基于卷积神经网络,只能提取病害图像的局部信息,缺乏全局信息提取能力,导致隧道病害识别算法容易漏检一些微小病害. 2) 抗干扰能力差. 因隧道环境可能受到光照条件、尺度变化、噪声和遮挡等因素的影响,深度学习算法存在鲁棒性和泛化能力的限制,对不同条件下的病害识别效果会有所下降. 3) 隧道病害图像数量的限制. 获取大规模的隧道衬砌表观病害图像数据需要大量隧道工程作支撑,是一项具有挑战性的任务,缺乏充足的病害图像数据会限制模型的训练效果和检测性能.

针对上述不足,采用MobileViT网络作为主干特征提取网络,并加入TP Block和CA注意力机制,提出TDD-YOLO识别算法,在构建的隧道病害数据集中进行训练,以实现对隧道衬砌表观病害的精准识别.

1. 隧道表观病害检测算法

1.1. YOLOv7算法

YOLOv7[26]主要由主干特征提取网络、特征金字塔网络和输出网络3部分组成,如图1所示. 图中,下采样由过渡模块进行. 在图像输入主干特征提取网络之前,会先进行预处理操作,统一调整图像大小. YOLOv7网络常用的图像大小为416×416和640×640.

图 1

图 1   YOLOv7 网络结构

Fig.1   YOLOv7 network structure


主干特征提取网络主要用于对输入的图像进行特征提取,相比于YOLOv4、YOLOv5网络,YOLOv7的主干网络连接结构更加密集,对图像的特征提取能力更强. 在图像输入至主干特征提取网络后,会经过多个卷积+标准化+激活函数(Conv2D_BN_SiLU)进行特征提取,与之前的YOLO系列网络不同,YOLOv7网络引入了多分支堆叠模块(Multi_Concat_Block)和过渡模块(Transition_Block),进一步提高了网络的识别准确度. 主干特征提取网络最终会输出3个大小分别为13×13、26×26、52×52的特征层.

特征金字塔网络会对得到的3个特征层进一步进行特征提取,并将不同shape的特征层进行特征融合,提取出更好的特征. 特征金字塔网络最终输出的3个特征层大小分别为13×13、26×26、52×52.

输出网络可对特征金字塔网络得到的3个特征层进行处理,进而预测目标的种类、置信度及位置. 该网络首先对每个特征层的3个先验框进行鉴别,判断是否包括目标及目标类型,然后调整先验框,并利用非极大抑制方法删除多余的矩形框,得到最终的预测结果.

输出网络在输出预测结果之前采用了RepConv结构(在图1中表示为卷积结构),该结构的思想取自于RepVGG网络. 在网络训练时会引入特殊的残差结构辅助训练,在进行结果预测时可将复杂的残差结构等效于一个普通的3×3卷积,既可以降低网络复杂度,又不会降低网络的预测性能.

YOLOv7网络使用的多分支堆叠模块如图2所示. 输入图像经过多个分支进行特征提取,并最终进行堆叠来进行特征整合. 该结构能够增加网络深度,提高预测准确率,并且通过跳跃连接的方式缓解神经网络中增加深度带来的梯度消失问题. 此外,网络采用过渡模块进行下采样(见图3). 左分支是一个步长为2×2的最大池化和一个1×1的卷积,右分支是一个1×1的卷积和一个卷积核大小为3×3、步长为2×2的卷积,2个分支的结果会进行堆叠,最终实现特征层下采样.

图 2

图 2   多分支堆叠模块结构

Fig.2   Multi-branch stacked module structure


图 3

图 3   过渡模块结构

Fig.3   Transition module structure


1.2. MobileViT算法

卷积神经网络(convolutional neural network,CNN)具有较强的局部感知能力,能够有效地捕捉输入数据的局部特征信息,并且在计算速度方面具有优势,但其缺点是无法提取全局特征信息[27]. Transformer系列网络能够通过自注意力机制同时获取输入序列中所有位置的信息,从而更好地捕捉全局上下文信息,但其计算资源需求较高,推理速度较慢,模型训练相对困难,这限制了transformer网络的应用. MobileViT网络[28]是2021年提出的网络,其采用CNN和transformer的混合架构,能够同时提取图像的全局特征信息和局部特征信息. 并且加入CNN后能够加速网络收敛,使网络训练过程更加稳定. MobileViT的网络结构如图4(a)所示,MobileViT Block结构如图4(b)所示,MV2结构是MobileNet网络中的Inverted Residual block结构,如图4(c)所示.

图 4

图 4   MobileViT网络结构

Fig.4   MobileViT network architecture


图像输入至MobileViT网络中后,会经过多个MobileViT Block结构和MV2结构进行特征提取,最后得到输出图像. 在MobileViT Block结构中,先通过一个3×3卷积和一个1×1卷积实现局部特征提取,再通过展开结构、Transformer以及堆叠结构完成全局特征提取,最后通过卷积调整通道数得到输出特征层. 其中,展开结构是将特征层划分为多个2×2大小的像素块,并将每个块中对应位置的像素关联起来,在后续的Transformer中进行自注意力操作,实现特征提取,最后在堆叠结构中还原为原来的特征层大小. 在MV2结构中,先通过常规卷积改变通道数,然后利用深度可分离卷积进行特征提取,最后利用常规卷积还原通道数.

1.3. CA注意力机制

现有的注意力机制(如CBAM、SE)采用的全局最大池化或者全局平均池化操作会损失空间信息,而Coordinate attention (CA)注意力机制[29]将位置信息嵌入到了通道注意力中,能够同时考虑通道信息和位置信息,可有效提高图像中待识别目标的权重. CA注意力机制的结构如图5所示. CA注意力模块分为2个并行阶段,输入的特征层会分别在高度方向上和宽度方向上进行全局平均池化,然后将2个并行阶段进行合并,将宽和高转置到同一个维度,然后进行堆叠,利用卷积、标准化、激活函数进行特征提取,然后再次分为2个并行阶段,利用1×1卷积调整通道数后采用Sigmoid函数获取高、宽2个方向的注意力情况,注意力情况以权重的方式表达,最后输入特征层与注意力权重相乘得到输出特征层.

图 5

图 5   Coordinate attention注意力模块结构

Fig.5   Coordinate attention module structure


1.4. TP Block

为了提高网络对病害图像特征的快速有效提取能力,基于部分卷积(partial convolution,PConv)[30]提出卷积块结构TP Block. 该结构由一个常规卷积块和一个部分卷积块组成,特征层输入之后,先经过常规卷积、标准化、激活函数进行特征提取,再经过部分卷积进行快速特征提取,最后得到输出特征层.

部分卷积只在一部分输入通道上用常规卷积进行空间特征提取,并保持其余通道不变,其计算量较小,可以快速有效地提取特征. 相较于其他算法中的常规卷积,该卷积块结构的特征提取能力更强,且特征提取的效率更高. 常规卷积和部分卷积的结构如图6所示.

图 6

图 6   常规卷积与部分卷积结构

Fig.6   Conventional convolution and partial convolution structures


为了更清晰地说明部分卷积的优势,引入浮点运算次数(floating point operations,FLOPs)来评估两者的计算量. 假设输入特征图和输出特征图的高和宽分别为${H}$${W}$,通道数均为${C}$,在部分卷积中参与卷积操作的通道数为${{C}_{{\mathrm{p}}}}$,则常规卷积的卷积核大小为${K}$×${K}$×${C}$×${C}$,部分卷积的卷积核大小为${K}$×${K}$×${{C}_{{\mathrm{p}}}}$×${{C}_{{\mathrm{p}}}}$. 常规卷积的浮点运算次数为

$ {\text{FLOP}}{{\text{s}}_1} = {H} {W} {{C}^2} {{K}^2}, $
(1)

部分卷积的浮点运算次数为

$ {\text{FLOP}}{{\text{s}}_2} = {H} {W} {{C}_{{\mathrm{p}}}}^{2} {{K}^{2}}. $
(2)

假设部分卷积的部分比率为1/4(即${{C}_{{\mathrm{p}}}}$=${C/4}$),则部分卷积的浮点运算次数仅为常规卷积的1/16,充分说明部分卷积相对于常规卷积具有更小的计算量.

1.5. TDD-YOLO算法

以YOLOv7网络为基础,采用可以提取图像全局特征信息和局部特征信息的MobileViT网络为主干特征提取网络,在特征金字塔网络的上采样和下采样操作后加入CA注意力模块,并引入新的TP Block模块,提出TDD-YOLO隧道病害检测算法. 算法结构如图7所示.

图 7

图 7   TDD-YOLO网络结构

Fig.7   TDD-YOLO network structure


在将图像输入至主干网络之前,会采用Mosiac数据增强[31]、Mixup数据增强[32]对输入图像进行随机裁剪、拼接、缩放等操作,丰富数据集并降低模型的内存需求. 将输入图像进行尺寸归一化处理,统一调整为416×416大小. 将处理后的图像输入至MobileViT网络中进行特征提取,得到3个大小分别为52×52、26×26、13×13有效特征层S1、S2、S3.

特征层S3会通过SPPCSPC模块进行特征提取,进一步扩大网络的感受野,得到特征层P3. 然后对S1、S2、P3进行特征提取和卷积降维得到特征层L1、L2、L3. 之后经过一系列卷积、上下采样、标准化、激活函数进行特征提取和特征融合,得到最后3个特征层F1、F2、F3,最后经过RepConv模块和YOLO Head模块进行解码,得到输入图像的隧道病害检测结果.

为了提高对隧道病害图像中不同大小的病害目标的检测能力,不同大小的特征层会采用不同大小的先验框,特征层尺寸越大,先验框尺寸也会相应增大,能够检测的病害目标也就越大. 3种不同大小的特征层所采用的先验框示意图如图8所示.

图 8

图 8   不同大小先验框的示意图

Fig.8   Schematic diagram of different sizes of priori frames


2. 隧道表观病害数据集

2.1. 数据集组成

通过对多条公路、铁路隧道的边墙、底板、拱顶等位置进行病害检测,利用手机、相机设备收集了1400多张图像,包括3种类型的隧道表观病害(裂缝、渗漏水、衬砌脱落),病害图像分辨率为600~3000,部分图像如图9所示. 为了增强训练模型的泛化能力,使模型能够更好地适应隧道的复杂环境,采用多种方法对数据集进行增强,包括旋转、裁剪、噪声、模糊等,如图10所示.

图 9

图 9   隧道表观病害图像示例

Fig.9   Example of tunnel apparent disease image


图 10

图 10   病害图像增强方法

Fig.10   Disease image enhancement method


根据6∶2∶2的比例,将数据集划分为训练集、验证集和测试集,每类病害图像的数量如表1所示. 表中,Ntot为数据集图像总数,NtraNvalNtex分别为训练集、验证集、测试集图像数量.

表 1   隧道病害数据集参数

Tab.1  Parameters of tunnel defect data set

病害类别NtotNtraNvalNtex
裂缝1102742180180
渗漏水1004688158158
衬砌脱落698470114114

新窗口打开| 下载CSV


2.2. 数据集标注

采用LabelImg标注软件对隧道病害图像进行标注,并转换为VOC格式,以便于后续的网络训练和评估. 标注内容主要包括标注框坐标和分类信息. 标注框坐标表示了病害在图像中的位置和大小,分类信息指明了病害的类别. 如图11所示展示了部分标注图像. 图中,C表示裂缝,W表示渗漏水,L表示衬砌脱落.

图 11

图 11   病害标注图像

Fig.11   Disease labeling image


3. 隧道表观病害检测实验

3.1. 实验环境

实验均通过Python3.8计算机语言和Pytorch1.10.0模块进行. 所采用系统为Windows10,GPU设备为NVIDIA GeForce RTX 3060.

3.2. 评估指标

为了评估模型对隧道多病害的检测性能,选用平均精度(average precision, AP)、平均精度均值(mean average precision, mAP)、准确率与召回率的的调和平均值(F1 score)、每秒传输帧数(v)、模型大小(MS)作为评估指标. 计算公式如下:

$ P = \frac{{{\text{TP}}}}{{{\text{TP}}+{\text{FP}}}}, $
(3)

$ R = \frac{{{\text{TP}}}}{{{\text{TP}}+{\text{FN}}}}, $
(4)

$ {\text{f}}1 = \frac{{2 P R}}{{P+R}}, $
(5)

$ {\text{F}}1 = {{\sum {{\text{f}}1} }}/{n}, $
(6)

$ {\text{AP}} = \int_0^1 {P\left( R \right){\mathrm{d}}R} , $
(7)

$ {\text{mAP}} = {{\sum {{\text{AP}}} }}/{n}, $
(8)

$ {v} = {N}/{T}. $
(9)

式中:TP为正样本被检测正确的数量,FP为负样本被检测为正样本的数量,FN为正样本未被检测为正样本的数量,正样本是标注的病害目标,负样本是无关背景;P为准确率;R为召回率;n为病害类别的数量;N为检测图片的数量;T为检测所有图片所用的总时间.

3.3. 模型训练参数

选用YOLOv7、YOLOv5、EfficientDet、Faster RCNN、SSD这5种典型的目标检测网络作为对比网络,并对所有网络在同一数据集上进行训练. 为了评估本研究构建的网络和其他4种对比网络的训练效果,每个网络的训练次数均设置为200次,以确保网络在训练过程中能够达到收敛状态. 此外,会实时记录训练误差和验证误差,防止网络出现过拟合的情况.

为了加快网络的收敛速度并节约计算资源,基于迁移学习[33]思想加载在COCO数据集上训练得到的主干网络预训练权重. 网络训练的前50次采用冻结训练,此时冻结主干网络的权重,仅对网络的其他部分进行训练和更新;后150次训练采用解冻训练,此时主干网络解冻,网络的所有权重都会进行训练和更新. 为了提高网络性能,避免网络训练震荡问题,各网络的训练批量大小均尽可能调大. 网络训练学习率采用余弦退火学习率进行衰减,首先确定学习率的最大值和最小值,然后在训练过程中按照余弦函数进行调整,避免网络陷入局部最优解. 此外,网络在训练过程中会随机采用mosaic数据增强和mixup数据增强,提高网络对复杂多变环境的适应性. 当训练完成后,在网络不发生过拟合的情况下,保留验证误差最小的权重作为最优模型权重,用于后续的实验分析. 网络训练的超参数如表2所示. 表中,L为学习率,B为批量大小,M为动量,Ls为标签平滑. 阶段1为冻结训练阶段,阶段2为解冻训练阶段.

表 2   网络训练超参数

Tab.2  Network training hyperparameters

网络LBMLs
最大值最小值阶段1阶段2
SSD6×10−46×10−61680.930
Faster RCNN1×10−41×10−61680.900
EfficientDet3×10−43×10−632160.900
YOLOv51×10−31×10−51680.940.005
YOLOv71×10−31×10−51680.940.005
TDD-YOLO1×10−31×10−51680.940.005

新窗口打开| 下载CSV


3.4. 主干网络对比实验

为了探索不同类型的分类网络作为主干特征提取网络时的模型性能,选用目前较为流行的几个分类网络进行实验,网络类型包括卷积神经网络和Transformer系列网络. 实验所采用的超参数均一致,最后对训练模型进行测试,并选择每个模型最好的测试结果,实验结果如表3所示.

表 3   主干网络评价指标表

Tab.3  Backbone network evaluation indicators

主干网络裂缝渗漏水衬砌脱落F1/%mAP/%
f1/%AP/%f1/%AP/%f1/%AP/%
MobileNet74.4375.5474.8575.7465.6662.3371.6571.20
GhostNet73.6473.6074.1275.3165.3260.8771.0369.93
ResNet74.5677.5274.4875.7666.8465.3071.9672.86
Swin transformer74.4876.9775.0378.6166.9164.4972.1473.36
MobileViT75.8379.5876.3279.6268.3265.2473.4974.81

新窗口打开| 下载CSV


分别采用5种分类网络作为YOLOv7的主干特征提取网络,发现MobileViT作为主干网络的裂缝和渗漏水识别准确度最高,MobileViT和ResNet作为主干网络的衬砌脱落病害识别准确度最高,但是在整体性能方面,MobileViT网络优于ResNet网络. 与MobileNet、GhostNet、ResNet、Swin Transformer这4种网络相比,MobileViT在F1上分别提高了1.84%、2.46%、1.53%、1.35%,在mAP上分别提高了3.61%、4.88%、1.95%、1.45%. 经过全面分析,MobileViT网络的性能表现最优,因此,最终选用MobileViT作为YOLOv7的主干特征提取网络.

3.5. 消融实验

为了测试所采用的MobileViT主干网络、CA注意力机制、TP Block的有效性,在构建的隧道多病害数据集上进行消融实验. 消融实验结果如表4所示. 为了更清晰地比较不同改进策略的影响,该实验评价指标采用F1、mAP、v以及MS.

表 4   网络消融实验结果表

Tab.4  Network ablation experiment results

网络MobileViTCATP BlockF1/%mAP/%v/(帧·s−1)MS/106
YOLOv7×××71.2971.1350.81142.3
YOLOv7+MobileViT××73.4974.8151.39113.9
YOLOv7+CA××71.5571.7151.43142.6
YOLOv7+TP Block××72.4272.5351.26142.6
YOLOv7+MobileViT+CA×74.6175.7252.50114.2
YOLOv7+MobileViT+ TP Block×75.1675.9152.79114.2
YOLOv7+CA+ TP Block×74.0573.6052.44142.9
YOLOv7+MobileViT+CA+ TP Block77.4377.5253.86114.5

新窗口打开| 下载CSV


3.5.1. 单个改进的影响

为了验证3个改进策略的有效性,将其逐一应用在YOLOv7网络中进行测试. 对比可得,当采用MobileViT作为YOLOv7的主干网络时,模型的F1和mAP分别提高了2.20%和3.68%,说明MobileViT网络能够有效提取隧道病害目标的全局特征和局部特征. 当在特征金字塔网络的上采样和下采样后面加入CA注意力后,模型的F1和mAP分别提高了0.26%和0.58%,说明CA注意力模块能够有效增大隧道病害目标区域的权重,提高网络的识别精度. 在将特征金字塔网络中的卷积模块替换为本研究提出的TP Block时,模型的F1和mAP分别提高了1.13%和1.40%,说明TP Block改进策略可以在几乎不增大模型参数的情况下,有效提高模型对隧道3种表观病害的特征提取能力. 此外,单独采用3种改进策略时,每秒传输帧数均有所提高,说明3种改进策略均可以提高网络对病害图像的检测速度. 综上,单独采用3种改进策略均可以在一定程度上提高网络的特征提取能力、识别精度与速度.

3.5.2. 联合改进的影响

测试3种改进策略对模型性能的联合影响,测试结果如表4中最后3行所示. 当采用MobileViT网络和CA注意力模块时,模型的F1和mAP分别提高了3.32%和4.59%. 当采用MobileViT网络和TP Block模块时,模型的F1和mAP分别提高了3.87%和4.78%. 当采用CA注意力模块和TP Block模块时,模型的F1和mAP分别提高了2.76%和2.47%. 当同时采用3种改进策略时,模型的F1和mAP分别提高了6.14%和6.39%. 此外,在采用每一种联合改进后,网络的每秒传输帧数均有所提高,说明本研究的改进策略可以有效提高病害图像的检测速度. 由实验结果可看出,联合改进实验进一步证明了所采用的3种改进策略的有效性.

3.6. 模型对比实验

为了对所提出的TDD-YOLO网络的综合性能进行分析,对SSD、Faster RCNN、EfficientDet、YOLOv5、YOLOv7这5种网络进行训练,并在本研究构造的测试集上进行性能测试,对比实验结果如表5所示. 可以看出,TDD-YOLO模型对裂缝、渗漏水及衬砌脱落3种表观病害的识别精度最高,各项评价指标相比于其他5种模型均有不同程度的提高. 此外,TDD-YOLO模型的F1为77.43%,相较于SSD、Faster RCNN、EfficientDet、YOLOv5、YOLOv7这5种模型分别提高了15.58%、17.36%、12.19%、6.32%、6.14%;mAP为77.52%,相较于SSD、Faster RCNN、EfficientDet、YOLOv5、YOLOv7这5种模型分别提高了15.20%、14.24%、9.44%、7.44%、6.39%. 可见,所采用的3种改进策略可以有效提高网络对病害目标的特征提取能力,增强网络的病害检测性能.

表 5   6种模型的实验精度结果对比表

Tab.5  Accuracy experimental result comparison of six models

网络裂缝渗漏水衬砌脱落F1/%mAP/%
f1/%AP/%f1/%AP/%f1/%AP/%
SSD69.4369.9771.8074.0044.3142.9861.8562.32
Faster RCNN64.9271.5470.5772.2144.7246.0860.0763.28
EfficientDet64.4270.7874.9376.0256.3757.4365.2468.08
YOLOv574.7273.8373.4972.4065.1264.0271.1170.08
YOLOv774.9776.5373.5574.7165.3562.1571.2971.13
TDD-YOLO80.4782.2879.5980.5871.7469.7177.4377.52

新窗口打开| 下载CSV


图1213所示,列举了6种模型对简单明亮环境下、复杂昏暗环境下,部分隧道衬砌表观病害图像的检测结果,检测结果中的数字表示识别置信度. 为了清晰区分不同病害,将裂缝、渗漏水、衬砌脱落3种病害的检测框分别设置为实线、虚线、点线.

图 12

图 12   简单明亮环境下的隧道病害图像检测结果

Fig.12   Tunnel defect image detection results in simple and bright environment


图 13

图 13   复杂昏暗环境下的隧道病害图像检测结果

Fig.13   Tunnel defect image detection results in complex and somber environment


分析图12可知,在简单明亮环境条件下,6种模型对单个病害图像的定位较准确,只有极少数会出现错检、漏检情况,而对于混合病害图像的检测,5种对比模型均出现了漏检情况. 在单病害的混合病害图像检测结果中,TDD-YOLO模型的检测置信度最高,且对病害目标的区域定位准确度最高,说明该模型在简单环境下能够区分不同的隧道表观病害,实现病害图像的高精度检测.

分析图13可知,在复杂昏暗环境条件下,由于昏暗灯光和其他杂物的干扰,5种对比模型的检测精度严重下降,在单病害和混合病害图像中均出现了不同程度的错检、漏检,特别是在图13的第7行,对比模型已经不能精确识别裂缝和渗漏水. 在TDD-YOLO模型的检测结果中,该模型的检测精度相比于简单环境虽然出现了一定下降,但依旧可以实现病害区域的精确定位,并且在混合病害图像中可以有效区分不同类型的表观病害,说明所提出的TDD-YOLO模型鲁棒性较强,可以抵抗隧道中复杂环境的干扰,实现隧道多种表观病害的精准定位.

综上所述,在简单明亮环境和复杂昏暗环境下,本研究所提出的TDD-YOLO模型均可以区分不同类型的隧道表观病害,实现高精度检测,具有较强的鲁棒性,适用于复杂环境条件下的隧道多种衬砌表观病害检测任务.

4. 结 论

(1) 主干网络实验证明,MobileViT分类网络融合了卷积网络和transformer网络的优势,所有评价指标均优于MobileNet、GhostNet、ResNet、Swin transformer这4种网络,可用于作为主干特征提取网络.

(2) 消融实验证明,所采用的MobileViT网络、CA注意力模块、TP Block模块均有效提高了模型的F1和mAP,可以在一定程度上提高模型的病害检测性能.

(3) TDD-YOLO模型的F1分数和mAP分别为77.43%、77.52%,所有评价指标相较于SSD、Faster RCNN、EfficientDet、YOLOv5、YOLOv7这5种模型均有不同程度的提升.

(4) 对比其他检测模型,TDD-YOLO模型能够抵抗隧道复杂环境干扰,在光线较暗且有干扰的条件下依旧可以实现隧道多种表观病害的高精度检测,具有较强的鲁棒性,适用于复杂环境隧道多病害检测任务.

(5) 所采用的数据集图像数量较少,后续可进一步进行图像扩充. 后续会开发隧道病害检测平台,可与TDD-YOLO结合使用.

参考文献

《中国公路学报》编辑部

中国交通隧道工程学术研究综述: 2022

[J]. 中国公路学报, 2022, 35 (4): 1- 40

DOI:10.3969/j.issn.1001-7372.2022.04.001      [本文引用: 1]

“China Journal of Highway and Transport” editorial department

Review on china's traffic tunnel engineering research: 2022

[J]. China Journal of Highway and Transport, 2022, 35 (4): 1- 40

DOI:10.3969/j.issn.1001-7372.2022.04.001      [本文引用: 1]

董飞, 房倩, 张顶立, 等

北京地铁运营隧道病害状态分析

[J]. 土木工程学报, 2017, 50 (6): 104- 113

[本文引用: 1]

DONG Fei, FANG Qian, ZHANG Dingli, et al

Analysis on defects of operational metro tunnels in Beijing

[J]. China Civil Engineering Journal, 2017, 50 (6): 104- 113

[本文引用: 1]

HUANG H, LI Q, ZHANG D

Deep learning based image recognition for crack and leakage defects of metro shield tunnel

[J]. Tunnelling and Underground Space Technology, 2018, 77: 166- 176

DOI:10.1016/j.tust.2018.04.002      [本文引用: 1]

许力之, 王耀东, 朱力强, 等

隧道表面图像多目标智能识别算法研究

[J]. 铁道学报, 2022, 44 (9): 154- 162

DOI:10.3969/j.issn.1001-8360.2022.09.020      [本文引用: 1]

XU Lizhi, WANG Yaodong, ZHU Liqiang, et al

Research on algorithm of intelligent recognition of mutiple objects of tunnel surface image

[J]. Journal of the China Railway Society, 2022, 44 (9): 154- 162

DOI:10.3969/j.issn.1001-8360.2022.09.020      [本文引用: 1]

周鸣亮, 程文, 张东明, 等

运营期盾构隧道结构病害的自动化检测与三维可视化

[J]. 应用基础与工程科学学报, 2021, 29 (5): 1265- 1279

[本文引用: 1]

ZHOU Mingliang, CHENG Wen, ZHANG Dongming, et al

Automatic detection and 3D visualization of structural diseases of shield tunnel during operation

[J]. Journal of Basic Science and Engineering, 2021, 29 (5): 1265- 1279

[本文引用: 1]

MA D, LIU J, FANG H, et al

A multi-defect detection system for sewer pipelines based on StyleGAN-SDM and fusion CNN

[J]. Construction and Building Materials, 2021, 312: 125385

DOI:10.1016/j.conbuildmat.2021.125385      [本文引用: 1]

ROSTEN E, PORTER R, DRUMMOND T

Faster and better: a machine learning approach to corner detection

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2008, 32 (1): 105- 119

[本文引用: 1]

DONG Y, WANG J, WANG Z, et al

A deep-learning-based multiple defect detection method for tunnel lining damages

[J]. IEEE Access, 2019, 7: 182643- 182657

DOI:10.1109/ACCESS.2019.2931074     

雷明锋, 张运波, 王卫东, 等

岩石岩性Mask R-CNN智能识别方法与应用研究

[J]. 铁道科学与工程学报, 2022, 19 (11): 3372- 3382

[本文引用: 1]

LEI Mingfeng, ZHANG Yunbo, WANG Weidong, et al

Investigation and application on lithology intelligent recognition method based on Mask R-CNN

[J]. Journal of Railway Science and Engineering, 2022, 19 (11): 3372- 3382

[本文引用: 1]

XUE Y, CAI X, SHADABFAR M, et al

Deep learning-based automatic recognition of water leakage area in shield tunnel lining

[J]. Tunnelling and Underground Space Technology, 2020, 104: 103524

DOI:10.1016/j.tust.2020.103524      [本文引用: 1]

REN Y, HUANG J, HONG Z, et al

Image-based concrete crack detection in tunnels using deep fully convolutional networks

[J]. Construction and Building Materials, 2020, 234: 117367

DOI:10.1016/j.conbuildmat.2019.117367      [本文引用: 1]

SAVINO P, TONDOLO F

Automated classification of civil structure defects based on convolutional neural network

[J]. Frontiers of Structural and Civil Engineering, 2021, 15 (2): 305- 317

DOI:10.1007/s11709-021-0725-9      [本文引用: 1]

DUNG C V

Autonomous concrete crack detection using deep fully convolutional neural network

[J]. Automation in Construction, 2019, 99: 52- 58

DOI:10.1016/j.autcon.2018.11.028      [本文引用: 1]

MANDAL V, UONG L, ADU-GYAMFI Y. Automated road crack detection using deep convolutional neural networks [C]// IEEE International Conference on Big Data . IEEE, 2018: 5212-5215.

[本文引用: 1]

CHENG J C P, WANG M

Automated detection of sewer pipe defects in closed-circuit television images using deep learning techniques

[J]. Automation in Construction, 2018, 95: 155- 171

DOI:10.1016/j.autcon.2018.08.006      [本文引用: 1]

周中, 张俊杰, 龚琛杰, 等

基于深度语义分割的隧道渗漏水智能识别

[J]. 岩石力学与工程学报, 2022, 41 (10): 2082- 2093

[本文引用: 1]

ZHOU Zhong, ZHANG Junjie, GONG Chenjie, et al

Automatic identification of tunnel leakage based on deep semantic segmentation

[J]. Chinese Journal of Rock Mechanics and Engineering, 2022, 41 (10): 2082- 2093

[本文引用: 1]

彭磊, 周春, 胡锋, 等

基于深度学习的隧道掌子面节理智能检测与分割

[J]. 人民长江, 2023, 54 (10): 243- 250

[本文引用: 1]

PENG Lei, ZHOU Chun, HU Feng, et al

Research on intelligent detection and segmentation of rock joints tunnel face based on deep learning

[J]. Yangtze River, 2023, 54 (10): 243- 250

[本文引用: 1]

刘德军, 仲飞, 黄宏伟, 等

运营隧道衬砌病害诊治的现状与发展

[J]. 中国公路学报, 2021, 34 (11): 178- 199

DOI:10.3969/j.issn.1001-7372.2021.11.015      [本文引用: 1]

LIU Dejun, ZHONG Fei, HUANG Hongwei, et al

Present Status and development trend of diagnosis and treatment of tunnel lining diseases

[J]. China Journal of Highway and Transport, 2021, 34 (11): 178- 199

DOI:10.3969/j.issn.1001-7372.2021.11.015      [本文引用: 1]

路耀邦, 刘永胜, 樊晓东

地铁隧道结构表观病害快速检测方法与应用

[J]. 隧道建设: 中英文, 2021, 41 (Suppl.2): 655- 663

[本文引用: 1]

LU Yaobang, LIU Yongsheng, FAN Xiaodong

Rapid detection method for surface defect for metro tunnel structure and its Application

[J]. Tunnel Construction, 2021, 41 (Suppl.2): 655- 663

[本文引用: 1]

薛亚东, 李宜城

基于深度学习的盾构隧道衬砌病害识别方法

[J]. 湖南大学学报: 自然科学版, 2018, 45 (3): 100- 109

[本文引用: 1]

XUE Yadong, LI Yicheng

A method of disease recognition for shield tunnel lining based on deep learning

[J]. Journal of Hunan University: Natural Sciences, 2018, 45 (3): 100- 109

[本文引用: 1]

LIU J, ZHAO Z, LV C, et al

An image enhancement algorithm to improve road tunnel crack transfer detection

[J]. Construction and Building Materials, 2022, 348: 128583

DOI:10.1016/j.conbuildmat.2022.128583      [本文引用: 1]

ZHOU Z, ZHANG J, GONG C

Automatic detection method of tunnel lining multi-defects via an enhanced You Only Look Once network

[J]. Computer-Aided Civil and Infrastructure Engineering, 2022, 37 (6): 762- 780

DOI:10.1111/mice.12836      [本文引用: 1]

LI Y, BAO T, LI T, et al

A robust real-time method for identifying hydraulic tunnel structural defects using deep learning and computer vision

[J]. Computer-Aided Civil and Infrastructure Engineering, 2023, 38 (10): 1381- 1399

[本文引用: 1]

王宝坤, 王如路, 陈锦剑, 等. 基于深度学习的盾构隧道表观病害自动检测方法[EB/OL]. (2023-06-13) [2024-04-21]. https://doi.org/10.16183/j.cnki.jsjtu.2023.089.

[本文引用: 1]

XU Y, LI D, XIE Q, et al

Automatic defect detection and segmentation of tunnel surface using modified Mask R-CNN

[J]. Measurement, 2021, 178: 109316

DOI:10.1016/j.measurement.2021.109316      [本文引用: 1]

WANG C Y, BOCHKOVSKIY A, LIAO H Y M. YOLOv7: trainable bag-of-freebies sets new state-of-the-art for real-time object detectors [C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition . Piscataway: IEEE, 2023: 7464−7475.

[本文引用: 1]

MAKANTASIS K, PROTOPAPADAKIS E, DOULAMIS A, et al. Deep convolutional neural networks for efficient vision based tunnel inspection [C]// 2015 IEEE International Conference on Intelligent Computer Communication and Processing . [s. l.]: IEEE, 2015: 335−342.

[本文引用: 1]

MEHTA S, RASTEGARI M. Mobilevit: light-weight, general-purpose, and mobile-friendly vision transformer [EB/OL]. [2024-04-21]. https://arxiv.longhoe.net/abs/2110.02178.

[本文引用: 1]

HOU Q, ZHOU D, FENG J. Coordinate attention for efficient mobile network design [C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition . Piscataway: IEEE: 2021: 13713−13722.

[本文引用: 1]

CHEN J, KAO S, HE H, et al. Run, don't walk: chasing higher FLOPS for faster neural networks [C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition . Piscataway: IEEE, 2023: 12021−12031.

[本文引用: 1]

MENG Z, XU S, WANG L, et al

Defect object detection algorithm for electroluminescence image defects of photovoltaic modules based on deep learning

[J]. Energy Science and Engineering, 2022, 10 (3): 800- 813

DOI:10.1002/ese3.1056      [本文引用: 1]

WANG Z, CAI Z, WU Y

An improved YOLOX approach for low-light and small object detection: PPE on tunnel construction sites

[J]. Journal of Computational Design and Engineering, 2023, 10 (3): 1158- 1175

DOI:10.1093/jcde/qwad042      [本文引用: 1]

李明超, 符家科, 张野, 等

耦合岩石图像与锤击音频的岩性分类智能识别分析方法

[J]. 岩石力学与工程学报, 2020, 39 (5): 996- 1004

[本文引用: 1]

LI Mingchao, FU Jiake, ZHANG Ye, et al

Intelligent recognition and analysis method of rock lithology classification based on coupled rock images and hammering audios

[J]. Chinese Journal of Rock Mechanics and Engineering, 2020, 39 (5): 996- 1004

[本文引用: 1]

/