基于实例分割的复杂环境车道线检测方法
Lane detection method in complex environments based on instance segmentation
通讯作者:
收稿日期: 2021-05-1
基金资助: |
|
Received: 2021-05-1
Fund supported: | 国家自然科学基金资助项目(61803208);江苏省自然科学基金资助项目(BK20180726,BK20191371). |
作者简介 About authors
杨淑琴(1997—),女,硕士生,从事图像处理算法研究.orcid.org/0000-0002-5762-6026.E-mail:
针对基于语义分割的车道线检测方法存在的特征表述模糊、语义信息利用率较低的问题,采用实例分割算法,提出基于改进混合任务级联(HTC)网络的车道线检测方法. 基于HTC网络模型,在主干网络中引入可变形卷积,提升主干网络对复杂环境中车道线特征的提取能力. 改进特征金字塔网络结构,在特征金字塔网络的基础上添加自底向上的低层特征传递路径,引入空洞卷积,在不损失车道线特征信息的情况下增加特征图感受野,利用低层特征中所包含的车道线的精确定位信息,提高车道线的检测精度. 实验结果表明,改进HTC网络模型可以实现车道线特征的鲁棒提取,在复杂道路环境中可以获得较好的检测性能,有效提高了车道线检测精度.
关键词:
An instance segmentation algorithm was adopted and a lane detection method based on improved hybrid task cascade (HTC) network was proposed aiming at the problems of fuzzy feature representation and low semantic information utilization in the lane detection method based on semantic segmentation. Deformable convolution was introduced into the backbone network based on HTC network model in order to improve the ability of the backbone network to extract lane features in complex environments. The structure of feature pyramid network was improved by adding a bottom-up low-level feature transmission path based on feature pyramid network, and dilated convolution was introduced to increase the receptive field of feature map without loss of lane feature information. The accurate location information of lane lines contained in the low-level features was used to improve the accuracy of lane detection. The experimental results show that the improved HTC network model can realize the robust extraction of lane features, obtain better detection performance in complex road environments, and effectively improve the accuracy of lane detection.
Keywords:
本文引用格式
杨淑琴, 马玉浩, 方铭宇, 钱伟行, 蔡洁萱, 刘童.
YANG Shu-qin, MA Yu-hao, FANG Ming-yu, QIAN Wei-xing, CAI Jie-xuan, LIU Tong.
近年来,随着深度学习理论的深入研究及计算机硬件性能的不断提高,深度学习在机器视觉和图像处理领域的应用中取得了显著的进展,基于深度学习的车道线检测方法是目前车道线检测领域的研究热点. 庞彦伟等[8]以主流的语义分割网络框架为基础网络,在编码器阶段逐层融合原始特征图和边缘特征提取子网络提取的边缘特征图,建立从编码器到解码器对称位置的跨连接,在解码器逐层上采样的过程中融合编码器对应尺寸的特征图,以增强车道线特征. Pan等[9]提出Spatial CNN(SCNN)网络,在特征图中采用逐片卷积的方式代替传统逐层卷积方式进行计算,使得特征图中像素的行和列之间能够传递信息,提取目标空间关系特征,提高车道线的检测性能. Neven等[10]提出端到端的车道线检测算法,包括LaneNet和 H-Net 2个网络模型. LaneNet网络通过语义分割分支输出车道像素,利用车道嵌入分支将分割的车道像素分离到不同的车道实例中. H-Net网络用于根据道路平面变化估计透视变换矩阵的参数,以适应道路平面变化的情况. 基于深度学习的车道线检测方法与基于传统图像处理的车道线检测方法相比,在检测精度和环境适应能力方面有较大的提升,但是存在车道线特征表述模糊、语义信息利用率较低的问题,有待进一步研究解决.
基于上述研究背景,本文将车道线检测视为连续细长区域的实例分割问题,提出基于改进HTC网络的车道线检测方法. 基于HTC网络模型,在主干网络中引入可变形卷积,改进特征金字塔网络结构,在特征金字塔网络的基础上添加自底向上的低层特征传递路径,在增强路径中引入空洞卷积,以提高车道线的检测精度. 构建包含复杂道路环境的车道线标注数据集,对改进HTC网络进行训练,使得网络模型充分学习车道线的特征,提高网络模型的车道线特征表征能力及环境适应能力.
1. 改进Hybrid Task Cascade网络结构
图 1
用于车道线检测的改进HTC网络结构如图2所示. 采用残差网络(ResNet)[13]作为主干网络,ResNet包含5个卷积块,分别表示为C1、C2、C3、C4、C5. 在卷积块中使用可变形卷积替换常规卷积,提取输出5个不同尺度的车道线特征图,用于构建特征金字塔,输出的车道线特征图如图3所示. 改进特征金字塔网络结构,在特征金字塔网络的基础上添加自底向上的低层特征传递路径. 该路径包含的网络层数不到10层,缩短了底层与最顶层特征之间的信息传递路径,使得特征金字塔网络输出的特征图包含更多的车道线细节信息,在增强路径中引入空洞卷积[14],在不损失车道线特征信息的情况下,增大特征图感受野. HTC网络包含4个级联的阶段:第1个为区域候选网络(region proposal network,RPN),在RPN网络中,设定锚框的宽高比分别为0.5、1和2;另外3个阶段为交并比(intersection over union,IOU)阈值逐渐增大的检测模块,阈值分别设置为0.5、0.6和0.7. 不同阶段掩码分支之间存在掩码信息传递路径,这样各阶段的掩码分支既能够得到主干网络提取的特征,也能够得到上一阶段掩码分支输出的特征. HTC网络逐阶段筛选精度更高的目标边界框及目标掩码,减少了复杂背景信息对车道线检测的干扰,提高了车道线的检测精度.
图 2
图 3
1.1. 可变形卷积
二维卷积过程一般包含在输入特征图x上使用规则网格
式中:
由于
式中:p表示偏移后的任意采样位置,
函数
可变形卷积以提取的特征图作为输入,通过添加卷积层学习采样位置偏移量,输出的偏移量与输入特征图具有相同的空间分辨率. 在网络模型训练过程中,用于生成输出特征图的卷积核和用于生成偏移量的卷积核同步学习,其中偏移量的学习是基于式(3)的双线性插值算法,通过梯度反向传播实现.
1.2. 路径增强特征金字塔网络
特征金字塔网络生成的不同尺度的特征表示为[P2,P3,P4,P5],增强路径从最低层次P2传递至P5,采用的卷积块由3×3卷积核、步长为2的卷积层和3×3卷积核、步长为1的空洞卷积层组成,生成的特征映射表示为[N2,N3,N4,N5],作为后续网络的输入. 其中,N2是由P2未经任何处理得到的,
车道线具备细长的形态结构,对于车道线的检测,需要同时获取全局的空间结构关系和细节信息的定位精度. 空洞卷积在计算条件相同的情况下,可以为网络提供更大的感受野,提高网络的空间信息提取能力. 采用空洞卷积改进增强路径的特征提取方式,提高了复杂环境下的车道线检测精度.
1.3. 损失函数
为了衡量网络模型的车道线检测性能,采用多任务损失函数对网络进行端到端的训练,包括基于交叉熵损失函数计算目标分类误差、基于平滑L1损失函数计算边界框偏移量回归误差以及基于二分类交叉熵损失函数BCE计算掩码预测误差. 损失函数的计算公式为
式中:T = 3,表示检测子网络包含3个级联的阶段,在每一阶段需要设置不同的IOU阈值区分正样本和负样本;t表示阶段的索引,在每个阶段t,边界框分支预测所有感兴趣区域(region of interest,ROI)的类别得分
2. 实验与结果分析
2.1. 车道线数据集构建
为了评估改进HTC网络模型的车道线检测性能,基于车道线检测竞赛公布的数据集图片以及行车记录仪拍摄的道路图片构建车道线数据集,用于网络的训练和测试. 构建的数据集包含了多种光照条件(如强光照、弱光照、夜晚等)、多种天气状况(如晴天、雨天、雾天等)及多种道路场景(如城市、农村、高速公路、山路等),包含了车道线磨损和遮挡的实际道路状况. 采用Labelme图像标注工具对每张图片进行标注,标注的车道线类别包括实线、虚线、双黄线及虚实线4类,对包含磨损、遮挡情况的车道线基于对客观事实的认知,判断标注为完整车道线.
图 4
2.2. 评价指标
采用平均精度(average precision,AP)指标,对网络性能进行评估. AP表示以召回率(recall,R)和准确率(precision,P)为横、纵坐标的P-R曲线所围成的面积,召回率和准确率的计算公式如下:
式中:TP为正确检测为正样本的个数,FP为误检为正样本的个数,FN为漏检为正样本的个数. 实验评价指标的具体介绍如下:mAP表示IOU阈值为0.5~0.95时以0.05为间隔的掩码AP值的平均值,AP0.5表示IOU阈值为0.5时的掩码AP值,AP0.75表示IOU阈值为0.75时的掩码AP值.
2.3. 车道线检测实验与分析
实验环境为Ubuntu 18.04操作系统,CPU为Intel Xeon E5-2678 v3,GPU为NVIDIA GeForce RTX 2080 Ti. 深度学习框架采用PyTorch,集成开发环境使用PyCharm.
为了验证所研究的改进HTC网络的车道线检测性能,确定检测性能最佳的网络模型结构,开展基于不同特征提取方式的主干网络的对比实验. 在ResNet主干网络不同卷积块中使用可变形卷积替换常规卷积,基于构建的车道线数据集对网络模型进行训练和测试,车道线检测精度的对比结果如表1所示. 可知,当C3~C5卷积块中均使用可变形卷积替换常规卷积时,主干网络可以自适应地提取更精确的车道线特征信息,车道线的检测精度最高.
表 1 基于主干网络不同特征提取方式的车道线检测结果
Tab.1
主干网络 ResNet | mAP | AP0.5 | AP0.75 | ||
C3 | C4 | C5 | |||
Conv | Conv | DCN | 57.5 | 94.2 | 62.2 |
Conv | DCN | DCN | 58.2 | 94.3 | 62.8 |
DCN | DCN | DCN | 58.8 | 94.5 | 64.4 |
在改进HTC网络的训练过程中,批处理大小设置为2. 采用随机梯度下降(stochastic gradient descent,SGD)优化器,动量因子设置为0.9,权重衰减因子设置为0.000 1. 网络训练的迭代次数为48 000次,初始学习率设置为0.002 5,在起始的500次迭代中学习率以线性增加的方式逐渐增加至0.002 5,在32 000次迭代和44 000次迭代之后分别降低至0.000 25和0.000 025,训练过程中学习率Lr的变化曲线如图5所示. 图中,Ni为迭代次数. 加载COCO数据集的预训练权重文件作为网络模型训练的初始参数值,训练过程中的损失值随迭代次数的变化曲线如图6所示. 可以看出,随着迭代次数的增加,损失值逐渐降低,最终趋于平缓,稳定在0.1左右.
图 5
图 6
表 2 基于不同增强路径特征提取方式的车道线检测结果
Tab.2
增强路径特征 提取方式 | M/106 | mAP | AP0.5 | AP0.75 |
常规卷积[18] | 100.76 | 58.6 | 94.3 | 63.5 |
空洞卷积 | 100.76 | 58.8 | 94.5 | 64.4 |
基于不同深度学习模型的车道线检测结果对比如表3所示. 可以看出,Mask R-CNN网络[20]由于单一的IOU阈值检测模型结构,网络模型的参数量最少,但检测精度最低. 本文所研究的改进HTC网络模型的检测精度达到最高,较Mask R-CNN、Cascade Mask R-CNN、HTC网络分别提高了3.7%、2.5% 和 2.1%. 改进HTC网络模型相比于对比方法可以获得更高的准确率和召回率,这得益于改进HTC网络的多阶段级联的网络结构及更强的车道线特征表征能力;相比于Cascade Mask R-CNN和HTC网络,改进HTC网络模型的参数量仅增加了5 MB. 所研究的改进HTC网络可以在较少增加模型参数的基础上,有效提高车道线的检测精度,实现车道线的检测准确性与计算资源消耗的平衡.
表 3 基于不同深度学习模型的车道线检测结果
Tab.3
图 7
图 8
3. 结 语
针对复杂环境下的车道线检测问题,本文提出基于改进HTC实例分割网络的车道线检测方法. 该方法将车道线检测视为连续细长区域的实例分割问题,构建包含复杂道路环境的车道线标注数据集. 通过数据增强的方法扩充数据集,以满足网络训练对数据量的需求,提高网络模型的泛化能力和环境适应能力. 基于HTC网络模型,在主干网络中引入可变形卷积替代常规卷积,提升主干网络对车道线特征的提取能力. 改进特征金字塔网络结构,在特征金字塔网络的基础上添加自底向上的特征传递路径,在增强路径中引入空洞卷积,利用低层特征中存储的边缘形状特征以及精确定位信息,提升特征金字塔网络架构,以弥补随着网络深度增加而不断丢失的车道线细节信息. 实验结果表明,本文方法在车道线检测精度方面优于对比算法,可以达到94.5%的精度,在不同的复杂道路环境中都具有较好的检测性能,为无人驾驶环境感知、车道线偏离预警技术的研究和开发提供思路,促进智能交通领域的研究与发展.
参考文献
Hybrid deep learning-gaussian process network for pedestrian lane detection in unstructured scenes
[J].DOI:10.1109/TNNLS.2020.2966246 [本文引用: 1]
基于视觉的车道线检测方法研究进展
[J].
Research and development of the vision-based lane detection methods
[J].
Gradient-enhancing conversion for illumination-robust lane detection
[J].DOI:10.1109/TITS.2013.2252427 [本文引用: 1]
基于IPM和边缘图像过滤的多干扰车道线检测
[J].DOI:10.3969/j.issn.1001-7372.2020.05.014
Multi-interference lane recognition based on IPM and edge image filtering
[J].DOI:10.3969/j.issn.1001-7372.2020.05.014
Lane line detection and recognition based on dynamic ROI and modified firefly algorithm
[J].DOI:10.1007/s41315-021-00175-2 [本文引用: 1]
基于边缘特征融合和跨连接的车道线语义分割神经网络
[J].
Lane semantic segmentation neural network based on edge feature merging and skip connections
[J].
Scale-aware limited deformable convolutional neural networks for traffic sign detection and classification
[J].DOI:10.1049/iet-its.2020.0217 [本文引用: 1]
A dense feature pyramid network-based deep learning model for road marking instance segmentation using MLS point clouds
[J].DOI:10.1109/TGRS.2020.2996617 [本文引用: 1]
/
〈 |
|
〉 |
