%A 范康,钟铭恩,谭佳威,詹泽辉,冯妍 %T 联合语义分割和深度估计的交通场景感知算法 %0 Journal Article %D 2024 %J 浙江大学学报(工学版) %R 10.3785/j.issn.1008-973X.2024.04.004 %P 684-695 %V 58 %N 4 %U {https://www.zjujournals.com/eng/CN/abstract/article_46258.shtml} %8 2024-04-01 %X

受不同像素级视觉任务间的特征信息能够相互指导和优化的思路启发,基于多任务学习理论提出联合语义分割和深度估计的交通场景感知算法. 提出双向跨任务注意力机制,实现任务间的全局相关性显式建模,引导网络充分挖掘和利用任务间互补模式信息. 构建多任务Transformer,增强特定任务特征的空间全局表示,实现跨任务全局上下文关系的隐式建模,促进任务间互补模式信息的融合. 设计编-解码融合上采样模块来有效融合编码器蕴含的空间细节信息,生成精细的高分辨率特定任务特征. 在Cityscapes数据集上的实验结果表明,所提算法的语义分割平均交并比达到79.2%,深度估计均方根误差为4.485,针对5类典型交通参与者的距离估计平均相对误差为6.1%,能够以比现有主流算法更低的计算复杂度获得更优的综合性能.