基于Transformer的高效自适应语义分割网络

基于Transformer的高效自适应语义分割网络

张海波,蔡磊,任俊平,王汝言,刘富

Efficient and adaptive semantic segmentation network based on Transformer

Hai-bo ZHANG,Lei CAI,Jun-ping REN,Ru-yan WANG,Fu LIU

表 4 不同分割模型在ADE20K数据集、Cityscapes数据集上推理速度的评估结果

Tab.4 Evaluation results of inference speed for different segmentation models on ADE20K dataset and Cityscapes dataset

算法	基础网络结构	FPS/（帧 $\cdot {{\rm{s}}^{ - 1} }$）
算法	基础网络结构	ADE20K	Citysapes
FCN^[1]	ResNet-101^[19]	20.7	1.7
PSPNet^[3]	ResNet-101	20.3	1.8
DeepLabV3+^[7]	ResNet-101	18.7	1.6
DeepLabV3+	ResNeSt-101^[21]	16.1	2.5
UperNet^[22]	Swin-S^[24]	20.1	—
UperNet	Convnext^[25]	17.1	—
SETR^[11]	ViT^[12]	8.3	—
DPT^[27]	ViT	20.5	—
Segmenter Mask^[28]	ViT	21.3	—
Segformer^[20]	MiT^[20]	18.6	2.5
EA-Former	MiT	21.9	2.8
Segformer*	MiT	15.7	—
EA-Former*	MiT	18.1	—
UperNet	ResNet-101	—	2.3
CCnet^[9]	ResNet-101	—	1.7
DeepLabV3^[6]	ResNeSt-101	—	2.4
SETR	ViT	—	0.4
Segformer^#	MiT	—	2.3
EA-Former^#	MiT	—	2.5