基于关系推理与门控机制的视觉问答方法
|
王鑫,陈巧红,孙麒,贾宇波
|
Visual question answering method based on relational reasoning and gating mechanism
|
Xin WANG,Qiao-hong CHEN,Qi SUN,Yu-bo JIA
|
|
表 3 基于关系推理与门控机制的视觉问答模型在VQA 2.0数据集上的实验结果 |
Tab.3 Experimental results of visual question answering model based on relational reasoning and gating mechanism on VQA 2.0 data set |
|
% | 模型 | 测试-开发集 | | 测试-标准集 | 总体 | 其他 | 数字 | 是/否 | 总体 | 其他 | 数字 | 是/否 | LSTM+CNN[24] | − | − | − | − | | 54.22 | 41.83 | 35.18 | 73.46 | MCB[24] | − | − | − | − | 62.27 | 53.36 | 38.28 | 78.82 | Adelaide[12] | 65.32 | 56.05 | 44.21 | 81.82 | 65.67 | 56.26 | 43.90 | 82.20 | DCN[23] | 66.60 | 56.72 | 46.60 | 83.50 | 67.00 | 56.90 | 46.93 | 83.89 | MuRel[25] DFAF[26] | 68.03 | 57.85 | 49.84 | 84.77 | 68.41 | − | − | − | 70.22 | 60.49 | 53.32 | 86.09 | 70.34 | − | − | − | TRRNet[27] | 70.80 | 61.02 | 51.89 | 87.27 | 71.20 | − | − | − | 提出模型 | 68.16 | 58.46 | 47.78 | 84.00 | 68.51 | 58.11 | 47.36 | 84.36 |
|
|
|