基于跨模态级联扩散模型的图像描述方法 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 陈巧红,郭孟浩,方贤,孙麒 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Image captioning based on cross-modal cascaded diffusion model |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Qiaohong CHEN,Menghao GUO,Xian FANG,Qi SUN | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 表 2 跨模态语义对齐模块在2个数据集上的消融实验 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Tab.2 Ablation experiment of cross-modal semantic alignment module in two datasets | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||