基于跨模态级联扩散模型的图像描述方法
陈巧红,郭孟浩,方贤,孙麒
Image captioning based on cross-modal cascaded diffusion model
Qiaohong CHEN,Menghao GUO,Xian FANG,Qi SUN
图 1
跨模态级联扩散模型的总体结构
Fig.1
Overall structure of cross-modal cascaded diffusion model