基于跨模态级联扩散模型的图像描述方法 |
陈巧红,郭孟浩,方贤,孙麒 |
Image captioning based on cross-modal cascaded diffusion model |
Qiaohong CHEN,Menghao GUO,Xian FANG,Qi SUN |
图 6 不同图像描述模型的参数量和推理速度 |
Fig.6 Parameter quantity and inference speed for different image description models |
![]() |