基于跨模态级联扩散模型的图像描述方法 |
| 陈巧红,郭孟浩,方贤,孙麒 |
|
Image captioning based on cross-modal cascaded diffusion model |
| Qiaohong CHEN,Menghao GUO,Xian FANG,Qi SUN |
| 图 7 不同非自回归方法在 Microsoft COCO 数据集上生成的图像描述 |
| Fig.7 Image descriptions generated by different non-autoregressive methods in Microsoft COCO dataset |
|