基于跨模态级联扩散模型的图像描述方法 |
|||||||||||||||||||||||||||||||||||||||||||||
| 陈巧红,郭孟浩,方贤,孙麒 | |||||||||||||||||||||||||||||||||||||||||||||
|
Image captioning based on cross-modal cascaded diffusion model |
|||||||||||||||||||||||||||||||||||||||||||||
| Qiaohong CHEN,Menghao GUO,Xian FANG,Qi SUN | |||||||||||||||||||||||||||||||||||||||||||||
| 表 6 Flickr30k 数据集中不同图像描述模型的性能对比 | |||||||||||||||||||||||||||||||||||||||||||||
| Tab.6 Performance comparison of different image description models in Flickr30k dataset | |||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||