基于跨模态级联扩散模型的图像描述方法

基于跨模态级联扩散模型的图像描述方法

陈巧红,郭孟浩,方贤,孙麒

Image captioning based on cross-modal cascaded diffusion model

Qiaohong CHEN,Menghao GUO,Xian FANG,Qi SUN

图 5 不同噪声增强级别对准确率的影响

Fig.5 Impact of different noise enhancement levels on accuracy