HyperAI超神経

Image Captioning On Flickr30K Captions Test

評価指標

CIDEr
SPICE

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名CIDErSPICE
language-models-are-general-purpose43.311.7
unified-vision-language-pre-training-for67.417
a-good-prompt-is-worth-millions-of-parameters 31.010.0
モデル 467.114.5
unifying-vision-and-language-tasks-via-text2.62.0
paying-more-attention-to-saliency-image46.4-
deep-visual-semantic-alignments-for24.7-