HyperAI

Image Captioning On Flickr30K Captions Test

Métriques

CIDEr
SPICE

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleCIDErSPICE
language-models-are-general-purpose43.311.7
unified-vision-language-pre-training-for67.417
a-good-prompt-is-worth-millions-of-parameters 31.010.0
Modèle 467.114.5
unifying-vision-and-language-tasks-via-text2.62.0
paying-more-attention-to-saliency-image46.4-
deep-visual-semantic-alignments-for24.7-