HyperAI

Image Captioning On Flickr30K Captions Test

المقاييس

CIDEr
SPICE

النتائج

نتائج أداء النماذج المختلفة على هذا المعيار القياسي

جدول المقارنة
اسم النموذجCIDErSPICE
language-models-are-general-purpose43.311.7
unified-vision-language-pre-training-for67.417
a-good-prompt-is-worth-millions-of-parameters 31.010.0
النموذج 467.114.5
unifying-vision-and-language-tasks-via-text2.62.0
paying-more-attention-to-saliency-image46.4-
deep-visual-semantic-alignments-for24.7-