Image Captioning On Nocaps Out Of Domain
المقاييس
CIDEr
SPICE
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | CIDEr | SPICE |
---|---|---|
clipcap-clip-prefix-for-image-captioning | 49.14 | 9.57 |
النموذج 2 | 21.3 | 7.2 |
clipcap-clip-prefix-for-image-captioning | 49.35 | 9.7 |
النموذج 4 | 72.13 | 11.53 |
النموذج 5 | 30.09 | 8.08 |
النموذج 6 | 26.55 | 7.72 |
النموذج 7 | 58.48 | 8.77 |
النموذج 8 | 30.09 | 8.08 |
vivo-surpassing-human-performance-in-novel | 110.14 | 13.74 |
النموذج 10 | 71.43 | 10.57 |
النموذج 11 | 48.73 | 8.2 |
النموذج 12 | 88.54 | 13.87 |
النموذج 13 | 70.21 | 10.15 |
النموذج 14 | 103.75 | 13.75 |
النموذج 15 | 85.18 | 11.18 |
النموذج 16 | 68.92 | 10.05 |
النموذج 17 | 87.51 | 12.52 |
النموذج 18 | 77.39 | 11.59 |
النموذج 19 | 23.07 | 7.4 |
النموذج 20 | 68.5 | 10.01 |
النموذج 21 | 54.56 | 9.9 |
git-a-generative-image-to-text-transformer | 122.27 | 15.62 |
vinvl-making-visual-representations-matter-in | 78.01 | 11.48 |
simvlm-simple-visual-language-model | 109.49 | 13.89 |
النموذج 25 | 26.25 | 7.52 |
النموذج 26 | 91.62 | 14.21 |
النموذج 27 | 87.15 | 11.43 |
النموذج 28 | 121.69 | 15.13 |
النموذج 29 | 36.12 | 9.39 |
git-a-generative-image-to-text-transformer | 122.04 | 15.7 |
النموذج 31 | 39.39 | 7.62 |
النموذج 32 | 75.39 | 10.68 |
النموذج 33 | 66.67 | 9.74 |
النموذج 34 | 43.2 | 9.35 |
النموذج 35 | 78.91 | 12.14 |
النموذج 36 | 25.91 | 7.61 |
النموذج 37 | 73.75 | 9.72 |
pali-a-jointly-scaled-multilingual-language | 126.67 | 15.49 |
النموذج 39 | 106.55 | 14.21 |
grit-faster-and-better-image-captioning | 72.6 | 11.1 |