HyperAI

Image Captioning On Nocaps Out Of Domain

Métriques

CIDEr
SPICE

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleCIDErSPICE
clipcap-clip-prefix-for-image-captioning49.149.57
Modèle 221.37.2
clipcap-clip-prefix-for-image-captioning49.359.7
Modèle 472.1311.53
Modèle 530.098.08
Modèle 626.557.72
Modèle 758.488.77
Modèle 830.098.08
vivo-surpassing-human-performance-in-novel110.1413.74
Modèle 1071.4310.57
Modèle 1148.738.2
Modèle 1288.5413.87
Modèle 1370.2110.15
Modèle 14103.7513.75
Modèle 1585.1811.18
Modèle 1668.9210.05
Modèle 1787.5112.52
Modèle 1877.3911.59
Modèle 1923.077.4
Modèle 2068.510.01
Modèle 2154.569.9
git-a-generative-image-to-text-transformer122.2715.62
vinvl-making-visual-representations-matter-in78.0111.48
simvlm-simple-visual-language-model109.4913.89
Modèle 2526.257.52
Modèle 2691.6214.21
Modèle 2787.1511.43
Modèle 28121.6915.13
Modèle 2936.129.39
git-a-generative-image-to-text-transformer122.0415.7
Modèle 3139.397.62
Modèle 3275.3910.68
Modèle 3366.679.74
Modèle 3443.29.35
Modèle 3578.9112.14
Modèle 3625.917.61
Modèle 3773.759.72
pali-a-jointly-scaled-multilingual-language126.6715.49
Modèle 39106.5514.21
grit-faster-and-better-image-captioning72.611.1