Image Captioning On Nocaps Out Of Domain
評価指標
CIDEr
SPICE
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | CIDEr | SPICE |
---|---|---|
clipcap-clip-prefix-for-image-captioning | 49.14 | 9.57 |
モデル 2 | 21.3 | 7.2 |
clipcap-clip-prefix-for-image-captioning | 49.35 | 9.7 |
モデル 4 | 72.13 | 11.53 |
モデル 5 | 30.09 | 8.08 |
モデル 6 | 26.55 | 7.72 |
モデル 7 | 58.48 | 8.77 |
モデル 8 | 30.09 | 8.08 |
vivo-surpassing-human-performance-in-novel | 110.14 | 13.74 |
モデル 10 | 71.43 | 10.57 |
モデル 11 | 48.73 | 8.2 |
モデル 12 | 88.54 | 13.87 |
モデル 13 | 70.21 | 10.15 |
モデル 14 | 103.75 | 13.75 |
モデル 15 | 85.18 | 11.18 |
モデル 16 | 68.92 | 10.05 |
モデル 17 | 87.51 | 12.52 |
モデル 18 | 77.39 | 11.59 |
モデル 19 | 23.07 | 7.4 |
モデル 20 | 68.5 | 10.01 |
モデル 21 | 54.56 | 9.9 |
git-a-generative-image-to-text-transformer | 122.27 | 15.62 |
vinvl-making-visual-representations-matter-in | 78.01 | 11.48 |
simvlm-simple-visual-language-model | 109.49 | 13.89 |
モデル 25 | 26.25 | 7.52 |
モデル 26 | 91.62 | 14.21 |
モデル 27 | 87.15 | 11.43 |
モデル 28 | 121.69 | 15.13 |
モデル 29 | 36.12 | 9.39 |
git-a-generative-image-to-text-transformer | 122.04 | 15.7 |
モデル 31 | 39.39 | 7.62 |
モデル 32 | 75.39 | 10.68 |
モデル 33 | 66.67 | 9.74 |
モデル 34 | 43.2 | 9.35 |
モデル 35 | 78.91 | 12.14 |
モデル 36 | 25.91 | 7.61 |
モデル 37 | 73.75 | 9.72 |
pali-a-jointly-scaled-multilingual-language | 126.67 | 15.49 |
モデル 39 | 106.55 | 14.21 |
grit-faster-and-better-image-captioning | 72.6 | 11.1 |