Image Captioning On Nocaps Xd Near Domain
評価指標
B1
B2
B3
B4
CIDEr
METEOR
ROUGE-L
SPICE
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | B1 | B2 | B3 | B4 | CIDEr | METEOR | ROUGE-L | SPICE |
---|---|---|---|---|---|---|---|---|
モデル 1 | 73.69 | 54.1 | 32.37 | 15.99 | 53.21 | 21.93 | 49.63 | 9.26 |
vivo-surpassing-human-performance-in-novel | 82.88 | 67.01 | 48.73 | 30.21 | 101.2 | 30.0 | 58.76 | 14.27 |
git-a-generative-image-to-text-transformer | 88.9 | 75.86 | 58.9 | 38.95 | 125.51 | 32.95 | 63.66 | 16.11 |
モデル 4 | 75.25 | 56.93 | 36.91 | 20.49 | 56.85 | 23.6 | 51.84 | 10.33 |
モデル 5 | 74.77 | 53.67 | 30.66 | 13.85 | 61.98 | 22.55 | 49.45 | 9.83 |
git-a-generative-image-to-text-transformer | 88.56 | 75.48 | 58.46 | 38.44 | 123.92 | 32.86 | 63.5 | 15.96 |
モデル 7 | 79.88 | 61.31 | 40.26 | 21.84 | 85.81 | 27.0 | 53.98 | 13.01 |
モデル 8 | 77.68 | 58.31 | 37.04 | 19.85 | 74.2 | 24.97 | 52.64 | 11.45 |
モデル 9 | 84.45 | 69.28 | 51.1 | 31.48 | 104.76 | 30.31 | 59.75 | 14.97 |
モデル 10 | 79.51 | 62.65 | 43.22 | 24.97 | 85.73 | 26.37 | 55.13 | 11.96 |
モデル 11 | 77.05 | 56.97 | 36.84 | 19.85 | 84.58 | 28.42 | 53.06 | 14.72 |