Image Captioning On Nocaps Xd Out Of Domain
평가 지표
B1
B2
B3
B4
CIDEr
METEOR
ROUGE-L
SPICE
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | B1 | B2 | B3 | B4 | CIDEr | METEOR | ROUGE-L | SPICE |
---|---|---|---|---|---|---|---|---|
모델 1 | 66.54 | 44.28 | 24.23 | 10.17 | 30.09 | 18.29 | 44.84 | 8.08 |
모델 2 | 75.59 | 56.71 | 35.63 | 17.72 | 85.28 | 23.77 | 51.92 | 11.28 |
모델 3 | 71.57 | 48.58 | 25.77 | 9.68 | 66.67 | 20.88 | 47.13 | 9.74 |
git-a-generative-image-to-text-transformer | 86.28 | 71.15 | 52.36 | 30.15 | 122.27 | 30.15 | 60.91 | 15.62 |
모델 5 | 79.59 | 61.04 | 40.09 | 19.61 | 90.34 | 26.14 | 54.86 | 13.11 |
모델 6 | 74.84 | 53.9 | 33.51 | 16.6 | 91.62 | 26.83 | 51.5 | 14.21 |
vivo-surpassing-human-performance-in-novel | 79.44 | 61.15 | 41.03 | 21.79 | 95.5 | 26.56 | 55.49 | 12.66 |
모델 8 | 64.45 | 42.8 | 21.48 | 7.92 | 48.73 | 18.31 | 44.11 | 8.2 |
모델 9 | 74.5 | 53.63 | 30.91 | 13.41 | 77.94 | 23.47 | 49.66 | 11.07 |
모델 10 | 65.98 | 43.2 | 21.16 | 7.5 | 58.48 | 19.04 | 44.47 | 8.77 |
git-a-generative-image-to-text-transformer | 85.99 | 71.28 | 52.66 | 30.04 | 122.04 | 30.45 | 60.96 | 15.7 |