Image Captioning On Localized Narratives
Metriken
CIDEr
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | CIDEr |
---|---|
control-image-captioning-spatially-and | 114.0 |
connecting-vision-and-language-with-localized | 106.5 |