Phrase Grounding On Flickr30K Entities Dev
Metriken
R@1
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | R@1 |
---|---|
pevl-position-enhanced-pre-training-and | 84.1 |
coarse-to-fine-vision-language-pre-training | 87.1 |
visualbert-a-simple-and-performant-baseline | 70.4 |