Visual Reasoning On Nlvr
Metriken
Accuracy (Dev)
Accuracy (Test-P)
Accuracy (Test-U)
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | Accuracy (Dev) | Accuracy (Test-P) | Accuracy (Test-U) |
---|---|---|---|
visualbert-a-simple-and-performant-baseline | 67.4% | 67% | 67.3% |