Visual Reasoning On Nlvr
Métriques
Accuracy (Dev)
Accuracy (Test-P)
Accuracy (Test-U)
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Accuracy (Dev) | Accuracy (Test-P) | Accuracy (Test-U) |
---|---|---|---|
visualbert-a-simple-and-performant-baseline | 67.4% | 67% | 67.3% |