Explanation Generation On Vqa X
Metriken
Human Explanation Rating
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | Human Explanation Rating |
---|---|
harnessing-the-power-of-multi-task | 89.5 |
harnessing-the-power-of-multi-task | 87.8 |