Explanation Generation On Vcr
Métriques
Human Explanation Rating
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Human Explanation Rating |
---|---|
harnessing-the-power-of-multi-task | 68.9 |
harnessing-the-power-of-multi-task | 77.3 |