HyperAI

Explanation Generation On Vcr

Métriques

Human Explanation Rating

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleHuman Explanation Rating
harnessing-the-power-of-multi-task68.9
harnessing-the-power-of-multi-task77.3