HyperAI

Explanation Generation On Vcr

Metriken

Human Explanation Rating

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameHuman Explanation Rating
harnessing-the-power-of-multi-task68.9
harnessing-the-power-of-multi-task77.3