HyperAI

Common Sense Reasoning On Codah

Metriken

Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAccuracy
aqua-an-adversarially-authored-question69.6