HyperAI

Logical Reasoning On Lingoly

Metriken

Delta_NoContext
Exact Match Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark