HyperAI

Arithmetic Reasoning On Mathtof

Metriken

Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAccuracy
teaching-inspired-integrated-prompting89.2