HyperAI

Arithmetic Reasoning On Multiarith

Metriken

Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAccuracy
large-language-models-are-zero-shot-reasoners17.7
large-language-models-are-zero-shot-reasoners78.7