HyperAI

Arithmetic Reasoning On Game Of 24

Metriken

Success

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameSuccess
tree-of-thoughts-deliberate-problem-solving-10.74