HyperAI

Math Word Problem Solving On Math Minival

Metriken

Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Modellname
Accuracy
Paper TitleRepository
Process Supervision (GPT-4)78.2Let's Verify Step by Step
0 of 1 row(s) selected.