Mathematical Reasoning On Math500
Metriken
Acc
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Modellname | Acc | Paper Title | Repository |
---|---|---|---|
Search-o1 | 86.4 | Search-o1: Agentic Search-Enhanced Large Reasoning Models |
0 of 1 row(s) selected.