Mathematical Reasoning On Frontiermath
Metriken
Accuracy
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | Accuracy |
---|---|
Modell 1 | 0.01 |
Modell 2 | 0.01 |
Modell 3 | 0.01 |
Modell 4 | 0.01 |
Modell 5 | 0.252 |
frontiermath-a-benchmark-for-evaluating | 0.02 |