HyperAI

Mathematical Reasoning On Frontiermath

Metriken

Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAccuracy
Modell 10.01
Modell 20.01
Modell 30.01
Modell 40.01
Modell 50.252
frontiermath-a-benchmark-for-evaluating0.02