HyperAI

Mathematical Reasoning On Frontiermath

Métriques

Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAccuracy
Modèle 10.01
Modèle 20.01
Modèle 30.01
Modèle 40.01
Modèle 50.252
frontiermath-a-benchmark-for-evaluating0.02