Mathematical Reasoning On Frontiermath
Métriques
Accuracy
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Accuracy |
---|---|
Modèle 1 | 0.01 |
Modèle 2 | 0.01 |
Modèle 3 | 0.01 |
Modèle 4 | 0.01 |
Modèle 5 | 0.252 |
frontiermath-a-benchmark-for-evaluating | 0.02 |