HyperAI

Math Word Problem Solving On Svamp 1 N

Métriques

Execution Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleExecution Accuracy
athena-mathematical-reasoning-with-thought67.8
athena-mathematical-reasoning-with-thought52.5