Math Word Problem Solving
Liste des benchmarks
Tous les benchmarks liés à cette tâche
asdiv-a
Meilleur modèle: ATHENA (roberta-large)
Métriques
Voir les détails
gsm-plus
Meilleur modèle: GPT-4
Métriques
Voir les détails
math-minival
Meilleur modèle: Process Supervision (GPT-4)
Métriques
Voir les détails
math23k
Meilleur modèle: Roberta-DeductReasoner
Métriques
Voir les détails
mathqa
Meilleur modèle: ELASTIC (RoBERTa-large)
Métriques
Voir les détails
mawps
Meilleur modèle: OpenMath-CodeLlama-70B (w/ code)
Métriques
Voir les détails
paramawps
Meilleur modèle: DeBERTa (VM)
Métriques
Voir les détails
pen
Meilleur modèle: EPT-X
Métriques
Voir les détails
svamp
Meilleur modèle: GPT-4 (Teaching-Inspired)
Métriques
Voir les détails
svamp-1-n
Meilleur modèle: ATHENA (roberta-large)
Métriques
Voir les détails
alg514
Métriques
Voir les détails
draw-1k
Métriques
Voir les détails
math
Métriques
Voir les détails