HyperAI

Arithmetic Reasoning On Multiarith

Métriques

Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAccuracy
large-language-models-are-zero-shot-reasoners17.7
large-language-models-are-zero-shot-reasoners78.7