HyperAI

Mathematical Reasoning On Lila Ood

Métriques

Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAccuracy
lila-a-unified-benchmark-for-mathematical0.448
lila-a-unified-benchmark-for-mathematical0.268
lila-a-unified-benchmark-for-mathematical0.586
lila-a-unified-benchmark-for-mathematical0.384
lila-a-unified-benchmark-for-mathematical0.177
lila-a-unified-benchmark-for-mathematical0.238