HyperAI

Mathematical Reasoning On Lila Iid

Metriken

Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAccuracy
lila-a-unified-benchmark-for-mathematical0.252
lila-a-unified-benchmark-for-mathematical0.394
lila-a-unified-benchmark-for-mathematical0.48
lila-a-unified-benchmark-for-mathematical0.384
lila-a-unified-benchmark-for-mathematical0.204
lila-a-unified-benchmark-for-mathematical0.604