HyperAI超神経

Mathematical Reasoning On Lila Ood

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
lila-a-unified-benchmark-for-mathematical0.448
lila-a-unified-benchmark-for-mathematical0.268
lila-a-unified-benchmark-for-mathematical0.586
lila-a-unified-benchmark-for-mathematical0.384
lila-a-unified-benchmark-for-mathematical0.177
lila-a-unified-benchmark-for-mathematical0.238