Mathematical Reasoning On Lila Ood
評価指標
Accuracy
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Accuracy |
---|---|
lila-a-unified-benchmark-for-mathematical | 0.448 |
lila-a-unified-benchmark-for-mathematical | 0.268 |
lila-a-unified-benchmark-for-mathematical | 0.586 |
lila-a-unified-benchmark-for-mathematical | 0.384 |
lila-a-unified-benchmark-for-mathematical | 0.177 |
lila-a-unified-benchmark-for-mathematical | 0.238 |