Mathematical Reasoning On Lila Iid
評価指標
Accuracy
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Accuracy |
---|---|
lila-a-unified-benchmark-for-mathematical | 0.252 |
lila-a-unified-benchmark-for-mathematical | 0.394 |
lila-a-unified-benchmark-for-mathematical | 0.48 |
lila-a-unified-benchmark-for-mathematical | 0.384 |
lila-a-unified-benchmark-for-mathematical | 0.204 |
lila-a-unified-benchmark-for-mathematical | 0.604 |