Arithmetic Reasoning On Multiarith
評価指標
Accuracy
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Accuracy |
---|---|
large-language-models-are-zero-shot-reasoners | 17.7 |
large-language-models-are-zero-shot-reasoners | 78.7 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Accuracy |
---|---|
large-language-models-are-zero-shot-reasoners | 17.7 |
large-language-models-are-zero-shot-reasoners | 78.7 |