Mathematical Reasoning On Frontiermath
評価指標
Accuracy
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Accuracy |
---|---|
モデル 1 | 0.01 |
モデル 2 | 0.01 |
モデル 3 | 0.01 |
モデル 4 | 0.01 |
モデル 5 | 0.252 |
frontiermath-a-benchmark-for-evaluating | 0.02 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Accuracy |
---|---|
モデル 1 | 0.01 |
モデル 2 | 0.01 |
モデル 3 | 0.01 |
モデル 4 | 0.01 |
モデル 5 | 0.252 |
frontiermath-a-benchmark-for-evaluating | 0.02 |