Mathematical Reasoning On Frontiermath
评估指标
Accuracy
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | Accuracy |
---|---|
模型 1 | 0.01 |
模型 2 | 0.01 |
模型 3 | 0.01 |
模型 4 | 0.01 |
模型 5 | 0.252 |
frontiermath-a-benchmark-for-evaluating | 0.02 |
各个模型在此基准测试上的表现结果
模型名称 | Accuracy |
---|---|
模型 1 | 0.01 |
模型 2 | 0.01 |
模型 3 | 0.01 |
模型 4 | 0.01 |
模型 5 | 0.252 |
frontiermath-a-benchmark-for-evaluating | 0.02 |