HyperAI超神経

Mathematical Reasoning On Frontiermath

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
モデル 10.01
モデル 20.01
モデル 30.01
モデル 40.01
モデル 50.252
frontiermath-a-benchmark-for-evaluating0.02