HyperAI超神経

Mathematical Reasoning On Pgps9K

評価指標

Completion accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果