HyperAI超神経

Mathematical Reasoning On Math500

評価指標

Acc

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Acc
search-o1-agentic-search-enhanced-large86.4