HyperAI超神経

Code Generation On Livecodebench

評価指標

Acc

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Acc
planning-driven-programming-a-large-language59.3
search-o1-agentic-search-enhanced-large33