Code Generation On Livecodebench
評価指標
Acc
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Acc |
---|---|
planning-driven-programming-a-large-language | 59.3 |
search-o1-agentic-search-enhanced-large | 33 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Acc |
---|---|
planning-driven-programming-a-large-language | 59.3 |
search-o1-agentic-search-enhanced-large | 33 |