HyperAI

Code Generation On Livecodebench

Metriken

Acc

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAcc
planning-driven-programming-a-large-language59.3
search-o1-agentic-search-enhanced-large33