HyperAI

Code Generation On Livecodebench

Métriques

Acc

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAcc
planning-driven-programming-a-large-language59.3
search-o1-agentic-search-enhanced-large33