Code Generation On Livecodebench

Acc

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름	Acc	Paper Title	Repository
LPW (GPT-4o)	59.3	Planning-Driven Programming: A Large Language Model Programming Workflow
Search-o1	33	Search-o1: Agentic Search-Enhanced Large Reasoning Models

0 of 2 row(s) selected.