HyperAI초신경

Code Generation On Pecc

평가 지표

Pass@3

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Pass@3
pecc-problem-extraction-and-coding-challenges3.1
pecc-problem-extraction-and-coding-challenges27.67
pecc-problem-extraction-and-coding-challenges8.48
pecc-problem-extraction-and-coding-challenges23.75
pecc-problem-extraction-and-coding-challenges3.72
pecc-problem-extraction-and-coding-challenges8.35
pecc-problem-extraction-and-coding-challenges11.39
pecc-problem-extraction-and-coding-challenges7.18