HyperAI초신경

Code Generation On Webapp1K Duo React

평가 지표

pass@1

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름pass@1
a-case-study-of-web-app-coding-with-openai0.679
a-case-study-of-web-app-coding-with-openai0.449
a-case-study-of-web-app-coding-with-openai0.49
a-case-study-of-web-app-coding-with-openai0.652
a-case-study-of-web-app-coding-with-openai0.667
a-case-study-of-web-app-coding-with-openai0.531