Code Generation On Webapp1K Duo React
평가 지표
pass@1
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | pass@1 |
---|---|
a-case-study-of-web-app-coding-with-openai | 0.679 |
a-case-study-of-web-app-coding-with-openai | 0.449 |
a-case-study-of-web-app-coding-with-openai | 0.49 |
a-case-study-of-web-app-coding-with-openai | 0.652 |
a-case-study-of-web-app-coding-with-openai | 0.667 |
a-case-study-of-web-app-coding-with-openai | 0.531 |