Code Generation On Webapp1K Duo React
評価指標
pass@1
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | pass@1 |
---|---|
a-case-study-of-web-app-coding-with-openai | 0.679 |
a-case-study-of-web-app-coding-with-openai | 0.449 |
a-case-study-of-web-app-coding-with-openai | 0.49 |
a-case-study-of-web-app-coding-with-openai | 0.652 |
a-case-study-of-web-app-coding-with-openai | 0.667 |
a-case-study-of-web-app-coding-with-openai | 0.531 |