Code Generation On Webapp1K React
評価指標
pass@1
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | pass@1 |
---|---|
insights-from-benchmarking-frontier-language | 0.8808 |
a-case-study-of-web-app-coding-with-openai | 0.834 |
insights-from-benchmarking-frontier-language | 0.7002 |
insights-from-benchmarking-frontier-language | 0.885 |
a-case-study-of-web-app-coding-with-openai | 0.939 |
insights-from-benchmarking-frontier-language | 0.7804 |
insights-from-benchmarking-frontier-language | 0.302 |
a-case-study-of-web-app-coding-with-openai | 0.952 |