HyperAI超神経

Code Generation On Webapp1K React

評価指標

pass@1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名pass@1
insights-from-benchmarking-frontier-language0.8808
a-case-study-of-web-app-coding-with-openai0.834
insights-from-benchmarking-frontier-language0.7002
insights-from-benchmarking-frontier-language0.885
a-case-study-of-web-app-coding-with-openai0.939
insights-from-benchmarking-frontier-language0.7804
insights-from-benchmarking-frontier-language0.302
a-case-study-of-web-app-coding-with-openai0.952