HyperAI超神経

Code Generation On Webapp1K Duo React

評価指標

pass@1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名pass@1
a-case-study-of-web-app-coding-with-openai0.679
a-case-study-of-web-app-coding-with-openai0.449
a-case-study-of-web-app-coding-with-openai0.49
a-case-study-of-web-app-coding-with-openai0.652
a-case-study-of-web-app-coding-with-openai0.667
a-case-study-of-web-app-coding-with-openai0.531