Code Generation On Bigcodebench Complete
評価指標
Pass@1
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Pass@1 |
---|---|
bigcodebench-benchmarking-code-generation | 59.7 |
bigcodebench-benchmarking-code-generation | 61.1 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Pass@1 |
---|---|
bigcodebench-benchmarking-code-generation | 59.7 |
bigcodebench-benchmarking-code-generation | 61.1 |