HyperAI超神経

Code Generation On Bigcodebench Complete

評価指標

Pass@1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Pass@1
bigcodebench-benchmarking-code-generation59.7
bigcodebench-benchmarking-code-generation61.1