Code Generation On Res Q

評価指標

pass@1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果