Code Generation On Dseval Leetcode
評価指標
Pass Rate
w/o Intact
w/o PE
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Pass Rate | w/o Intact | w/o PE |
---|---|---|---|
mlcopilot-unleashing-the-power-of-large | 42.5 | 42.5 | 62.5 |
モデル 2 | 45.0 | 45.0 | 55.0 |
モデル 3 | 32.5 | 32.5 | 50.0 |
モデル 4 | 45.0 | 45.0 | 60.0 |
モデル 5 | 57.5 | 57.5 | 70.0 |