Code Generation On Dseval Leetcode
Metriken
Pass Rate
w/o Intact
w/o PE
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | Pass Rate | w/o Intact | w/o PE |
---|---|---|---|
mlcopilot-unleashing-the-power-of-large | 42.5 | 42.5 | 62.5 |
Modell 2 | 45.0 | 45.0 | 55.0 |
Modell 3 | 32.5 | 32.5 | 50.0 |
Modell 4 | 45.0 | 45.0 | 60.0 |
Modell 5 | 57.5 | 57.5 | 70.0 |