Multi Agent Integration On Bbai Dataset
Metriken
P@1
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | P@1 |
---|---|
one-agent-to-rule-them-all-towards-multi-1 | 83.55 |
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Modellname | P@1 |
---|---|
one-agent-to-rule-them-all-towards-multi-1 | 83.55 |