Continuous Control On Cartpole Swingup 2
Metriken
Return
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | Return |
---|---|
learning-and-planning-in-complex-action | 868.87 |
online-and-offline-reinforcement-learning-by | 594.3 |