Continuous Control On Cartpole Swingup 2
Métriques
Return
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Return |
---|---|
learning-and-planning-in-complex-action | 868.87 |
online-and-offline-reinforcement-learning-by | 594.3 |