Continuous Control On Walker Walk 2
Métriques
Return
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Return |
---|---|
online-and-offline-reinforcement-learning-by | 949.5 |
learning-and-planning-in-complex-action | 975.46 |