Reinforcement Learning On Procgen
المقاييس
Mean Normalized Performance
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
اسم النموذج | Mean Normalized Performance | Paper Title | Repository |
---|---|---|---|
PPG | 0.757 | Phasic Policy Gradient | |
PPO | 0.576 | Phasic Policy Gradient |
0 of 2 row(s) selected.