Montezuma S Revenge On Atari 2600 Montezuma S
المقاييس
Average Return (NoOp)
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | Average Return (NoOp) |
---|---|
reinforcement-learning-with-latent-flow-1 | 900 |
reinforcement-learning-with-latent-flow-1 | 1668 |
rainbow-combining-improvements-in-deep | 384 |