HyperAI

Openai Gym On Hopper V4

المقاييس

Average Return

النتائج

نتائج أداء النماذج المختلفة على هذا المعيار القياسي

جدول المقارنة
اسم النموذجAverage Return
continuous-control-with-deep-reinforcement1290.24
maximum-entropy-reinforcement-learning-via3332.99
addressing-function-approximation-error-in3319.98
proximal-policy-optimization-algorithms790.77
soft-actor-critic-off-policy-maximum-entropy2882.56