Openai Gym On Walker2D V4

Average Return

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름	Average Return	Paper Title
SAC	5745.27	Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor
MEow	5526.66	Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow
DDPG	2994.54	Continuous control with deep reinforcement learning
PPO	2739.81	Proximal Policy Optimization Algorithms
TD3	2612.74	Addressing Function Approximation Error in Actor-Critic Methods

0 of 5 row(s) selected.