Openai Gym On Humanoid V4

Average Return

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름	Average Return	Paper Title
SAC	6211.50	Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor
MEow	6923.22	Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow
DDPG	139.14	Continuous control with deep reinforcement learning
TD3	198.44	Addressing Function Approximation Error in Actor-Critic Methods
PPO	925.89	Proximal Policy Optimization Algorithms

0 of 5 row(s) selected.