Reinforcement Learning On Procgen

Mean Normalized Performance

평가 결과

이 벤치마크에서 각 모델의 성능 결과

		Paper Title
PPG	0.757	Phasic Policy Gradient
PPO	0.576	Phasic Policy Gradient

0 of 2 row(s) selected.