Montezuma S Revenge On Atari 2600 Montezuma S

Average Return (NoOp)

评测结果

各个模型在此基准测试上的表现结果

		Paper Title
Flare	1668	Reinforcement Learning with Latent Flow
Rainbow (tuned)	900	Reinforcement Learning with Latent Flow
Rainbow	384	Rainbow: Combining Improvements in Deep Reinforcement Learning

0 of 3 row(s) selected.