Atari Games On Atari 2600 Battle Zone

Score

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名	Score	Paper Title	Repository
SAC	4386.7	Soft Actor-Critic for Discrete Action Settings
POP3D	15466.67	Policy Optimization With Penalized Point Probability Distance: An Alternative To Proximal Policy Optimization
Bootstrapped DQN	38666.7	Deep Exploration via Bootstrapped DQN
MuZero	848623.00	Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model
Duel hs	31320.0	Dueling Network Architectures for Deep Reinforcement Learning
IMPALA (deep)	20885.00	IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures
C51 noop	28742.0	A Distributional Perspective on Reinforcement Learning
A3C FF hs	12950.0	Asynchronous Methods for Deep Reinforcement Learning
Prior hs	25520.0	Prioritized Experience Replay
R2D2	751880.0	Recurrent Experience Replay in Distributed Reinforcement Learning	-
Duel noop	37150.0	Dueling Network Architectures for Deep Reinforcement Learning
DDQN+Pop-Art noop	8220.0	Learning values across many orders of magnitude	-
Ape-X	98895	Distributed Prioritized Experience Replay
NoisyNet-Dueling	52262	Noisy Networks for Exploration
Agent57	934134.88	Agent57: Outperforming the Atari Human Benchmark
DNA	71003	DNA: Proximal Policy Optimization with a Dual Network Architecture
DreamerV2	40325	Mastering Atari with Discrete World Models
CGP	34200	Evolving simple programs for playing Atari games
FQF	87928.6	Fully Parameterized Quantile Function for Distributional Reinforcement Learning
IQN	42244	Implicit Quantile Networks for Distributional Reinforcement Learning

0 of 47 row(s) selected.