Offline Rl On D4Rl

Average Reward

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름	Average Reward	Paper Title	Repository
Decision Transformer (DT)	73.5	Decision Transformer: Reinforcement Learning via Sequence Modeling
KFC	81.8	Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics	-
ADMPO	81	Any-step Dynamics Model Improves Future Predictions for Online and Offline Reinforcement Learning

0 of 3 row(s) selected.