HyperAI

Offline Rl On D4Rl

Métriques

Average Reward

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAverage Reward
decision-transformer-reinforcement-learning73.5
koopman-q-learning-offline-reinforcement-181.8
any-step-dynamics-model-improves-future81