HyperAI

Offline Rl On D4Rl

Metriken

Average Reward

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAverage Reward
decision-transformer-reinforcement-learning73.5
koopman-q-learning-offline-reinforcement-181.8
any-step-dynamics-model-improves-future81