HyperAI超神経

Offline Rl On D4Rl

評価指標

Average Reward

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Average Reward
decision-transformer-reinforcement-learning73.5
koopman-q-learning-offline-reinforcement-181.8
any-step-dynamics-model-improves-future81