Offline Rl On D4Rl
평가 지표
Average Reward
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Average Reward |
---|---|
decision-transformer-reinforcement-learning | 73.5 |
koopman-q-learning-offline-reinforcement-1 | 81.8 |
any-step-dynamics-model-improves-future | 81 |
이 벤치마크에서 각 모델의 성능 결과
모델 이름 | Average Reward |
---|---|
decision-transformer-reinforcement-learning | 73.5 |
koopman-q-learning-offline-reinforcement-1 | 81.8 |
any-step-dynamics-model-improves-future | 81 |