Continuous Control On Cartpole Swingup 2
평가 지표
Return
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Return |
---|---|
learning-and-planning-in-complex-action | 868.87 |
online-and-offline-reinforcement-learning-by | 594.3 |
이 벤치마크에서 각 모델의 성능 결과
모델 이름 | Return |
---|---|
learning-and-planning-in-complex-action | 868.87 |
online-and-offline-reinforcement-learning-by | 594.3 |