Continuous Control On Walker Stand
평가 지표
Return
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Return |
---|---|
online-and-offline-reinforcement-learning-by | 887.2 |
learning-and-planning-in-complex-action | 987.79 |
이 벤치마크에서 각 모델의 성능 결과
모델 이름 | Return |
---|---|
online-and-offline-reinforcement-learning-by | 887.2 |
learning-and-planning-in-complex-action | 987.79 |