HyperAI초신경

Offline Rl On Walker2D

평가 지표

D4RL Normalized Score

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름D4RL Normalized Score
particle-based-stochastic-policy-optimization151.4