HyperAI超神経

Offline Rl On Walker2D

評価指標

D4RL Normalized Score

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名D4RL Normalized Score
particle-based-stochastic-policy-optimization151.4