HyperAI超神経

Continuous Control On Cartpole Swingup 2

評価指標

Return

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Return
learning-and-planning-in-complex-action868.87
online-and-offline-reinforcement-learning-by594.3