Continuous Control On Walker Walk 2
評価指標
Return
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Return |
---|---|
online-and-offline-reinforcement-learning-by | 949.5 |
learning-and-planning-in-complex-action | 975.46 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Return |
---|---|
online-and-offline-reinforcement-learning-by | 949.5 |
learning-and-planning-in-complex-action | 975.46 |