Continuous Control On Walker Stand
評価指標
Return
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Return |
---|---|
online-and-offline-reinforcement-learning-by | 887.2 |
learning-and-planning-in-complex-action | 987.79 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Return |
---|---|
online-and-offline-reinforcement-learning-by | 887.2 |
learning-and-planning-in-complex-action | 987.79 |