Continuous Control On Acrobot Swingup
評価指標
Return
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Return | Paper Title | Repository |
---|---|---|---|
SMuZero | 417.52 | Learning and Planning in Complex Action Spaces |
0 of 1 row(s) selected.
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Return | Paper Title | Repository |
---|---|---|---|
SMuZero | 417.52 | Learning and Planning in Complex Action Spaces |