Continuous Control On Cartpole Swingup 2
المقاييس
Return
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
اسم النموذج | Return | Paper Title | Repository |
---|---|---|---|
SMuZero | 868.87 | Learning and Planning in Complex Action Spaces | |
MuZero Unplugged | 594.3 | Online and Offline Reinforcement Learning by Planning with a Learned Model |
0 of 2 row(s) selected.