Offline Rl On Walker2D
المقاييس
D4RL Normalized Score
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | D4RL Normalized Score |
---|---|
particle-based-stochastic-policy-optimization | 151.4 |
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
اسم النموذج | D4RL Normalized Score |
---|---|
particle-based-stochastic-policy-optimization | 151.4 |