HyperAI
HyperAI
الرئيسية
المنصة
الوثائق
الأخبار
الأوراق البحثية
الدروس
مجموعات البيانات
الموسوعة
SOTA
نماذج LLM
لوحة الأداء GPU
الفعاليات
البحث
حول
شروط الخدمة
سياسة الخصوصية
العربية
HyperAI
HyperAI
Toggle Sidebar
البحث في الموقع...
⌘
K
Command Palette
Search for a command to run...
المنصة
الرئيسية
SOTA
مكتبة OpenAI جيم
Openai Gym On Walker2D V4
Openai Gym On Walker2D V4
المقاييس
Average Return
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
Columns
اسم النموذج
Average Return
Paper Title
SAC
5745.27
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor
MEow
5526.66
Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow
DDPG
2994.54
Continuous control with deep reinforcement learning
PPO
2739.81
Proximal Policy Optimization Algorithms
TD3
2612.74
Addressing Function Approximation Error in Actor-Critic Methods
0 of 5 row(s) selected.
Previous
Next