HyperAI
HyperAI
الرئيسية
الصفحة الرئيسية
GPU
وحدة التحكم
التوثيق
التسعير
Pulse
الأخبار
الموارد
الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي
الاختبارات القياسية
SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU
المجتمع
الفعاليات
أدوات
بحث
حول
شروط الخدمة
سياسة الخصوصية
العربية
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
تسجيل الدخول
HyperAI
الأوراق البحثية
التعلم المعزز من نوع مونكهاوزن
منذ 6 أشهر
التعلم القوي
التعلم العميق
الشبكات العصبية
مجال البحث
النهج/المعمارية
ملخص
ورقة بحثية
المعايير المرجعية
الموارد
floringogianu/atari-agents
pytorch
deepmind/acme/tree/master/acme/agents/jax/dqn
jax
lingweizhu/Pytorch-MunchausenActorCritic
pytorch
google-research/google-research/tree/master/munchausen_rl
37.2k
رسمي
jax
opendilab/DI-engine
3.6k
pytorch
BY571/Munchausen-RL
pytorch
HyperAI
HyperAI
الرئيسية
الصفحة الرئيسية
GPU
وحدة التحكم
التوثيق
التسعير
Pulse
الأخبار
الموارد
الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي
الاختبارات القياسية
SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU
المجتمع
الفعاليات
أدوات
بحث
حول
شروط الخدمة
سياسة الخصوصية
العربية
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
تسجيل الدخول
HyperAI
الأوراق البحثية
التعلم المعزز من نوع مونكهاوزن
منذ 6 أشهر
التعلم القوي
التعلم العميق
الشبكات العصبية
مجال البحث
النهج/المعمارية
ملخص
ورقة بحثية
المعايير المرجعية
الموارد
floringogianu/atari-agents
pytorch
deepmind/acme/tree/master/acme/agents/jax/dqn
jax
lingweizhu/Pytorch-MunchausenActorCritic
pytorch
google-research/google-research/tree/master/munchausen_rl
37.2k
رسمي
jax
opendilab/DI-engine
3.6k
pytorch
BY571/Munchausen-RL
pytorch
الموارد - التعلم المعزز من نوع مونكهاوزن | مستندات | HyperAI
98
98
3.9k
3.9k
4
4
45
45