HyperAI
HyperAI
الرئيسية
الصفحة الرئيسية
GPU
وحدة التحكم
التوثيق
التسعير
Pulse
الأخبار
الموارد
الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي
الاختبارات القياسية
SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU
المجتمع
الفعاليات
أدوات
بحث
حول
شروط الخدمة
سياسة الخصوصية
العربية
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
تسجيل الدخول
HyperAI
الأوراق البحثية
IQ-Learn: التعلم العكسي الناعم Q لمحاكاة السلوك
منذ 6 أشهر
التعلم القوي
التعلم الآلي
الضبط الدقيق المراقب
مجال البحث
النهج/المعمارية
ملخص
ورقة بحثية
المعايير المرجعية
الموارد
Div99/IQ-Learn
رسمي
pytorch
edmundmills/basalt-competition
pytorch
google-deepmind/csil
jax
robfiras/ls-iq
pytorch
MilkSilk/masters_thesis
HyperAI
HyperAI
الرئيسية
الصفحة الرئيسية
GPU
وحدة التحكم
التوثيق
التسعير
Pulse
الأخبار
الموارد
الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي
الاختبارات القياسية
SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU
المجتمع
الفعاليات
أدوات
بحث
حول
شروط الخدمة
سياسة الخصوصية
العربية
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
تسجيل الدخول
HyperAI
الأوراق البحثية
IQ-Learn: التعلم العكسي الناعم Q لمحاكاة السلوك
منذ 6 أشهر
التعلم القوي
التعلم الآلي
الضبط الدقيق المراقب
مجال البحث
النهج/المعمارية
ملخص
ورقة بحثية
المعايير المرجعية
الموارد
Div99/IQ-Learn
رسمي
pytorch
edmundmills/basalt-competition
pytorch
google-deepmind/csil
jax
robfiras/ls-iq
pytorch
MilkSilk/masters_thesis
الموارد - IQ-Learn: التعلم العكسي الناعم Q لمحاكاة السلوك | مستندات | HyperAI
377
377
8
8
23
23
61
61
0
0