HyperAI
HyperAI
الرئيسية
الصفحة الرئيسية
GPU
وحدة التحكم
التوثيق
التسعير
Pulse
الأخبار
الموارد
الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي
الاختبارات القياسية
SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU
المجتمع
الفعاليات
أدوات
بحث
حول
شروط الخدمة
سياسة الخصوصية
العربية
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
تسجيل الدخول
HyperAI
الأوراق البحثية
الانحدار الموزون بالميزة: تعلم تعزيز خارج النموذج بسيط وقابل للتوسع
منذ 6 أشهر
التعلم القوي
تدريب النموذج
الضبط الدقيق المراقب
النهج/المعمارية
ملخص
ورقة بحثية
المعايير المرجعية
الموارد
nvlabs/gbrl_sb3
pytorch
peisuke/awr
NitinVishalKulkarni/OfflineReinforcementLearning
xbpeng/awr
tf
fomorians-oss/awr
tf
google/trax
jax
HyperAI
HyperAI
الرئيسية
الصفحة الرئيسية
GPU
وحدة التحكم
التوثيق
التسعير
Pulse
الأخبار
الموارد
الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي
الاختبارات القياسية
SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU
المجتمع
الفعاليات
أدوات
بحث
حول
شروط الخدمة
سياسة الخصوصية
العربية
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
تسجيل الدخول
HyperAI
الأوراق البحثية
الانحدار الموزون بالميزة: تعلم تعزيز خارج النموذج بسيط وقابل للتوسع
منذ 6 أشهر
التعلم القوي
تدريب النموذج
الضبط الدقيق المراقب
النهج/المعمارية
ملخص
ورقة بحثية
المعايير المرجعية
الموارد
nvlabs/gbrl_sb3
pytorch
peisuke/awr
NitinVishalKulkarni/OfflineReinforcementLearning
xbpeng/awr
tf
fomorians-oss/awr
tf
google/trax
jax
43
43
0
0
3
3
207
207
1
1
8.3k
8.3k