HyperAI
HyperAI
الرئيسية
الصفحة الرئيسية
GPU
وحدة التحكم
التوثيق
التسعير
Pulse
الأخبار
الموارد
الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي
الاختبارات القياسية
SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU
المجتمع
الفعاليات
أدوات
بحث
حول
شروط الخدمة
سياسة الخصوصية
العربية
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
تسجيل الدخول
HyperAI
الأوراق البحثية
OctoThinker: التحفيز خلال التدريب يشجع توسيع تعلم التعزيز
منذ 8 أشهر
التعلم القوي
تدريب النموذج
مجموعة بيانات
بنية ذكاء اصطناعي الأساسية
النهج/المعمارية
ملخص
ورقة بحثية
الموارد
gair-nlp/octothinker
رسمي
pytorch
GAIR-NLP/OctoThinker
HyperAI
HyperAI
الرئيسية
الصفحة الرئيسية
GPU
وحدة التحكم
التوثيق
التسعير
Pulse
الأخبار
الموارد
الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي
الاختبارات القياسية
SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU
المجتمع
الفعاليات
أدوات
بحث
حول
شروط الخدمة
سياسة الخصوصية
العربية
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
تسجيل الدخول
HyperAI
الأوراق البحثية
OctoThinker: التحفيز خلال التدريب يشجع توسيع تعلم التعزيز
منذ 8 أشهر
التعلم القوي
تدريب النموذج
مجموعة بيانات
بنية ذكاء اصطناعي الأساسية
النهج/المعمارية
ملخص
ورقة بحثية
الموارد
gair-nlp/octothinker
رسمي
pytorch
GAIR-NLP/OctoThinker
182
182
182
182