HyperAIHyperAI

Command Palette

Search for a command to run...

Console

نشر VibeThinker-1.5B مع vLLM+OpenWebUI

1. مقدمة البرنامج التعليمي

يبني

VibeThinker-1.5B هو أول نموذج مفتوح المصدر واسع النطاق يُصدره Weibo AI في نوفمبر 2025. لا تعتمد قدرات VibeThinker-1.5B القوية على مجرد تراكم المعلمات؛ بل تنبع من مفهوم تدريب SSP الذي اقترحه مطورو Weibo. يشجع هذا المفهوم النموذج على استكشاف جميع مسارات الحلول الممكنة خلال مرحلة التعلم، بدلاً من التركيز فقط على الدقة. بعد ذلك، يُستخدم التعلم التعزيزي لتحسين السياسات بكفاءة، وتحديد المسار الصحيح بدقة، وتعزيز أداء النموذج. عنوان الورقة البحثية ذات الصلة هو "نموذج صغير، منطق كبير: التحسين القائم على التنوع يُثير القدرة على التفكير في نموذج كبير في VibeThinker-1.5B".

يستخدم هذا البرنامج التعليمي بطاقة رسومات RTX 5090 واحدة كمصدر افتراضي، ولكن من الممكن أيضًا استخدام بطاقة رسومات RTX 4090 واحدة. يُنصح بطرح الأسئلة باللغة الإنجليزية، لأن النموذج يدعم الإجابات باللغة الإنجليزية فقط.

يوصى بهذا النموذج لحل مشاكل البرمجة الرياضية والخوارزمية ذات النمط التنافسي.

2. عرض التأثير

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

إذا لم يظهر "النموذج"، فهذا يعني أنه قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار دقيقتين أو ثلاث دقائق ثم تحديث الصفحة.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@misc{xu2025tinymodelbiglogic,
      title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B}, 
      author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang},
      year={2025},
      eprint={2511.06221},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2511.06221}, 
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp