HyperAIHyperAI

Command Palette

Search for a command to run...

نشر VibeThinker-1.5B مع vLLM+OpenWebUI

Date

منذ 2 أشهر

Size

1.12 MB

License

MIT

Paper URL

2511.06221

1. مقدمة البرنامج التعليمي

يبني

يُعدّ VibeThinker-1.5B أول نموذج مفتوح المصدر واسع النطاق أطلقته منصة Weibo AI في نوفمبر 2025. لا تعتمد قدرات VibeThinker-1.5B الفائقة على مجرد إضافة عدد كبير من المعاملات، بل تنبع من مفهوم تدريب SSP الذي اقترحه مطورو Weibo. يشجع هذا المفهوم النموذج على استكشاف جميع مسارات الحلول الممكنة خلال مرحلة التعلم، بدلاً من التركيز فقط على الدقة. بعد ذلك، يُستخدم التعلم المعزز لتحسين السياسات بكفاءة، مما يضمن تحديد المسار الصحيح بدقة وتحقيق أقصى أداء للنموذج. تتوفر أوراق بحثية ذات صلة. نموذج صغير، منطق كبير: التحسين القائم على التنوع يُثير القدرة على التفكير في نموذج كبير في VibeThinker-1.5B .

يستخدم هذا البرنامج التعليمي بطاقة رسومات RTX 5090 واحدة كمصدر افتراضي، ولكن من الممكن أيضًا استخدام بطاقة رسومات RTX 4090 واحدة. يُنصح بطرح الأسئلة باللغة الإنجليزية، لأن النموذج يدعم الإجابات باللغة الإنجليزية فقط.

يوصى بهذا النموذج لحل مشاكل البرمجة الرياضية والخوارزمية ذات النمط التنافسي.

2. عرض التأثير

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

إذا لم يظهر "النموذج"، فهذا يعني أنه قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار دقيقتين أو ثلاث دقائق ثم تحديث الصفحة.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@misc{xu2025tinymodelbiglogic,
      title={Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B}, 
      author={Sen Xu and Yi Zhou and Wei Wang and Jixin Min and Zhibin Yin and Yingwei Dai and Shixi Liu and Lianyu Pang and Yirong Chen and Junlin Zhang},
      year={2025},
      eprint={2511.06221},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2511.06221}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp