يتوفر برنامج تعليمي لنشر QwQ-32B بنقرة واحدة على الإنترنت، والأداء مماثل للإصدار ذي الإمكانات الكاملة من DeepSeek-R1

بالأمس، قامت Alibaba Cloud فجأة بخطوة كبيرة وأطلقت نموذج تفكير جديد مفتوح المصدر، Tongyi Qianwen QwQ-32B.وفي العديد من المعايير الرئيسية، تفوق على OpenAI-o1-mini بـ 32 مليار معلمة وكان قابلاً للمقارنة مع الإصدار الكامل من DeepSeek-R1 بـ 671 مليار معلمة. لا يتمتع QwQ-32B بالأداء المذهل فحسب، بل يقلل أيضًا من تكلفة النشر بشكل كبير مع الحفاظ على الأداء القوي. ويمكن أيضًا نشره محليًا على بطاقات الرسوميات المخصصة للمستهلكين، مما يجعله نموذجًا للقوة والفعالية من حيث التكلفة.

على المستوى التقني، يعتمد QwQ-32B على أسلوب التعلم التعزيزي المكون من مرحلتين والذي يعتمد على البدء البارد. تركز المرحلة الأولى على مهام الرياضيات والترميز، وتستخدم أدوات التحقق الرياضية وصناديق رمل الترميز للتركيز على تحسين قدرة النموذج على التفكير المنطقي.
وتستخدم المرحلة الثانية آلية التحقق من الإجابة لتحل محل نموذج المكافأة التقليدي. بالنسبة للمسائل الرياضية، يتم تقديم ردود الفعل بناءً على صحة النتائج. بالنسبة لمهام البرمجة، يتم إجراء تقييم في الوقت الفعلي على الخادم من خلال حالات الاختبار لتحسين القدرات العامة. بالإضافة إلى ذلك، يدمج QwQ-32B أيضًا الوظائف المرتبطة بالوكيل، مما يتيح له تعديل عملية التفكير بشكل مرن استنادًا إلى ردود الفعل البيئية، مما يعزز بشكل كبير من استقلالية النموذج وقدرته على التكيف.
"استخدام vLLM لنشر QwQ-32B" متاح الآن في قسم "البرامج التعليمية" على الموقع الرسمي لشركة HyperAI.معلمات صغيرة وقوة كبيرة، في انتظار التحقق منها!
عنوان البرنامج التعليمي:
تشغيل تجريبي
1. قم بتسجيل الدخول إلى hyper.ai، في صفحة البرنامج التعليمي، حدد Deploy QwQ-32B باستخدام vLLM، ثم انقر فوق تشغيل هذا البرنامج التعليمي عبر الإنترنت.


2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

3. حدد الصور "NVIDIA A6000-2" و"vllm". أطلقت منصة OpenBayes طريقة فوترة جديدة. يمكنك اختيار "الدفع حسب الاستخدام" أو "يوميًا/أسبوعيًا/شهريًا" وفقًا لاحتياجاتك. انقر فوق "متابعة". يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على 4 ساعات من RTX 4090 + 5 ساعات من وقت فراغ وحدة المعالجة المركزية!
رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. انتظر حتى يتم تخصيص الموارد. تستغرق عملية الاستنساخ الأولى حوالي دقيقتين. عندما تتغير الحالة إلى "قيد التشغيل"، انقر فوق سهم الانتقال بجوار "عنوان API" للانتقال إلى صفحة العرض التوضيحي. يرجى ملاحظة أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان API.


عرض التأثير
1. هناك الكثير من المناقشات عبر الإنترنت حول أيهما أفضل، QwQ-32B أم DeepSeek. دعونا نسأل QwQ-32B ونرى كيف يجيب.

2. يمكن ملاحظة أن QwQ-32B سوف يوضح عملية تفكير كاملة ويقدم تحليلاً موضوعيًا من زوايا متعددة.


