HyperAI

أفضل لاعبي المصدر المفتوح يجتمعون معًا! يفتح QwQ-32B أوضاع لعب متعددة، ويقوم OpenManus ببناء وكلاء الذكاء الاصطناعي بتكلفة منخفضة! يتيح برنامج vLLM V1 إمكانية التفكير النموذجي بكفاءة

特色图像

وفي خضم موجة الاختراقات المستمرة في مجال الذكاء الاصطناعي، نجح أحدث نموذج لفريق Qwen، QwQ-32B، بمعلماته البالغ عددها 32 مليار معلمة، في تجديد فهم الصناعة للنماذج الكبيرة مفتوحة المصدر مرة أخرى. وأظهر النموذج أداءً ممتازًا في مهام مثل إنشاء التعليمات البرمجية والحوار متعدد الجولات، كما أن قدرته على التفكير قابلة للمقارنة مع الإصدار الكامل من DeepSeek-R1.

منذ وقت ليس ببعيد،تم تصميم بنية vLLM الأساسية خصيصًا لتسريع التفكير في النماذج الكبيرة لتحديث كبير.من خلال تحسين حلقات التنفيذ والجداول الموحدة وذاكرة التخزين المؤقت للبادئات ذات التكلفة الزائدة الصفرية، فإنه يحقق تحسنًا في الأداء يصل إلى 1.7 مرة في الإنتاجية والزمن الكامن، مما يسمح بنشر QwQ-32B بكفاءة على بطاقات الرسومات A6000 ثنائية البطاقة.

في مجال AI Agent، اكتسب OpenManus زخمًا منذ إطلاقه. هذا المشروع مفتوح المصدر، المعروف باسم "بديل مانوس"،ولا يقتصر الأمر على الاستجابة للشكوك الخارجية بشأن النظام البيئي المغلق من خلال إعادة إنتاج التكنولوجيا، بل يوفر للمطورين أيضًا "مفتاحًا رئيسيًا" لبناء كيانات ذكية بتكلفة منخفضة من خلال التصميم المعياري وتكامل سلسلة الأدوات.

في الوقت الحاضر، أطلقت HyperAI برنامجين تعليميين: "استخدام vLLM لنشر QwQ-32B" و"OpenManus + QwQ-32B لتنفيذ AI Agent". تعال وجربها~

نشر QwQ-32B باستخدام vLLM

الاستخدام عبر الإنترنت:https://go.hyper.ai/8nPfC


OpenManus + QwQ-32B ينفذ AI Agent

الاستخدام عبر الإنترنت:https://go.hyper.ai/GIX1H

من 10 مارس إلى 15 مارس، تم تحديث الموقع الرسمي لـ hyper.ai بسرعة:

* مجموعات البيانات العامة عالية الجودة: 10

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 4

* اختيار المقالات المجتمعية: 6 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات مع الموعد النهائي في مارس: 4

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات الرياضيات المعززة للتعلم الرياضي الكبير

Big-Math عبارة عن مجموعة بيانات رياضية عالية الجودة وواسعة النطاق مصممة لتطبيق التعلم المعزز (RL) في نماذج اللغة. تحتوي مجموعة البيانات على أكثر من 250 ألف مسألة رياضية عالية الجودة، ولكل منها إجابة يمكن التحقق منها.

الاستخدام المباشر:https://go.hyper.ai/qtlbQ

مثال لمجموعة البيانات

2. مجموعة بيانات JMED الطبية الصينية الحقيقية

مجموعة بيانات JMED هي مجموعة بيانات جديدة تعتمد على توزيع البيانات الطبية في العالم الحقيقي. يتم الحصول على مجموعة البيانات من محادثات مجهولة بين الطبيب والمريض في مستشفى JD Health على الإنترنت ويتم تصفيتها للاحتفاظ بالاستشارات التي تتبع سير عمل تشخيصي موحد.

الاستخدام المباشر:https://go.hyper.ai/FjZsa

مخطط تدفق إنشاء مجموعة البيانات

3. مجموعة بيانات الاستدلال متعدد الوسائط R1-Onevision

تم تصميم مجموعة بيانات R1-Onevision لتزويد النماذج بقدرات تفكير متعددة الوسائط متقدمة. ويعمل على سد الفجوة بين الفهم البصري والنصي من خلال مهام التفكير الغنية والواعية للسياق في مجالات متعددة مثل المشاهد الطبيعية والعلوم والمشكلات الرياضية والمحتوى القائم على التعرف الضوئي على الحروف والرسوم البيانية المعقدة.

الاستخدام المباشر:https://go.hyper.ai/jLbSI

بنية مجموعة البيانات

4. مجموعة بيانات الاستدلال الطبيعي

مجموعة بيانات NaturalReasoning هي مجموعة بيانات استدلالية واسعة النطاق وعالية الجودة تحتوي على 2.8 مليون سؤال صعب تغطي مجالات متعددة مثل مجالات العلوم والتكنولوجيا والهندسة والرياضيات (مثل الفيزياء وعلوم الكمبيوتر) والاقتصاد والعلوم الاجتماعية وما إلى ذلك. تهدف مجموعة البيانات إلى توليد أسئلة استدلالية متنوعة وصعبة وإجاباتها المرجعية من خلال الاستفادة من مجموعات البيانات المدربة مسبقًا ونماذج اللغة الكبيرة (LLMs) دون الحاجة إلى تعليقات بشرية إضافية.

الاستخدام المباشر:https://go.hyper.ai/Mb6Cd

مخطط تخطيطي لبناء مجموعة البيانات

5. مجموعة بيانات مجموعة نواة AI-CUDA-Engineer-Archive

مجموعة بيانات AI-CUDA-Engineer-Archive عبارة عن مجموعة من نوى CUDA التي تم إنشاؤها بواسطة الذكاء الاصطناعي، والتي تهدف إلى تسهيل التدريب اللاحق للنماذج مفتوحة المصدر وتطوير وحدات وظيفة CUDA أفضل. تحتوي مجموعة البيانات على أكثر من 30000 نواة CUDA، والتي تم إنشاؤها جميعًا بواسطة مهندسي CUDA المعتمدين على الذكاء الاصطناعي، وقد تم التحقق من صحة أكثر من 17000 نواة منها، وحوالي 50% من النوى تتفوق على وقت التشغيل الأصلي لـ PyTorch.

الاستخدام المباشر:https://go.hyper.ai/3lPrI

مثال لمجموعة البيانات

6. مجموعة بيانات الكيمياء الكمومية QM9

مجموعة بيانات QM9 عبارة عن مجموعة بيانات كيمياء كمية مستخدمة على نطاق واسع، وتحتوي على نتائج حسابات كيمياء كمية لنحو 134 ألف جزيء عضوي صغير. تتكون هذه الجزيئات من عناصر الكربون والهيدروجين والنيتروجين والأكسجين والفلور، ويبلغ وزنها الجزيئي لا يزيد عن 900 دالتون.

الاستخدام المباشر:https://go.hyper.ai/PZdz7

7. مجموعة بيانات التكوين الجزيئي ثلاثية الأبعاد GEOM-Drugs

مجموعة بيانات GEOM-Drugs عبارة عن مجموعة بيانات كبيرة للتكوين الجزيئي ثلاثي الأبعاد تحتوي على 430,000 جزيء، يحتوي كل منها على 44 ذرة في المتوسط. بعد معالجة البيانات، يمكن أن يحتوي كل جزيء على ما يصل إلى 181 ذرة. في التجربة، جمع الباحثون 30 من أدنى مستويات الطاقة لكل جزيء وطلبوا من كل طريقة أساسية إنشاء مواضع ثلاثية الأبعاد وأنواع الذرات المكونة لهذه الجزيئات.

الاستخدام المباشر:https://go.hyper.ai/5B3U8

8. مجموعة بيانات الكهانة الصينية في فنغ شوي

تحتوي مجموعة البيانات على 207 سؤالاً حول فنغ شوي، وبازي، وما إلى ذلك، وكل سؤال لديه إجابة فريدة مقابلة.

الاستخدام المباشر:https://go.hyper.ai/31k1P

9. مجموعة بيانات معايير تقييم مجالات التخصص SuperGPQA

SuperGPQA عبارة عن مجموعة بيانات معيارية لتقييم أداء أنظمة الإجابة على الأسئلة المتقدمة. يركز على مجالات معالجة اللغة الطبيعية وتقييم التعلم الآلي، ويهدف إلى اختبار قدرة التفكير ومستوى المعرفة للنموذج من خلال أسئلة معقدة متعددة التخصصات. تغطي مجموعة البيانات 285 مجالًا دراسيًا على مستوى الدراسات العليا مع أنواع مختلفة من الأسئلة، بما في ذلك علم الأحياء والفيزياء والكيمياء وغيرها من المجالات العلمية.

الاستخدام المباشر:https://go.hyper.ai/oP1pb

10. olmOCR-mix-0225 مجموعة بيانات مستندات PDF واسعة النطاق

olmOCR-mix-0225 عبارة عن مجموعة بيانات مستندات PDF عالية الجودة وواسعة النطاق مصممة لتدريب نماذج التعرف الضوئي على الحروف (OCR) وتحسينها. تحتوي مجموعة البيانات على حوالي 250 ألف صفحة من محتوى PDF، تغطي أنواعًا مختلفة مثل الأوراق الأكاديمية والمستندات القانونية والأدلة. لا تحتوي مجموعة البيانات على محتوى نصي فحسب، بل تستخرج أيضًا معلومات إحداثيات العناصر البارزة (مثل كتل النص والصور) في كل صفحة. يتم حقن هذه المعلومات بشكل ديناميكي في موجه النموذج، مما يقلل بشكل كبير من هلوسات النموذج.

الاستخدام المباشر:https://go.hyper.ai/dXNkk

دروس تعليمية عامة مختارة

1. نشر QwQ-32B-AWQ بنقرة واحدة

QwQ-32B هو نموذج الاستدلال لسلسلة Qwen. وبالمقارنة مع نماذج ضبط التعليمات التقليدية، يتمتع QwQ بقدرات التفكير والاستدلال، ويمكنه تحقيق تحسينات كبيرة في الأداء في المهام اللاحقة، وخاصة المشكلات الصعبة. وهو قابل للمقارنة مع نماذج الاستدلال المتقدمة مثل DeepSeek-R1 و o1-mini.

لقد تم نشر النماذج والتبعيات ذات الصلة بهذا المشروع. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب.

تشغيل عبر الإنترنت:https://go.hyper.ai/Q8HmJ

مثال توضيحي

2. نشر QwQ-32B باستخدام vLLM

vLLM هو إطار عمل مفتوح المصدر مصمم للنشر الفعال لنماذج اللغة الكبيرة. تعمل تقنيتها الأساسية على تقليل عتبة الأجهزة اللازمة لاستدلال النموذج بشكل كبير من خلال تحسين إدارة الذاكرة وكفاءة الحوسبة. يستخدم هذا البرنامج التعليمي vLLM لنشر نموذج QwQ-32B لتقليل تكاليف النشر بشكل أكبر وتلبية احتياجات السيناريوهات الأكثر تفاعلية.

لقد تم نشر النماذج والتبعيات ذات الصلة بهذا المشروع. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب.

تشغيل عبر الإنترنت:https://go.hyper.ai/8nPfC

مثال توضيحي

3.OpenManus + QwQ-32B ينفذ وكيل الذكاء الاصطناعي

OpenManus هو مشروع مفتوح المصدر أطلقه فريق MetaGPT. ويهدف إلى تكرار الوظائف الأساسية لـ Manus وتزويد المستخدمين بحل وكيل ذكي يمكن نشره محليًا دون رمز دعوة.

انتقل إلى الموقع الرسمي لاستنساخ الحاوية وبدء تشغيلها، وأدخل مساحة العمل، وأدخل الأوامر المقابلة لتجربة النموذج.

تشغيل عبر الإنترنت:https://go.hyper.ai/GIX1H

غلاف GIF
لعبة صغيرة تم إنشاؤها بواسطة النموذج

4. نموذج توليد الكلام اللهجي على مستوى الإنتاج Step-Audio-TTS-3B

Step-Audio هو أول نظام حوار صوتي مفتوح المصدر على مستوى المنتج في الصناعة والذي يدمج فهم الكلام والتحكم في التوليد. تم إطلاقه مفتوح المصدر بواسطة فريق Stepfun-AI في عام 2025. وهو يدعم إنشاء لغات متعددة (مثل الصينية والإنجليزية واليابانية)، والعواطف الصوتية (مثل السعادة والحزن)، واللهجات (مثل لهجة الكانتونية والسيتشوان). يمكنه التحكم في سرعة الكلام والنمط الإيقاعي، ويدعم RAP والهمهمة، وما إلى ذلك.

انتقل إلى الموقع الرسمي لاستنساخ الحاوية وبدء تشغيلها، وانسخ عنوان API مباشرةً، ويمكنك إجراء توليف كلامي متعدد الوظائف.

تشغيل عبر الإنترنت:https://go.hyper.ai/WiyVK

مثال على تركيب الكلام

مقالات المجتمع

1. يصل معدل الدقة إلى 97%. يعتمد الإنجاز الجديد للفريق الأسترالي على التعلم العميق لتحديد الجنس من خلال التصوير المقطعي المحوسب للجمجمة، متجاوزًا بذلك أطباء الطب الشرعي البشري.

واقترح فريق من جامعة غرب أستراليا ومؤسسات أخرى استخدام إطار عمل آلي يعتمد على التعلم العميق. استخدمت الدراسة 200 صورة مقطعية للجمجمة من مستشفى في إندونيسيا لتدريب واختبار ثلاثة تكوينات شبكية تعتمد على التعلم العميق. كان إطار التعلم العميق الأكثر دقة قادرًا على الجمع بين ميزات الجنس والجمجمة للحكم، بدقة تصنيف 97%، وهي أعلى بكثير من 82% للمراقبين البشريين. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد التقرير الكامل:https://go.hyper.ai/0rfjM

2. باستخدام سعر المساكن البالغ 1.7 ألف وحدة سكنية في شنتشن كمثال، يستخدم مختبر نظم المعلومات الجغرافية بجامعة تشجيانغ آلية الانتباه لاستخراج سمات السياق الجغرافي وتحسين دقة الانحدار المكاني غير الثابت

اقترح باحثون من مختبر GIS الرئيسي في مقاطعة تشجيانغ نموذج التعلم العميق CatGWR استنادًا إلى آلية الانتباه. يقدم النموذج آلية انتباه لدمج المسافة المكانية والتشابه السياقي بين العينات لتقدير عدم الثبات المكاني بشكل أكثر دقة. وهذا يوفر آفاقًا جديدة للنمذجة الجغرافية المكانية، وخاصة عند التعامل مع الظواهر الجغرافية المعقدة، ويمكنه التقاط التباين المكاني والتأثيرات السياقية بشكل أفضل. هذه المقالة عبارة عن تفسير مفصل ومشاركة للبحث.

شاهد التقرير الكامل:https://go.hyper.ai/irDAo

3. تغطي مجموعات بيانات الاستدلال عالية الجودة الرياضيات/الترميز/العلوم/الألغاز، ويتم تلخيصها للمساعدة في إعادة إنتاج قدرات الاستدلال القوية في DeepSeek

قامت HyperAI بتجميع مجموعات بيانات الاستدلال الأكثر شيوعًا بعناية، والتي تغطي مجالات متعددة مثل الرياضيات والبرمجة والعلوم والألغاز وما إلى ذلك. بالنسبة للممارسين والباحثين الذين يرغبون في تحسين قدرات الاستدلال للنماذج الكبيرة بشكل كبير، فإن مجموعات البيانات هذه تُعد بلا شك نقطة انطلاق ممتازة. هذه المقالة هي عنوان تنزيل مجموعة البيانات.

شاهد التقرير الكامل:https://go.hyper.ai/XGIi8

4. تم اختياره لـ ICLR 2025! اقترح شين تشون هوا وآخرون من جامعة تشجيانغ تقنية محاذاة بولتزمان، ووصلت توقعات الطاقة الحرة المرتبطة بالبروتين إلى SOTA

وقد اقترحت جامعة تشجيانغ وآخرون تقنية تسمى محاذاة بولتزمان، والتي تنقل المعرفة من نموذج الطي العكسي المدرب مسبقًا إلى التنبؤ بالطاقة الحرة الملزمة. وقد تم تنفيذ هذه الطريقة على مستوى متفوق وتم تضمينها في ICLR 2025، وهو المؤتمر الأكاديمي الدولي الأبرز في مجال الذكاء الاصطناعي. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد التقرير الكامل:https://go.hyper.ai/MsUDj

5. معلمات النموذج تتجاوز انتشار الترددات الراديوية بخمس مرات! أطلقت NVIDIA وشركات أخرى Proteina، وهو هيكل أساسي للبروتين مصمم من الصفر مع أداء SOTA

قامت شركة NVIDIA، بالتعاون مع معهد ماساتشوستس للتكنولوجيا وشركات أخرى، بتطوير نوع جديد من مولدات العمود الفقري للبروتين المتدفق على نطاق واسع، Proteina. تحتوي شركة Proteina على خمسة أضعاف عدد معلمات نموذج RFdiffusion، كما قامت بتوسيع بيانات التدريب الخاصة بها إلى 21 مليون بنية بروتينية اصطناعية. وقد حققت أداء SOTA في تصميم العمود الفقري للبروتين الجديد وأنشأت بروتينات متنوعة وقابلة للتصميم بطول غير مسبوق يصل إلى 800 بقايا. وقد تم اختيار نتائجها لـ ICLR 2025 الشفوي. هذه المقالة عبارة عن تفسير مفصل ومشاركة للبحث.

شاهد التقرير الكامل:https://go.hyper.ai/n4fWv

6. ذكر تقرير عمل الحكومة "الذكاء الاصطناعي +" مرة أخرى، وركزت مقترحات قادة التكنولوجيا في الجلستين على الذكاء الاصطناعي + الرعاية الطبية / الذكاء الاصطناعي لتغيير الوجه والصوت / أوهام النماذج الكبيرة...

لقد تابع لي جون وتشو هونغ يي وليو تشينغفينج وقادة الصناعة الآخرون نبض العصر عن كثب وطرحوا بنشاط مقترحات واقتراحات في العديد من المجالات الرئيسية مثل المركبات ذات الطاقة الجديدة، والهلوسة النموذجية الكبيرة، والرعاية الطبية بالذكاء الاصطناعي، وتغيير الوجه بالذكاء الاصطناعي، والتعليم بالذكاء الاصطناعي. انظر أدناه لمزيد من التفاصيل.

شاهد التقرير الكامل:https://go.hyper.ai/EazuY

مقالات موسوعية شعبية

1. دال-إي

2. دمج الفرز المتبادل RRF

3. جبهة باريتو

4. فهم اللغة متعدد المهام على نطاق واسع (MMLU)

5. التعلم التبايني

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event


إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!