HyperAI

تم زيادة سرعة الاستدلال بمقدار 1.7 مرة، تم إصدار الإصدار vLLM V1! تم إطلاق أول معيار منطقي متعدد الوسائط خطوة بخطوة VRC-Bench مع أكثر من 4 آلاف خطوة توضيحية

特色图像

في الشهر الماضي، وعلى خلفية زيادة الطلب على استدلال النماذج الكبيرة، أعلن إطار عمل استدلال النماذج الكبيرة للذكاء الاصطناعي vLLM رسميًا عن إصدار v1.0. بالمقارنة مع الإصدارات السابقة، تم تحسين كفاءة الحوسبة بشكل كبير، وأصبح تصميم واجهة برمجة التطبيقات أكثر استقرارًا، وتم إطلاق العنان لإمكانات الأجهزة بالكامل، وتم زيادة سرعة الاستدلال بمقدار 1.7 مرة! إنه يوفر دعمًا أقوى للنشر الفعال للنماذج التي تحتوي على عشرات المليارات من المعلمات.

في الوقت الحالي،تم إطلاق البرنامج التعليمي التمهيدي لـ vLLM على الموقع الرسمي لـ hyper.ai، والذي سيأخذك من التثبيت إلى التشغيل، حتى تتمكن من إتقان vLLM بسرعة!

دليل البدء في برنامج vLLM:https://go.hyper.ai/qHl62

لمزيد من مستندات ودورات vLLM الصينية، يرجى زيارة → https://vllm.hyper.ai

من 5 فبراير إلى 14 فبراير، تحديثات الموقع الرسمي لـhyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 6

* اختيار المقالات المجتمعية: 5 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات مع الموعد النهائي في فبراير: 3

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات معيار التفكير البصري VRC-Bench

تغطي مجموعة البيانات التحديات في ثمانية مجالات مختلفة، بما في ذلك التفكير البصري، والتفكير الرياضي والمنطقي، والتفكير العلمي، والفهم الثقافي والاجتماعي، وما إلى ذلك. وتحتوي على أكثر من 4 آلاف خطوة تفكير تم التحقق منها يدويًا، والتي يمكنها تقييم دقة وتماسك النموذج المنطقي بشكل شامل في التفكير متعدد الخطوات.

الاستخدام المباشر:https://go.hyper.ai/AV43N

مثال على البيانات

2. مجموعة بيانات Terra متعددة الوسائط المكانية والزمانية

Terra هي مجموعة بيانات مكانية زمنية متعددة الوسائط ذات تغطية عالمية، وتوفر 45 عامًا من البيانات المكانية الزمنية في جميع أنحاء العالم، وتغطي 6.48 مليون نقطة شبكة عالية الدقة، وتهدف إلى تعزيز الأبحاث المستقبلية في مجال استخراج البيانات المكانية الزمنية وتعزيز تحقيق الذكاء المكاني الزمني الأوسع.

الاستخدام المباشر:https://go.hyper.ai/9eev3

مكونات Terra النموذجية المختلفة

3. مجموعة بيانات تقييم لعبة البوكر PokerBench

تحتوي مجموعة البيانات على 11 ألف مشهد رئيسي، مقسمة إلى 1000 مشهد قبل الدخول في اللعبة و10 آلاف مشهد بعد الدخول في اللعبة، وتغطي مجموعة واسعة من مواقف اللعبة وهي مصممة لتقييم أداء نماذج اللغة الكبيرة (LLMs) في ألعاب البوكر المعقدة والاستراتيجية.

الاستخدام المباشر:https://go.hyper.ai/HK73H

نظرة عامة على البيانات

4. تفاصيل معالم الجذب السياحي في المدن الصينية - مجموعة بيانات معلومات المعالم السياحية في المدن الصينية

تحتوي مجموعة البيانات هذه على بيانات مناطق الجذب السياحي من 352 مدينة في الصين. يحتوي ملف csv لكل مدينة على 100 موقع. تتضمن البيانات اسم الموقع، وموقع الويب، والعنوان، ومقدمة المعالم السياحية، وساعات العمل، وعنوان URL للصورة، والتقييم، ومدة الزيارة الموصى بها، وموسم الزيارة الموصى به، ومعلومات التذاكر، والنصائح، وغيرها من المعلومات.

الاستخدام المباشر:https://go.hyper.ai/uZ5Wh

5. مجموعة بيانات فيديو لعبة GF-Minecraft

تقوم مجموعة البيانات هذه بتجميع 70 ساعة من مقاطع فيديو الألعاب من خلال تنفيذ تسلسلات عمل عشوائية محددة مسبقًا وشرحها. تم تكوين مجموعة البيانات مسبقًا بثلاث مناطق حيوية (الغابات والسهول والصحراء)، وثلاث ظروف جوية (صافي، ممطر، عاصفة رعدية)، و6 فترات زمنية (على سبيل المثال، شروق الشمس، الظهيرة، منتصف الليل)، مما يؤدي إلى إنشاء أكثر من 2 كيلو مقطع فيديو.

الاستخدام المباشر:https://go.hyper.ai/25DAe

6. مجموعة بيانات الضبط الدقيق للثقافة الوطنية التابعة لمركز NCIFD

تُعد مجموعة البيانات هذه مجموعة بيانات لضبط الثقافة الوطنية للنماذج الكبيرة، وتحتوي على 151,159 عنصر بيانات، تغطي سبعة مجالات رئيسية: الهندسة المعمارية، والملابس، والحرف اليدوية، والطعام، وآداب السلوك، واللغة، والعادات.

الاستخدام المباشر:https://go.hyper.ai/Vd6ZP

7. مجموعة بيانات التدريب على الاستدلال الرياضي من AceMath Instruct

هذه المجموعة من البيانات هي مجموعة بيانات أصدرتها NVIDIA في عام 2025 لتدريب نموذج AceMath، بهدف تحسين أداء النموذج في مهام التفكير الرياضي.

الاستخدام المباشر:https://go.hyper.ai/pT5Tr

8. مجموعة بيانات تقييم استدعاءات الوظائف المعقدة ComplexFuncBench

تغطي مجموعة البيانات 1000 عينة من استدعاءات الوظائف المعقدة في 5 سيناريوهات واقعية، بما في ذلك 600 عينة من نطاق واحد، و150 عينة من كل من الفنادق والرحلات الجوية وتأجير السيارات والمعالم السياحية، و400 عينة من نطاقات متعددة. يحتوي نطاق التاكسي على وظيفتين فقط، لذا يتم استخدامه عبر النطاقات فقط.

الاستخدام المباشر:https://go.hyper.ai/v0p4c

9. مجموعة بيانات تخطيط السفر TravelPlanner

تحتوي مجموعة البيانات على 1225 خطة تخطيطية وخطط مرجعية مختارة. تم إعداد مجموعة البيانات في سياق تخطيط السفر وتتطلب من وكيل اللغة إنشاء خطة سفر شاملة بناءً على استعلام معين، بما في ذلك النقل والوجبات اليومية والمعالم السياحية والإقامة.

الاستخدام المباشر:https://go.hyper.ai/22AhZ

10. مجموعة بيانات المركبات غير العضوية لبيانات الذوبان المائي

تحتوي مجموعة البيانات هذه على بيانات تجريبية حول ذوبان مئات المركبات غير العضوية في الماء. تم الحصول على البيانات من مراجع متعددة وهي مناسبة لمجال معلوماتية المواد. يتم التعبير عن جميع بيانات الذوبان بالجرام من المواد المذابة لكل 100 جرام من الماء.

الاستخدام المباشر:https://go.hyper.ai/dqL1y

دروس تعليمية عامة مختارة

1. دليل البدء في برنامج vLLM: دليل خطوة بخطوة للمبتدئين

vLLM هو إطار عمل مصمم خصيصًا لتسريع عملية التفكير في نماذج اللغة الكبيرة. وقد حظيت باهتمام واسع النطاق في جميع أنحاء العالم بسبب كفاءتها الممتازة في التفكير وقدراتها على تحسين الموارد. قام الباحثون ببناء محرك خدمة LLM عالي الإنتاجية vLLM، وحققوا هدرًا شبه معدوم لذاكرة التخزين المؤقت KV، وحلوا مشكلة عنق الزجاجة لإدارة الذاكرة في التفكير في نموذج اللغة الكبير.

يوضح لك هذا البرنامج التعليمي خطوة بخطوة كيفية تكوين وتشغيل vLLM، ويوفر دليلاً كاملاً للبدء من التثبيت حتى بدء التشغيل. انقر على الرابط أدناه واتبع البرنامج التعليمي لنشر vLLM.

تشغيل عبر الإنترنت:https://go.hyper.ai/qHl62

نشر vLLM

2. نشر Qwen2.5-Coder بنقرة واحدة

Qwen2.5-Coder هو مساعد ذكاء اصطناعي يتمتع بقدرات قوية على توليد التعليمات البرمجية. إنه يدعم إخراج التعليمات البرمجية بمنطق واضح وقواعد نحوية موحدة، ويوفر وظيفة Artifacts لمساعدة المستخدمين على بناء وتنفيذ مشاريع مرئية مختلفة بسرعة. فيما يتعلق بتطوير الألعاب الصغيرة، يمكن لـ Qwen2.5-Coder إنشاء كود اللعبة استنادًا إلى قواعد اللعبة وأسلوب الرسومات ومتطلبات تجربة المستخدم. يمكن للمطورين تخصيصه وتحسينه على هذا الأساس وإطلاق أعمالهم الخاصة في اللعبة بسرعة.

يمكن لهذا المشروع إنشاء واجهة تفاعلية أمامية من خلال واجهة Gradio. لقد تم نشر النماذج والتبعيات ذات الصلة. يمكنك إدخال التعليمات إلى النموذج وإنشاء الكود المطلوب بنقرة واحدة.

تشغيل عبر الإنترنت:https://go.hyper.ai/JVOTN

مثال على الحوار النموذجي

3. نموذج المحادثة الصوتية الشاملة باللغتين الصينية والإنجليزية GLM-4-Voice

GLM-4-Voice هو نموذج كلام متكامل يمكنه فهم وتوليد الكلام الصيني والإنجليزي بشكل مباشر، وإجراء محادثات صوتية في الوقت الفعلي، واتباع تعليمات المستخدم لتغيير سمات الكلام مثل العاطفة والتجويد وسرعة التحدث واللهجة.

انتقل إلى الموقع الرسمي لاستنساخ الحاوية وبدء تشغيلها، ثم انسخ عنوان API مباشرةً، ويمكنك التواصل مع النموذج.

تشغيل عبر الإنترنت:https://go.hyper.ai/s4MId

مثال توضيحي

4. Linly-Dubbing تنزيل الفيديو بنقرة واحدة + الترجمة + الدبلجة + الترجمة التوضيحية

Linly-Dubbing هي أداة دبلجة وترجمة فيديو متعددة اللغات ذكية يمكنها ترجمة محتوى الفيديو تلقائيًا إلى لغات متعددة وإنشاء ترجمات.

انقر على الرابط أدناه لبدء رحلتك الإبداعية على الفور وتحقيق الدبلجة والترجمة الذكية متعددة اللغات لمقاطع الفيديو.

تشغيل عبر الإنترنت:https://go.hyper.ai/xEAzn

معاينة الميزة

5. DrawingSpinUp: رسم شخصيات ثنائية الأبعاد → رسوم متحركة ثلاثية الأبعاد

DrawingSpinUp هي تقنية مبتكرة لإنشاء رسوم متحركة ثلاثية الأبعاد تعمل على تحويل رسومات الشخصيات المسطحة إلى رسوم متحركة ديناميكية ذات تأثيرات ثلاثية الأبعاد، مع الحفاظ بعناية على أسلوب وخصائص العمل الفني الأصلي.

اتبع خطوات البرنامج التعليمي لإنشاء رسوم متحركة ثلاثية الأبعاد واقعية ومفصلة.

تشغيل عبر الإنترنت:https://go.hyper.ai/H9fV1

مثال توضيحي

6. عرض توضيحي لتقنية التعرف على الكلام والترجمة Whisper-large-v3-turbo

Whisper هو نموذج التعرف على الكلام للأغراض العامة. يتم تدريبه على مجموعة كبيرة ومتنوعة من البيانات الصوتية ويمكنه تنفيذ مهام متعددة مثل التعرف على الكلام متعدد اللغات وترجمة الكلام.

يعد هذا البرنامج التعليمي بمثابة برنامج تعليمي للنشر بنقرة واحدة لـ whisper-large-v3-turbo. إنه أسرع بـ 8 مرات من whisper-large-v3 مع عدم فقدان الجودة تقريبًا. تم تثبيت البيئة والتبعيات ذات الصلة، ويمكنك تجربة ذلك عن طريق استنساخه وبدء تشغيله بنقرة واحدة.

تشغيل عبر الإنترنت:https://go.hyper.ai/3P9nk

مثال توضيحي

مقالات المجتمع

1. بفضل الاستثمار من NVIDIA وSamsung، تمكنت Generate من إنشاء أكثر من مليون بروتين وتطوير نموذج توليدي مصمم من الصفر

شركة Generate: Biomedicines للأدوية الحيوية القائمة على الذكاء الاصطناعي، بمنصتها البيولوجية القابلة للبرمجة الفريدة، لا تدمج الذكاء الاصطناعي في هندسة البروتين فحسب، بل تساعد العلماء أيضًا على تصميم حلول أكثر كفاءة للأهداف التي يصعب علاجها تقليديًا. أعلنت شركة Generate مؤخرًا أنها حصلت على استثمار استراتيجي من Samsung Science & Life Science Fund. والأهمية وراء هذا واضحة بذاتها. هذه المقالة عبارة عن تقرير مفصل عن الشركة، اضغط لقراءته بسرعة.

عرض ملخص الحدث:https://go.hyper.ai/fVtKK

2. عادت بيانات عالية الدقة لعظام العرافة إلى الصين، وساعد الذكاء الاصطناعي في تفسير النصوص القديمة، وتم اكتشاف صور جديدة لعظام العرافة

في السنوات الأخيرة، تم تطبيق الذكاء الاصطناعي تدريجيا وبشكل أعمق في مجال أبحاث الأدب الصيني القديم. في يونيو 2024، اقترحت جامعة أنيانغ العادية، بالتعاون مع جامعة هواتشونغ للعلوم والتكنولوجيا، وجامعة جنوب الصين للتكنولوجيا، وغيرها، نموذج انتشار مشروط مُحسَّن لفك تشفير عظام الوحي. ولم يتم اختيار النتائج لـ ACL 2024 فحسب، بل فازت أيضًا بجائزة أفضل ورقة بحثية بنجاح. ويظهر هذا أن الذكاء الاصطناعي يعمل على تسريع كفاءة عمل الباحثين. المزيد من التفاصيل حول كيفية تفسير الذكاء الاصطناعي لعظام أوراكل هي كما يلي.

شاهد التقرير الكامل:https://go.hyper.ai/xzw4c

3. ملخص لعشر مجموعات بيانات طبية صينية رئيسية: تغطي طب شينونغ الصيني، وكتب الطب الصيني القديم، والمنطق الطبي، والأسئلة والأجوبة الطبية...

لا يمكن فصل التطور السريع للذكاء الاصطناعي الطبي عن دعم مجموعات البيانات عالية الجودة. من تشخيص الأمراض إلى تطوير الأدوية إلى الطب الشخصي، تلعب مجموعات البيانات دورًا لا غنى عنه في تعزيز تطبيق الرؤية الآلية والنماذج الكبيرة وما إلى ذلك في المجال الطبي. تنظم هذه المقالة 10 مجموعات بيانات في المجال الطبي، وتغطي الطب الصيني شينونغ، وكتب الطب الصيني القديم، والمنطق الطبي، والأسئلة والأجوبة الطبية، وما إلى ذلك. يمكنك النقر للتنزيل مباشرة.

شاهد التقرير الكامل:https://go.hyper.ai/NHlJ0

4. يمكن أن يصل معدل النجاح إلى 100%. تعاونت شركة تطوير الأدوية Cellarity مع NVIDIA لتحسين الجزيئات المستهدفة استنادًا إلى التعلم التعزيزي

أدى التطور السريع للذكاء الاصطناعي إلى توفير إمكانيات جديدة لاكتشاف الأدوية. في الآونة الأخيرة، اقترح باحثون من شركة علوم الحياة Cellarity وNVIDIA طريقة مشتركة جديدة لتحسين الجزيئات المستهدفة تعتمد على التعلم التعزيزي الكامن، MOLRL، والتي أظهرت أداءً متفوقًا في المهام المتعلقة باكتشاف الأدوية، وخاصة في توليد الجزيئات المستهدفة وتحسين المعلمات المتعددة. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد التقرير الكامل:https://go.hyper.ai/YBhnM

5. البروفيسور تشنغ وي من جامعة نانكاي: ألفا فولد ليس مثاليًا، ولا يزال أمام المجتمع الأكاديمي فرصة "لتجاوز المنحنى"

في الحلقة السادسة من سلسلة البث المباشر "Meet AI4S"، شارك البروفيسور Zheng Wei، أستاذ في كلية الإحصاء وعلوم البيانات بجامعة نانكاي، مع الجميع حدود AlphaFold واتجاهات التحسين المستقبلية، بالإضافة إلى الخوارزميات ومواضيع البحث التي تستحق الاستكشاف في المجتمع الأكاديمي. انظر أدناه لمزيد من التفاصيل.

شاهد التقرير الكامل:https://go.hyper.ai/YgCip

مقالات موسوعية شعبية

1. دمج الفرز المتبادل RRF

2. معلمات النموذج

3. نظرية كولموغوروف-أرنولد للتمثيل

4. فهم اللغة متعدد المهام على نطاق واسع (MMLU)

5. التعلم التبايني

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event


إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!