HyperAIHyperAI

Command Palette

Search for a command to run...

نVIDIA تُبسط استدلال الذكاء الاصطناعي في مراكز البيانات عبر تكاملات دينامو وغرو브

تُعد التطورات في مجال استدلال الذكاء الاصطناعي من أبرز التحديات التي تواجه مزودي الخدمات والشركات في عصر النماذج المعقدة والتعاونية. مع ازدياد حجم النماذج وتعقيدها، أصبحت الحاجة إلى تكامل موارد الحوسبة على مستوى المصفوفات ضرورة لتقديم استجابات سريعة وفعالة لآلاف المستخدمين في آن واحد. في هذا السياق، تبرز منصة NVIDIA Dynamo كحل متكامل يُمكّن من إدارة استدلال الذكاء الاصطناعي على نطاق متعدد العقد باستخدام Kubernetes، التي أصبحت المعيار الصناعي لإدارة التطبيقات المُحَوَّلة إلى حاويات. تُعد خدمة التفكيك المُتعددة العقد أو ما يُعرف بـ disaggregated serving من أبرز الابتكارات التي تُحسّن الأداء من خلال توزيع مراحل معالجة النموذج بين وحدات معالجة مخصصة. ففي حين كانت المراحل السابقة مثل معالجة المدخلات (prefill) وإنشاء المخرجات (decode) تُنفَّذ على نفس وحدة المعالجة، أصبح من الممكن الآن تخصيص وحدات مختلفة لكل مرحلة وفقًا لأفضل تقنيات الأداء. هذا يقلل من الازدحام ويعزز كفاءة استخدام الموارد، خصوصًا في النماذج الكبيرة مثل DeepSeek-R1. تُسهم منصة NVIDIA Dynamo في تبسيط هذا التحول من خلال دمج ميزات مثل التوسيع متعدد المستويات، وجدولة متميزة واعية بالهندسة المعمارية، وتحديثات متماسكة وآمنة. وتمكّن هذه الميزات من إدارة مجموعات مترابطة من المكونات مثل مُحَوِّلات المدخلات، مُحَوِّلات المخرجات، مُحَوِّلات الذاكرة، ونُظم التوجيه. من أبرز مكونات Dynamo هو NVIDIA Grove، وهو واجهة برمجة تطبيقات مفتوحة المصدر مُدمجة في منصة Dynamo تُمكّن المطورين من وصف النظام ككل بتمثيل موحد. بدلًا من التعامل مع ملفات YAML معقدة أو سكربتات مخصصة، يمكن للمستخدم تحديد متطلبات النظام ببساطة مثل: "أحتاج ثلاث عقد لمعالجة المدخلات وستة لاستخراج المخرجات، مع ضمان وحدة اتصال عالية السرعة بين المكونات". تُعالج Grove هذه المحددات تلقائيًا من خلال جدولة متميزة، وضبط ترتيب بدء المكونات، وضمان توزيع مثالي في الشبكة. أظهرت اختبارات InferenceMAX من SemiAnalysis أن استخدام Grove مع أنظمة GB200 NVL72 يُقلل التكلفة لكل مليون رمز مُنتَج مقارنةً بمنصات أخرى. كما نجح مزود الخدمة Baseten في تضخيم أداء استدلال النماذج بعوامل 1.6 في القدرة و2 في السرعة دون الحاجة إلى معدات إضافية. تُستخدم هذه التقنيات في مراكز البيانات الكبرى والمنصات السحابية، حيث تُدمج Dynamo مع خدمات Kubernetes المُدارة من قبل مزودي السحابة الرئيسيين. تُعد Nebius مثالًا على منصة سحابية تُبنى على بنية NVIDIA مُسرّعة وتعمل مع Dynamo لتقديم استدلال مُتعدد العقد بسعة تصل إلى مئات العقد. تُعد Grove مفتوحة المصدر ومتاحة على GitHub، وتمكّن المطورين من تجربتها ضمن بيئة Dynamo أو كمكون مستقل. تُستخدم في مشاريع متعددة تشمل أنظمة عميلة متعددة النماذج، وأنظمة استدلال متعددة الوظائف، وتُسهّل بناء أنظمة ذكية معقدة بسهولة وفعالية. في مؤتمر KubeCon 2025 في أتلانتا، ستُعرض هذه التقنيات بشكل عملي، حيث يدعو NVIDIA المطورين لتجربة Grove وتقديم مساهمات وتعليقات لتحسين النظام. هذه الخطوة تمثل تحولًا جوهريًا في كيفية إدارة الاستدلال الذكي على نطاق البيانات المركزية، حيث أصبحت المصفوفات متعددة العقد غير مجرد خيار تقني بل ضرورة لمستقبل الذكاء الاصطناعي.

الروابط ذات الصلة