HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA Dynamo تدعم أدوات وتدفق الرموز المتعدد

أعلنت شركة إنفيديا عن تحسينات جوهرية في محرك "دينامو" (Dynamo) لخدمة نماذج الذكاء الاصطناعي، مما يسمح بتشغيل عمليات الوكلاء الآليين (Agentic Workflows) بكفاءة وموثوقية أعلى. تركز هذه التحديثات على معالجة التحديات المتعلقة بتدفق الرموز (Streaming Tokens) ودعم التفاعلات متعددة الأدوار التي تتضمن استدعاء أدوات وتفسير المنطق الداخلي للنموذج. في بيئة الوكلاء الآليين، يجب أن يحافظ النموذج على تفاعل منظم حيث تتداخل خطوات التفكير مع استدعاءات الأدوات، ثم تعود النتائج في الجولات اللاحقة. تواجه المحركات التقليدية صعوبات في الحفاظ على سياق المنطق المنفصل أو إعادة بنائه بشكل صحيح بين الجولات. حددت إنفيديا ثلاثة مجالات رئيسية للتحسين: استعادة الكاش (Cache Reuse)، ودقة تحليل المنطق والأدوات، وتحسين تجربة المستخدم من خلال التدفق الفوري للبيانات. أحد التحديات التقنية الكبرى كان يتعلق باستقرار مقدمة الطلب (Prompt Stability). في بعض التكوينات، يتم إضافة رؤوس فواتير خاصة بالجلسة لكل طلب، مما يؤدي إلى تغيير بايت الأول من النص المدخل. هذا التغيير يمنع إعادة استخدام ذاكرة التخزين المؤقت للكاش (KV Cache) حتى لو كان المحتوى الأساسي ثابتًا، مما يتسبب في زيادة وقت انتظار الرمز الأول (TTFT) بنسبة تصل إلى 5 أضعاف. قامت إنفيديا بحل هذه المشكلة بإضافة خيار يزيل الرؤوس غير المستقرة قبل الترميز، مما يعيد استخدام الكاش ويقلل زمن الانتظار بشكل كبير. بالإضافة إلى ذلك، واجهت المحرك صعوبات في معالجة المنطق المنفصل (Reasoning) بشكل صحيح عند الانتقال بين الجولات. في بعض النماذج، يجب الاحتفاظ بخطوات التفكير التي تسبق استدعاء الأدوات لتفسيرها، بينما في نماذج أخرى يتم تجاهلها. قمت إنفيديا بتطوير parsers مخصصة لفصل تدفق المنطق عن استدعاءات الأدوات دون خلطها، مما يضمن بقاء السياق ذا صلة في الجولات التالية. كما تم تحسين نظام التدفق (Streaming) بحيث لا تنتظر واجهة المستخدم (Harness) نهاية الرد الكامل لاستقبال استدعاءات الأدوات، بل يتم إصدارها فورًا كحدث مخصص، مما يسرع استجابة النظام. تطورت إنفيديا أيضًا لزيادة التوافق الدقيق مع واجهات برمجة تطبيقات مثل Anthropic وOpenAI، خاصة لأدوات مثل Claude Code وOpenClaw وCodex. أظهرت الاختبارات أن مجرد مطابقة البنية الأساسية للبيانات (Schema) لا يكفي، بل يجب مطابقة السلوكيات الدقيقة مثل حدود اقتطاع مخرجات الأدوات (Tool-output truncation) وإعدادات المنطق. عند استخدام ملفات تعريف النموذج (Model Catalogs) بشكل صحيح، زاد عدد استدعاءات الأدوات بدقة ملحوظة مقارنة بالاستخدام الافتراضي غير المضبوط، مما يعني قدرة أفضل للوكلاء على حل المهام المعقدة. في الختام، تتيح هذه التحديثات لإنفيديا تقديم حلول سحابية أكثر قوة للوكلاء الآليين، مع فصل طبقات البروتوكول والمحلل والمقاسم ككتل قابلة لإعادة الاستخدام. تهدف هذه الخطوة إلى تمكين الفرق من بناء أنظمة مخصصة دون الحاجة لنسخ الأكواد الداخلية، مما يهيئ البنية التحتية لأنظمة ذكاء اصطناعي طويلة الأمد وفعالة مثل "AutoResearch".

الروابط ذات الصلة

NVIDIA Dynamo تدعم أدوات وتدفق الرموز المتعدد | القصص الشائعة | HyperAI