HyperAI

في محاولة لحل التحديات المعقدة في تصميم النماذج الذكية، تقدم NVIDIA Research نهجًا مبتكرًا يعتمد على تدريب نماذج صغيرة تُعرف بـ"المنسق" (orchestrator) لتنظيم عمل نماذج وتقنيات متعددة. بدلًا من الاعتماد على نماذج ضخمة تُدير المهام وحدها، يُستخدم نموذج صغير مُدرَّب بذكاء لاتخاذ قرارات ذكية حول أي نموذج أو أداة يجب استخدامها، ومتى، وبأي ترتيب، بناءً على تفضيلات المستخدم (السرعة، التكلفة، الدقة). يُعدّ هذا النهج مفاجئًا، لكنه فعّال: النماذج الصغيرة، بفضل حجمها المحدود، تُدرَّب على استخلاص جوهر التفكير الاستراتيجي، مما يجعلها مثالية لدور المُنسق. لبناء هذه النماذج، طوّرت NVIDIA منهج ToolOrchestra، الذي يتضمن توليد بيانات اصطناعية، تدريب متعدد الأهداف باستخدام التعلم القائم على المكافآت (reinforcement learning)، وتقييم دقيق. النتيجة: نموذج Orchestrator-8B، صغير الحجم، تفوق في أداءه على نماذج ضخمة جدًا مثل GPT-5 وClaude Opus 4.1 وLlama-3.3-70B، في مهام صعبة مثل Humanity’s Last Exam وFRAMES وτ²-Bench. ورغم حجمه الصغير، حقق أداءً أفضل من حيث الدقة، وانخفضت التكلفة والوقت اللازم للحل بشكل كبير. حتى عند تقييد عدد التفاعلات (المحادثات) إلى 10 أو 20، ظل Orchestrator-8B يتفوق، مع تقليل التكلفة بنسبة تصل إلى 80% مقارنةً بالمنافسين. لتدريب نموذج مُنسق خاص بك، لا يلزم سوى نموذج لغة صغير (مثل Qwen3-8B)، وبيانات مُولَّدة اصطناعيًا (بما يكفي 552 مسألة و1296 مُدخلًا)، وشفرة تدريب مفتوحة المصدر. يُمكنك اختيار النموذج، توليد المهام الاصطناعية، وبدء التدريب باستخدام أدوات مُتاحة، مع مراقبة التقدم عبر أدوات مثل wandb. الإرادة وراء هذا النهج تكمن في تقليل التعقيد الهندسي في بناء نماذج ذكية. فبدلاً من تجربة مئات التوافقيات اليدوية (نوع النموذج، عدد التفاعلات، استخدام الأدوات)، يُسَنَّن المُنسق المهمة بذكاء، مُوازِنًا بين الأداء والتكلفة. هذا يُشكّل خطوة جوهرية نحو "أنظمة ذكية مركبة" (compound AI systems)، حيث تُدمج نماذج صغيرة ومتعددة بذكاء لحل مهام معقدة، بدلًا من الاعتماد على نموذج واحد ضخم. ويدلّ هذا على أن مستقبل الذكاء الاصطناعي لا يكمن في تكبير النماذج فقط، بل في توظيفها بذكاء. Orchestrator-8B ليس مجرد تجربة ناجحة، بل دليلًا على أن النماذج الصغيرة، إذا تدربت بذكاء، يمكنها أن تكون أقوى من النماذج الكبيرة في المهام الحقيقية.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

Command Palette

تدريب وكلاء توليف صغيرين لحل المشكلات الكبيرة

الروابط ذات الصلة

Command Palette

تدريب وكلاء توليف صغيرين لحل المشكلات الكبيرة

الروابط ذات الصلة

Command Palette

تدريب وكلاء توليف صغيرين لحل المشكلات الكبيرة

الروابط ذات الصلة