HyperAI

رغم التطور الكبير في نماذج اللغة، تظل النماذج الصغيرة عاجزة عن تنفيذ المهام المعقدة التي تتطلب تفكيرًا منطقيًا دقيقًا، مثل حل ألغاز السودوكو أو كتابة براهين رياضية. في المقابل، تتفوق النماذج الكبيرة مثل GPT-4o في التخطيط، لكنها بطيئة ومستهلكة للطاقة. لحل هذه المشكلة، طوّر باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) نظامًا تعاونيًا يُسمى "DisCIPL"، يُمكّن نموذجًا كبيرًا من التخطيط، ثم توزيع المهام على نماذج صغيرة تُنفذ التعليمات بدقة. يُعدّ DisCIPL مفهومًا مبتكرًا يشبه توظيف فريق عمل: يُسند النموذج الكبير (مثل GPT-4o) توليد خطة دقيقة، ثم يُوجّه النماذج الصغيرة (مثل Llama-3.2-1B) لتنفيذ أجزاء من المهمة وفق قواعد صارمة. يتم التحقق من النتائج وتصحيحها تلقائيًا، مثلاً بتعويض عبارة غير مناسبة في قصيدة بخيار أفضل من نموذج آخر. التواصل بين النماذج يتم عبر لغة برمجة مخصصة تُسمى LLaMPPL، التي تُمكّن من تضمين قواعد صارمة (مثل "كل سطر في القصيدة يحتوي على 8 كلمات") داخل التعليمات. أظهرت التجارب أن DisCIPL يتفوق على النماذج الصغيرة العاملة منفردة، ويقترب من دقة النماذج الريادية مثل o1، لكنه أسرع وأرخص. ففي مهام مثل كتابة جملة مكونة من 18 كلمة، مع ظهور كلمات محددة في مواقع محددة، نجح النظام في إنتاج نتائج دقيقة وسليمة. كما تفوق في مهام واقعية مثل إعداد قوائم مكونات بموازنة، وتأليف جداول سفر، وكتابة مقترحات تمويل بحد أقصى لعدد كلمات. النظام يُقلّل من استهلاك الطاقة بنسبة 80.2% مقارنةً بنموذج o1، ويُختصر وقت التفكير بنسبة 40.1%، وذلك لأن التفكير يتم عبر كتابة كود برمجي (بما يُعدّ أكثر كفاءة من التفكير النصي). علاوةً على ذلك، تُعدّ النماذج الصغيرة المستخدمة كـ"أتباع" أرخص بـ1000 إلى 10000 مرة لكل رمز مُنتَج، مما يسمح بتشغيل عشرات النماذج بالتوازي بتكاليف منخفضة. يُعتبر هذا النهج خطوة كبيرة نحو كفاءة أكبر في استخدام النماذج، خاصة مع التزايد المستمر في الطلب على النماذج اللغوية. يرى الباحثون أن النظام يمكن توسيعه ليُستخدم نموذج واحد كقائد واتباع في آنٍ واحد، وربما تطبيقه في مهام رياضية صعبة، أو في تلبية تفضيلات غير صارمة (مثل "اكتب بأسلوب مهذب ولكن مختصر"). العمل نُشر في مؤتمر نمذجة اللغة وورشة "نشر الوكالات المستقلة"، وتم دعمه من قبل مبادرات متعددة، منها MIT Quest for Intelligence، MIT-IBM Watson AI Lab، ووكالات بحثية أمريكية. يُعدّ DisCIPL نموذجًا واعدًا لمستقبل النماذج اللغوية، حيث يجمع بين الدقة والكفاءة والقابلية للتوسع.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

مؤتمر ICLR 2026 | انخفاض بمقدار 125 ضعفًا في المعلمات القابلة للتدريب لكل مهمة! تساعد طريقة Task Tokens الجديدة الذكاء المجسد على تحسين قدرته على التعامل مع المهام المعقدة.

مؤتمر ICLR 2026 | انخفاض بمقدار 125 ضعفًا في المعلمات القابلة للتدريب لكل مهمة! تساعد طريقة Task Tokens الجديدة الذكاء المجسد على تحسين قدرته على التعامل مع المهام المعقدة.

Command Palette

نظام جديد يُمكن الصغيرة من حل مهام التفكير المعقدة بفعالية أعلى

الروابط ذات الصلة

Command Palette

نظام جديد يُمكن الصغيرة من حل مهام التفكير المعقدة بفعالية أعلى

الروابط ذات الصلة

Command Palette

نظام جديد يُمكن الصغيرة من حل مهام التفكير المعقدة بفعالية أعلى

الروابط ذات الصلة

مؤتمر ICLR 2026 | انخفاض بمقدار 125 ضعفًا في المعلمات القابلة للتدريب لكل مهمة! تساعد طريقة Task Tokens الجديدة الذكاء المجسد على تحسين قدرته على التعامل مع المهام المعقدة.

مؤتمر ICLR 2026 | انخفاض بمقدار 125 ضعفًا في المعلمات القابلة للتدريب لكل مهمة! تساعد طريقة Task Tokens الجديدة الذكاء المجسد على تحسين قدرته على التعامل مع المهام المعقدة.