نماذج لغوية متكررة: غوص شامل
تُعد نماذج اللغة العودية (Recursive Language Models أو RLMs) تطوراً جوهرياً في مجال الذكاء الاصطناعي، حيث تتفوق في التعامل مع السياقات الطويلة جداً مقارنة بالأساليب التقليدية مثل ReAct أو CodeAct. الفكرة الأساسية وراء RLMs ليست مجرد تكرار للآليات القديمة، بل تكمن في طريقة التعامل مع الذاكرة والمعلومات، حيث تعتمد على تمرير المرجع للسياق بدلاً من تكراره أو حفظه في ذاكرة النموذج بشكل مباشر، مما يحل مشكلة ازدحام الذاكرة والخطأ في نقل البيانات. للفهم، يمكن مقارنة الحلول عبر دراسة حالة بسيطة تتطلب توليد قائمة أسماء وفئات مختلفة، ثم عد حروف معينة في كل كلمة. في الأسلوب التقليدي المسمى "التوليد المباشر"، يعتمد النموذج فقط على قدرته التنبؤية ويولد الإجابة حرفاً تلو الآخر، مما يؤدي إلى أخطاء عند الطول. أما في أسلوب "ReAct"، يقوم النموذج باستخدام أدوات محددة مسبقاً، لكنه لا يزال مضطراً لاستدعاء الأرقام من ذاكرته وتكرارها يدوياً، وهو ما يسبب أخطاء عند تعقيد المهمة بوجود فئات متعددة. بينما يتيح أسلوب "CodeAct" للنموذج كتابة وتنفيذ كود بايثون لتنفيذ المهمة، إلا أنه يواجه نفس مشكلة الاسترجاع اليدوي للنتائج النهائية. يأتي دور RLMs لإحداث فرق حقيقي من خلال دمج نظام REPL (حلقة قراءة-تقييم-طباعة)، شبيه بمفكّرات جوبيتر نوتبوك. في هذا النظام، لا يقوم النموذج بقراءة الطلب بالكامل دفعة واحدة، بل يقرّء أجزاء محددة من السياق عند الحاجة، ويقوم بتخزين النتائج مؤقتاً في متغيرات بايثون دائمة، بدلاً من محاولة حفظ كل شيء في الذاكرة المؤقتة للتعامل مع السياق. هذا يسمح للنموذج بالعمل على مهام ضخمة جداً، مثل تحليل آلاف الصفحات من المقابلات، دون فقدان المعلومات. الميزة الأهم في RLMs هي قدرتها على "العودة التكرارية" أو استخدام الوكلاء الفرعيين (Subagents). بدلاً من محاولة حل مشكلة ضخمة بمفردك، يقوم النموذج الرئيسي بتقسيم المهمة إلى مهام أصغر، ويطلب من نماذج فرعية تنفيذها بشكل متوازٍ أو متسلسل. النتيجة التي تعود من الوكيل الفرعي لا تُعاد طباعتها بالكامل في الذاكرة، بل تُخزن كمتغير أو كائن برمجيات يمكن للوالد استخدامه مباشرة. هذا يعني أن طول الإجابة النهائية ليس محدوداً بسعة الذاكرة السياقية للنموذج الأساسي، بل بمساحة التخزين في البيئة البرمجية، مما يسمح بإنتاج مخرجات طويلة جداً دون تدهور الأداء. تعمل هذه الآلية بكفاءة عالية لأنها تركز الانتباه (Focused Attention) على الأجزاء ذات الصلة فقط من البيانات الضخمة، وتتجنب تشتت النموذج بكمية المعلومات غير الضرورية. كما أن استخدام المتغيرات والوكلاء الفرعيين يقلل التكلفة، حيث يتم استخدام ذاكرة التخزين المؤقت (KV Cache) بنسبة عالية، ويتم دفع تكلفة الحساب فقط على الأجزاء التي يتم معالجتها فعلياً. باختصار، نماذج اللغة العودية تمثل نقلة نوعية تجعل النماذج قادرة على التعامل مع مهام معقدة وطويلة المدى من خلال تقسيم العمل، واستخدام البيئة البرمجية لتخزين المعرفة مؤقتاً، والاستدعاء الذكي للوكلاء الفرعيين، مما يتيح معالجة سياقات لا يمكن لأي نموذج عادي التعامل معها بمفرده. هذا النهج لا يرفع فقط من دقة النتائج في المهام الطويلة، بل يفتح آفاقاً جديدة لتطبيقات الذكاء الاصطناعي التي تتطلب تحليل بيانات ضخمة ومتعددة المصادر بدقة عالية.
