مخطط عملي لتصميم نظام RAG ذكي يعتمد على الوكالة
يُعدّ نظام Agentic RAG تطورًا متقدمًا على الهيكل التقليدي لـ RAG، حيث يُضيف قدرة اتخاذ قرارات ديناميكية دون تغيير البنية الأساسية. بدلاً من مسار ثابت من الاسترجاع والتحديث، يُضفي النظام عقدة تحكم تُمكّن الوكيل (Agent) من اتخاذ قرارات حاسمة: هل يستمر في الدورة؟ هل يُعيد الاسترجاع؟ هل يُوقف العملية؟ في السيناريو العملي المُقدّم، يُستخدم النظام لاسترجاع معلومات عن لاعب كرة سلة صيني، يانغ ماينغ. يعتمد النظام على مصادر بيانات مُقسّمة: واحدة للرياضيين الصينيين (41 وثيقة)، وأخرى للرياضيين الأمريكيين (40 وثيقة). يتم استخدام نموذج Qwen-8B كـ "مُوجّه" (Router) لتحديد ما إذا كان يجب استرجاع بيانات صينية فقط، أم أمريكية، أم كليهما. ثم يُفعّل مستشعر متجهات Qwen (text-embedding-v4) مع تجزئة كلمات باستخدام spaCy، وتُجرى عملية استرجاع باستخدام خوارزمية BM25. بعد الاسترجاع، يُستخدم نموذج gte-rerank-v2 لترتيب النتائج حسب الأهمية. لكن النتائج الأولية قد تكون غير ذات صلة، لذا يُضاف وحدة تصفية (Filter_content) تقيّم ما إذا كانت المحتويات المُسترجعة، مع السؤال، كافية لبناء إجابة. إذا كانت الإجابة "لا"، يُستدعى استرجاع إضافي من الإنترنت، ويُدمج المحتوى الجديد مع السابق، ثم يُعاد تقييمه. عند تأكيد الكفاية، يُرسل المحتوى المُدمج إلى نموذج Qwen-14B لإنتاج الإجابة النهائية. في الحالة المُحددة، أظهر النظام استرجاع 5 وثائق صينية، منها معلومات دقيقة عن يانغ ماينغ: طوله 2.26 متر، وزنه 141 كجم، مركز في الفريق، مع مكاسب كبرى مثل 8 مرات مشاركة في نخبة الدوري الأمريكي (NBA)، ودخول قاعة المشاهير العالمية (2016)، وقاعة مشاهير FIBA (2023). وتم التحقق من صحة المعلومة، وتم إنتاج إجابة شاملة. في البيئات الصناعية، تصبح المهمة أكثر تعقيدًا. تتطلب الأنظمة الصناعية دمج مصادر متعددة (PDF، Excel، صور، Word)، وتقسيم محتوى دقيق، وتحقيق دقة عالية مع الحفاظ على سرعة الاستجابة. تُواجه التحديات الرئيسية في دقة النماذج الصغيرة، وتأخير النماذج الكبيرة، وانهيار الدقة التراكمية عند تضمين عدة وحدات. مثلاً، إذا كانت دقة "المُوجّه" و"التحقق" 90%، فإن الدقة النهائية تصبح 81%. لتحسين الأداء، تقترح الحلول التالية: استخدام نماذج أكبر (32B+) إذا سُمح بالتأخير، أو تقليل حجم النماذج عبر التعلم التكميلي (SFT) أو التعلم المعزز بالاستجابة البشرية (RLHF)، أو استخدام بيانات مُصطنعة مُدققة يدويًا. كما يُقترح إدخال استراتيجيات احتياطية، مثل استدعاء جميع المصادر عند انخفاض ثقة التصنيف، أو إضافة وحدة "انعكاس ذاتي" لفحص الأخطاء وتصحيحها، رغم تزايد التأخير. في الختام، لا يُعد Agentic RAG تحوّلًا جذريًا، بل تطويرًا لـ RAG يُعزز القدرة على التحكم والتكيف. يُمكنه التعامل مع سيناريوهات معقدة، مثل استرجاع معلومات متعددة المصادر بدقة عالية، ويقلل التكاليف الناتجة عن استرجاع غير ضروري. المفتاح في التطوير المستقبلي هو تحقيق توازن بين السرعة والدقة، عبر تطوير آليات انعكاس خفيفة، وتدريب متكامل للوحدات، ودمج معالجة متعددة الوسائط. على المطورين أن يُحدّدوا أولويات السيناريو العملي — هل يُفضّل الدقة أم السرعة — قبل اختيار الحل التقني، دون الانسياق وراء مفهوم "الوكلاء" بشكل عشوائي.