ComoRAG: استنتاج سردي طويل ذا حالة مُنظَّم بالذاكرة مُلهم بالذكاء البشري

تمثّل الفهم السردي للقصص الطويلة والروايات مجالًا يُعدّ تحديًا كبيرًا، نظرًا لتعقيد الحبكات وتشابك العلاقات بين الشخصيات والكيانات، والتي غالبًا ما تتغير مع تطور الأحداث. وبالنظر إلى تراجع قدرة النماذج اللغوية الكبيرة (LLM) على التفكير المنطقي في السياقات الطويلة، بالإضافة إلى التكلفة الحسابية العالية، فإن النهج القائم على الاسترجاع يظل يلعب دورًا محوريًا في الممارسة العملية. ومع ذلك، قد تفشل الطرق التقليدية لـ RAG بسبب عملية الاسترجاع ذات الخطوة الواحدة والغير مُتَعَبِّدة، التي تتجاهل غالبًا الطبيعة الديناميكية لاستكشاف العلاقات المتداخلة داخل السياقات الطويلة. في هذا العمل، نُقدّم نموذج ComoRAG، الذي يعتمد على مبدأ أن التفكير السردي ليس عملية واحدة مفردة، بل هو تفاعل ديناميكي ومتغير بين اكتساب أدلة جديدة وتوحيد المعرفة السابقة، مشابهًا للتفكير البشري عند استخدامه للاشارات الذاكرةية في الدماغ. وبشكل خاص، عند مواجهة عقبة في التفكير، يقوم ComoRAG بإجراء دورات تفكير متكررة من خلال التفاعل مع مساحة ذاكرة ديناميكية. وفي كل دورة، يُولِّد استفسارات استكشافية لتحديد مسارات جديدة، ثم يُدمج الأدلة المسترجعة حول جوانب جديدة في حقل ذاكرة عالمي، مما يُسهم في تكوين سياق متماسك يُمكّن من حل الاستفسار. وقد أظهر ComoRAG تفوقًا ملحوظًا على النماذج القوية لـ RAG في أربع بenchmarkات سردية طويلة السياق صعبة (بأكثر من 200 ألف رمز)، مع تحقيق مكاسب نسبية ثابتة تصل إلى 11% مقارنةً بأقوى نموذج مُقارَن. كما كشف التحليل الإضافي أن ComoRAG يتمتع بميزة واضحة في التعامل مع الاستفسارات المعقدة التي تتطلب فهمًا شاملاً، مقدّمًا نموذجًا مبنيًا على مبادئ علمية ومحفّزًا من منظور وظيفي للذكاء البشري، في مجال فهم السياقات الطويلة القائمة على الاسترجاع، نحو التفكير المُتَعَبِّد. تم إتاحة الكود المصدري لهذا العمل بشكل عام على الرابط التالي: https://github.com/EternityJune25/ComoRAG