ما وراء استرجاع الحقائق: الذاكرة السردية لـ RAG مع الفضاءات الشكلية التوليدية
Shreyas Rajesh Pavan Holur Chenda Duan David Chong Vwani Roychowdhury

الملخص
تواجه نماذج اللغة الكبيرة (LLMs) تحديات جوهرية في التفكير بسياق طويل: فهناك العديد من الوثائق التي تتجاوز نوافذ السياق المحدودة لهذه النماذج، في حين أن أداء النماذج على النصوص التي تُناسب في الحدود المسموحة ينخفض مع طول التسلسل، مما يستدعي تعزيزها بFrameworks خارجية للذاكرة. ورغم أن الحلول الحالية، التي تطورت من الاسترجاع باستخدام التمثيلات الدلالية إلى تمثيلات معقدة أكثر مثل الرسوم المعرفية المُنظَّمة بهدف تحسين فهم السياق وربط المفاهيم، فإنها مُصممة خصيصًا للاسترجاع القائم على الحقائق، وتفشل في بناء تمثيلات دلالية مُرتبطة بزمن ومكان، وهي ضرورية لتعقب الكيانات عبر الأحداث التذكارية. ولسد هذه الفجوة، نقترح إطار الذاكرة التوليدية الدلالية (Generative Semantic Workspace - GSW)، وهو إطار تذكّر توليدية مستوحاة من الدماغ، يُنشئ تمثيلات منظمة وقابلة للتفهّم للسياقات المتغيرة، ما يمكّن نماذج اللغة الكبيرة من التفكير في الأدوار والإجراءات والسياقات المكانية-الزمنية المتغيرة. يتكوّن هذا الإطار من مُشغل (Operator) يُرَوّج الملاحظات الواردة إلى هياكل دلالية وسيطة، ومرجّح (Reconciler) يُدمج هذه الهياكل في مساحة عمل دائمة تضمن الاتساق الزمني والمكانِي والمنطقي. وقد أظهرت النتائج على معيار الذاكرة التذكارية (Episodic Memory Benchmark - EpBench) الذي يشمل مجموعات نصية تتراوح أطوالها بين 100 ألف و1 مليون رمز، أن GSW يتفوّق على النماذج القائمة على RAG بحد أقصى 20%. علاوةً على ذلك، يُعد GSW فعّالًا جدًا، حيث يقلل من عدد الرموز في سياق الاستعلام بنسبة 51% مقارنةً بأقل نموذج فعّال من حيث استخدام الرموز، ما يُقلل من تكاليف الاستدلال بشكل ملحوظ. وبشكل أوسع، يقدّم GSW نموذجًا عمليًا لتمكين نماذج اللغة الكبيرة من امتلاك ذاكرة تذكارية بشرية، ممّا يُمهد الطريق لتطوير وكالات أكثر قدرة قادرة على التفكير على مدى طويل.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.