ميمب: استكشاف الذاكرة الإجرائية للوكيل

تُظهر الوكالات القائمة على نماذج اللغة الكبيرة (LLMs) كفاءة عالية في تنفيذ مهام متنوعة، إلا أنها تعاني من ذاكرة إجرائية هشة، تُصمم يدويًا أو تتداخل مع المعاملات الثابتة. في هذا العمل، نستكشف استراتيجيات لتزويد الوكالات بذاكرة إجرائية قابلة للتعلم، قابلة للتحديث، ومستمرة على المدى الطويل. نقترح نموذج "Memp" الذي يستخلص مسارات الوكالة السابقة إلى نوعين من التمثيلات: تعليمات مفصلة خطوة بخطوة، وتمثيلات أعمق على شكل نصوص أو سيناريوهات، وندرس تأثير استراتيجيات مختلفة في عمليات بناء الذاكرة واسترجاعها وتحديثها. وبالإضافة إلى نظام ديناميكي يُحدث محتويات الذاكرة باستمرار، ويصححها، ويُلغِيها عند الضرورة، تتطور هذه المكتبة بالتوازي مع الخبرات الجديدة. أظهرت التقييمات التجريبية على مجموعتي بيانات TravelPlanner و ALFWorld أنَّه مع تحسين مكتبة الذاكرة، تحقق الوكالات معدلات نجاح متزايدة باستمرار، وتحسن كفاءتها في تنفيذ المهام المشابهة. علاوةً على ذلك، تُبقي الذاكرة الإجرائية المبنية على نموذج أقوى قيمتها: إذ يؤدي نقل هذه الذاكرة إلى نموذج أضعف إلى تحسين كبير في الأداء.