Ding Chen Simin Niu Kehang Li Peng Liu Xiangping Zheng Bo Tang Xinchi Li Feiyu Xiong Zhiyu Li

الملخص
تُعد أنظمة الذاكرة مكونات أساسية تُمكّن أنظمة الذكاء الاصطناعي، مثل النماذج اللغوية الكبيرة (LLMs) والوكالات الذكية، من تحقيق التعلم طويل الأمد والتفاعل المستمر. ومع ذلك، تُظهر هذه الأنظمة في كثير من الأحيان تأثيرات وهمية في الذاكرة أثناء عمليات التخزين والاسترجاع، تشمل التصوير الذهني، والأخطاء، والتناقضات، والانقطاعات. وتعتمد التقييمات الحالية للاختلالات الذاكرةية بشكل رئيسي على مهام الإجابة النهائية على الأسئلة، ما يجعل من الصعب تحديد المرحلة التشغيلية داخل نظام الذاكرة التي تنشأ فيها هذه الاختلالات. ولحل هذه المشكلة، نُقدّم "مُعيار الاختلالات في الذاكرة" (HaluMem)، وهو أول معيار تقييم مُخصص للاختلالات على مستوى العمليات مُصمم خصيصًا لأنظمة الذاكرة. يُعرّف HaluMem ثلاث مهام تقييمية (استخراج الذاكرة، تحديث الذاكرة، وإجابة الأسئلة حول الذاكرة) للكشف الشامل عن سلوك الاختلالات عبر مراحل تشغيلية مختلفة من التفاعل. ولدعم التقييم، نُنشئ مجموعتي بيانات مُتعددة الجولات تُركّز على المستخدم (HaluMem-Medium وHaluMem-Long)، تضم كل منهما نحو 15 ألف نقطة ذاكرة و3500 سؤال من أنواع متعددة. وبلغ متوسط طول المحادثة لكل مستخدم 1500 و2600 جولة على التوالي، مع أطوال سياق تتجاوز مليون رمز (token)، ما يمكّن من تقييم الاختلالات عبر مقياس سياقي متنوع ومستويات معقدة للمهام. تُظهر الدراسات التجريبية القائمة على HaluMem أن الأنظمة الذاكرة الحالية تميل إلى إنتاج وتكاثر الاختلالات خلال مراحل الاستخراج والتحديث، مما يؤدي إلى انتشار الأخطاء لمرحلة الإجابة على الأسئلة. وينبغي أن تركز الأبحاث المستقبلية على تطوير آليات تشغيل ذاكرة قابلة للتفسير ومحصورة، تُقلل من الاختلالات بشكل منهجي وتحسّن موثوقية الذاكرة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.