HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 15 أيام

HaluMem: تقييم التخيلات في أنظمة الذاكرة للوكلاء

Ding Chen Simin Niu Kehang Li Peng Liu Xiangping Zheng Bo Tang Xinchi Li Feiyu Xiong Zhiyu Li

HaluMem: تقييم التخيلات في أنظمة الذاكرة للوكلاء

الملخص

تُعد أنظمة الذاكرة مكونات أساسية تُمكّن أنظمة الذكاء الاصطناعي، مثل النماذج اللغوية الكبيرة (LLMs) والوكالات الذكية، من تحقيق التعلم طويل الأمد والتفاعل المستمر. ومع ذلك، تُظهر هذه الأنظمة في كثير من الأحيان تأثيرات وهمية في الذاكرة أثناء عمليات التخزين والاسترجاع، تشمل التصوير الذهني، والأخطاء، والتناقضات، والانقطاعات. وتعتمد التقييمات الحالية للاختلالات الذاكرةية بشكل رئيسي على مهام الإجابة النهائية على الأسئلة، ما يجعل من الصعب تحديد المرحلة التشغيلية داخل نظام الذاكرة التي تنشأ فيها هذه الاختلالات. ولحل هذه المشكلة، نُقدّم "مُعيار الاختلالات في الذاكرة" (HaluMem)، وهو أول معيار تقييم مُخصص للاختلالات على مستوى العمليات مُصمم خصيصًا لأنظمة الذاكرة. يُعرّف HaluMem ثلاث مهام تقييمية (استخراج الذاكرة، تحديث الذاكرة، وإجابة الأسئلة حول الذاكرة) للكشف الشامل عن سلوك الاختلالات عبر مراحل تشغيلية مختلفة من التفاعل. ولدعم التقييم، نُنشئ مجموعتي بيانات مُتعددة الجولات تُركّز على المستخدم (HaluMem-Medium وHaluMem-Long)، تضم كل منهما نحو 15 ألف نقطة ذاكرة و3500 سؤال من أنواع متعددة. وبلغ متوسط طول المحادثة لكل مستخدم 1500 و2600 جولة على التوالي، مع أطوال سياق تتجاوز مليون رمز (token)، ما يمكّن من تقييم الاختلالات عبر مقياس سياقي متنوع ومستويات معقدة للمهام. تُظهر الدراسات التجريبية القائمة على HaluMem أن الأنظمة الذاكرة الحالية تميل إلى إنتاج وتكاثر الاختلالات خلال مراحل الاستخراج والتحديث، مما يؤدي إلى انتشار الأخطاء لمرحلة الإجابة على الأسئلة. وينبغي أن تركز الأبحاث المستقبلية على تطوير آليات تشغيل ذاكرة قابلة للتفسير ومحصورة، تُقلل من الاختلالات بشكل منهجي وتحسّن موثوقية الذاكرة.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
HaluMem: تقييم التخيلات في أنظمة الذاكرة للوكلاء | الأوراق البحثية | HyperAI