منذ 2 أشهر
آلة ذات أنظمة ذاكرة قصيرة المدى وحلقاتية ومعنوية
Taewoon Kim; Michael Cochez; Vincent François-Lavet; Mark Neerincx; Piek Vossen

الملخص
مستوحدين من نظرية العلوم المعرفية لأنظمة الذاكرة الصريحة لدى الإنسان، قمنا بنمذجة وكيل يحتوي على أنظمة ذاكرة قصيرة المدى وحدثية (Episodic) ومعنوية (Semantic)، حيث يتم نمذجة كل منها باستخدام رسم معرفي (Knowledge Graph). لتقدير هذه النظام وتحليل سلوك هذا الوكيل، صممنا وأطلقنا بيئة تعليم تعزيزي خاصة بنا تُسمى "الغرفة" (The Room)، حيث يجب على الوكيل أن يتعلم كيفية ترميز وتخزين واسترجاع الذكريات لتحقيق أعلى عائد من خلال الإجابة على الأسئلة. نوضح أن وكيلنا المستند إلى التعلم العميق بالـ Q-تعلم قد تعلم بنجاح ما إذا كانت ذكرى قصيرة المدى يجب أن تُنسى، أو بدلاً من ذلك يجب تخزينها في نظام الذاكرة الحدثية أو المعنوية. تشير تجاربنا إلى أن وكيلًا يمتلك أنظمة ذاكرة مشابهة للإنسان يمكنه أداء أفضل من وكيل لا يمتلك هذه البنية الذاكرية في البيئة.