MIRIX: نظام ذاكرة متعدد الوكلاء لوكلاء المستندة إلى LLM

رغم أن قدرات الذاكرة لدى الوكلاء الذكائيين تجذب اهتماماً متزايداً، فإن الحلول الحالية تظل محدودة بشكل أساسي. تعتمد معظم هذه الحلول على مكونات ذاكرة مسطحة وضيقة النطاق، مما يقيّد قدرتها على التخصيص والتجريد واسترجاع المعلومات الخاصة بالمستخدم بشكل موثوق به على مر الزمن. في هذا السياق، نقدم نظام MIRIX للذاكرة المعيارية المتعددة الأطراف، والذي يعيد تعريف مستقبل ذاكرة الذكاء الاصطناعي من خلال حل التحدي الأكثر حرجاً في المجال: تمكين نماذج اللغة من التذكر الحقيقي. بخلاف الأساليب السابقة، يتجاوز MIRIX النصوص ليعتنق تجارب بصرية غنية ومتنوعة الأوضاع، مما يجعل الذاكرة مفيدة حقاً في السيناريوهات الواقعية.يتكون MIRIX من ستة أنواع مختلفة ومبنية بدقة من الذاكرة: الذاكرة الأساسية (Core)، الذاكرة الحدثية (Episodic)، الذاكرة الدلالية (Semantic)، الذاكرة الإجرائية (Procedural)، ذاكرة الموارد (Resource Memory)، وخزان المعرفة (Knowledge Vault). يتم ربط هذه الأنواع ب إطار عمل متعدد الأطراف يتحكم ويُنسق التحديثات والاسترجاعات بشكل ديناميكي. هذا التصميم يمكّن الوكلاء من الاستمرار في العمل، والتفكير في البيانات طويلة الأمد للمستخدم، واسترجاعها بدقة وبكميات كبيرة. نتحقق من فعالية MIRIX في بيئتين صعبتين. أولاً، على معيار ScreenshotVQA، وهو اختبار متعدد الأوضاع صعب يتكون من حوالي 20,000 لقطة شاشة عالية الدقة لكل سلسلة، ويحتاج إلى فهم سياقي عميق حيث لا يمكن تطبيق أي نظام ذاكرة موجود حالياً عليه. يصل MIRIX إلى دقة أعلى بنسبة 35% من الأساس RAG مع خفض متطلبات التخزين بنسبة 99.9%. ثانياً، على معيار LOCOMO للمحادثات الطويلة مع إدخال نصي أحادي النمط، يصل MIRIX إلى أداء رائد بنسبة 85.4%,متفوقًا بكثير على الأسس الموجودة حالياً. تظهر هذه النتائج أن MIRIX يحدد معيارًا جديدًا لأداء الوكلاء المعززة بالذاكرة ضمن نماذج اللغة الكبيرة.لإتاحة الفرصة للمستخدمين لتجرّب نظامنا للذاكرة، نوفر تطبيقًا جاهزًا يعمل بواسطة MIRIX. يقوم هذا التطبيق بمراقبة الشاشة في الوقت الفعلي، وإنشاء قاعدة بيانات شخصية للذاكرة، وتقديم تصور بديهي وخزن محلي آمن لضمان الخصوصية.注释:- "MIRIX" 是专有名词,直接保留为 "MIRIX"。- "ScreenshotVQA" 和 "LOCOMO" 也是专有名词,分别保留为 "ScreenshotVQA" 和 "LOCOMO"。- 在阿拉伯语中,百分比符号通常放在数字后面,因此将 "%85.4" 放在数字后面。修正后的阿拉伯语翻译:رغم أن قدرات الذاكرة لدى الوكلاء الذكائيين تجذب اهتماماً متزايداً، فإن الحلول الحالية تظل محدودة بشكل أساسي. تعتمد معظم هذه الحلول على مكونات ذاكرة مسطحة وضيقة النطاق، مما يقيّد قدرتها على التخصيص والتجريد واسترجاع المعلومات الخاصة بالمستخدم بشكل موثوق به على مر الزمن. في هذا السياق، نقدم نظام MIRIX للذاكرة المعيارية المتعددة الأطراف، والذي يعيد تعريف مستقبل ذاكرة الذكاء الاصطناعي من خلال حل التحدي الأكثر حرجاً في المجال: تمكين نماذج اللغة من التذكر الحقيقي. بخلاف الأساليب السابقة، يتجاوز MIRIX النصوص ليعتنق تجارب بصرية غنية ومتنوعة الأوضاع، مما يجعل الذاكرة مفيدة حقاً في السيناريوهات الواقعية.يتكون MIRIX من ستة أنواع مختلفة ومبنية بدقة من الذاكرة: الذاكرة الأساسية (Core)، الذاكرة الحدثية (Episodic)، الذاكرة الدلالية (Semantic)، الذاكرة الإجرائية (Procedural)، ذاكرة الموارد (Resource Memory)، وخزان المعرفة (Knowledge Vault). يتم ربط هذه الأنواع بإطار عمل متعدد الأطراف يتحكم ويُنسق التحديثات والاسترجاعات بشكل ديناميكي. هذا التصميم يمكّن الوكلاء من الاستمرار في العمل والتفكير في البيانات طويلة الأمد للمستخدم واسترجاعها بدقة وبكميات كبيرة.نتحقق من فعالية MIRIX في بيئتين صعبتين. أولاً، على معيار ScreenshotVQA وهو اختبار متعدد الأوضاع صعب يتكون من حوالي 20,000 لقطة شاشة عالية الدقة لكل سلسلة ويحتاج إلى فهم سياقي عميق حيث لا يمكن تطبيق أي نظام ذاكرة موجود حالياً عليه. يصل MIRIX إلى دقة أعلى بنسبة %35 من الأساس RAG مع خفض متطلبات التخزين بنسبة %99.9. ثانياً، على معيار LOCOMO للمحادثات الطويلة مع إدخال نصي أحادي النمط يصل MIRIX إلى أداء رائد بنسبة %85.4 ،متفوقًا بكثير على الأسس الموجودة حالياً. تظهر هذه النتائج أن MIRIX يحدد معيارًا جديدًا لأداء الوكلاء المعززة بالذاكرة ضمن نماذج اللغة الكبيرة.لإتاحة الفرصة للمستخدمين لتجرّب نظامنا للذاكرة، نوفر تطبيقًا جاهزًا يعمل بواسطة MIRIX. يقوم هذا التطبيق بمراقبة الشاشة في الوقت الفعلي وإنشاء قاعدة بيانات شخصية للذاكرة وتقديم تصور بديهي وخزن محلي آمن لضمان الخصوصية.