Command Palette
Search for a command to run...
مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل
MemLens هي مجموعة بيانات مرجعية لتقييم ذاكرة الحوار طويلة المدى في نماذج اللغة المرئية. وهي مصممة لاختبار قدرة النموذج على استرجاع وتحديث واستنتاج المعلومات المرئية والنصية المضمنة في حوارات متعددة المحادثات ضمن نوافذ سياقية بحجم 32 ألف، و64 ألف، و128 ألف، و256 ألف. تحتوي هذه المجموعة من البيانات على 789 سؤالاً، تغطي خمسة أنواع من التقييم: استخلاص المعلومات، وتحديث المعرفة، والاستدلال الزمني، والاستدلال متعدد المحادثات، والرفض (الامتناع)، وتوفر أربعة تكوينات لطول السياق (32 ألف / 64 ألف / 128 ألف / 256 ألف). كما تُقدم مجموعة فرعية إضافية ثابتة المستوى ومصنفة تضم 195 سؤالاً خصيصاً لتقييم العوامل المُعززة بالذاكرة لتحقيق التوازن في تكاليف الاستدلال.
الاستشهاد
@inproceedings{ren2026memlens,
title={{MemLens}: Benchmarking Multimodal Long-Context Conversational Memory in Vision-Language Models},
author={Ren, Xiyu and Wang, Zhaowei and Du, Yiming and Xie, Zhongwei and Liu, Chi and Yang, Xinlin and Feng, Haoyue and Pan, Wenjun and Zheng, Tianshi and Xu, Baixuan and Li, Zhengnan and Song, Yangqiu and Wong, Ginny and See, Simon},
booktitle={Advances in Neural Information Processing Systems (NeurIPS), Datasets and Benchmarks Track},
year={2026}
}
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.