HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

التاريخ

منذ شهر واحد

الترخيص

CC BY 4.0

MemLens هي مجموعة بيانات مرجعية لتقييم ذاكرة الحوار طويلة المدى في نماذج اللغة المرئية. وهي مصممة لاختبار قدرة النموذج على استرجاع وتحديث واستنتاج المعلومات المرئية والنصية المضمنة في حوارات متعددة المحادثات ضمن نوافذ سياقية بحجم 32 ألف، و64 ألف، و128 ألف، و256 ألف. تحتوي هذه المجموعة من البيانات على 789 سؤالاً، تغطي خمسة أنواع من التقييم: استخلاص المعلومات، وتحديث المعرفة، والاستدلال الزمني، والاستدلال متعدد المحادثات، والرفض (الامتناع)، وتوفر أربعة تكوينات لطول السياق (32 ألف / 64 ألف / 128 ألف / 256 ألف). كما تُقدم مجموعة فرعية إضافية ثابتة المستوى ومصنفة تضم 195 سؤالاً خصيصاً لتقييم العوامل المُعززة بالذاكرة لتحقيق التوازن في تكاليف الاستدلال.

الاستشهاد

@inproceedings{ren2026memlens,
title={{MemLens}: Benchmarking Multimodal Long-Context Conversational Memory in Vision-Language Models},
author={Ren, Xiyu and Wang, Zhaowei and Du, Yiming and Xie, Zhongwei and Liu, Chi and Yang, Xinlin and Feng, Haoyue and Pan, Wenjun and Zheng, Tianshi and Xu, Baixuan and Li, Zhengnan and Song, Yangqiu and Wong, Ginny and See, Simon},
booktitle={Advances in Neural Information Processing Systems (NeurIPS), Datasets and Benchmarks Track},
year={2026}
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp