@inproceedings{ren2026memlens, title={{MemLens}: Benchmarking Multimodal Long-Context Conversational Memory in Vision-Language Models}, author={Ren, Xiyu and Wang, Zhaowei and Du, Yiming and Xie, Zhongwei and Liu, Chi and Yang, Xinlin and Feng, Haoyue and Pan, Wenjun and Zheng, Tianshi and Xu, Baixuan and Li, Zhengnan and Song, Yangqiu and Wong, Ginny and See, Simon}, booktitle={Advances in Neural Information Processing Systems (NeurIPS), Datasets and Benchmarks Track}, year={2026} }

استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ شهر واحد

الترخيص

CC BY 4.0

الوسوم

متعدد الوسائط

المعايير

إيجرنت

MemLens هي مجموعة بيانات مرجعية لتقييم ذاكرة الحوار طويلة المدى في نماذج اللغة المرئية. وهي مصممة لاختبار قدرة النموذج على استرجاع وتحديث واستنتاج المعلومات المرئية والنصية المضمنة في حوارات متعددة المحادثات ضمن نوافذ سياقية بحجم 32 ألف، و64 ألف، و128 ألف، و256 ألف. تحتوي هذه المجموعة من البيانات على 789 سؤالاً، تغطي خمسة أنواع من التقييم: استخلاص المعلومات، وتحديث المعرفة، والاستدلال الزمني، والاستدلال متعدد المحادثات، والرفض (الامتناع)، وتوفر أربعة تكوينات لطول السياق (32 ألف / 64 ألف / 128 ألف / 256 ألف). كما تُقدم مجموعة فرعية إضافية ثابتة المستوى ومصنفة تضم 195 سؤالاً خصيصاً لتقييم العوامل المُعززة بالذاكرة لتحقيق التوازن في تكاليف الاستدلال.

الاستشهاد

@inproceedings{ren2026memlens,
title={{MemLens}: Benchmarking Multimodal Long-Context Conversational Memory in Vision-Language Models},
author={Ren, Xiyu and Wang, Zhaowei and Du, Yiming and Xie, Zhongwei and Liu, Chi and Yang, Xinlin and Feng, Haoyue and Pan, Wenjun and Zheng, Tianshi and Xu, Baixuan and Li, Zhengnan and Song, Yangqiu and Wong, Ginny and See, Simon},
booktitle={Advances in Neural Information Processing Systems (NeurIPS), Datasets and Benchmarks Track},
year={2026}
}

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

منذ 6 أيام

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

منذ 2 أشهر

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

منذ 6 أيام

مجموعة بيانات التدريب والتعليم المسبق Sutra 10B

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ شهر واحد

الترخيص

CC BY 4.0

الوسوم

متعدد الوسائط

المعايير

إيجرنت

الاستشهاد

@inproceedings{ren2026memlens,
title={{MemLens}: Benchmarking Multimodal Long-Context Conversational Memory in Vision-Language Models},
author={Ren, Xiyu and Wang, Zhaowei and Du, Yiming and Xie, Zhongwei and Liu, Chi and Yang, Xinlin and Feng, Haoyue and Pan, Wenjun and Zheng, Tianshi and Xu, Baixuan and Li, Zhengnan and Song, Yangqiu and Wong, Ginny and See, Simon},
booktitle={Advances in Neural Information Processing Systems (NeurIPS), Datasets and Benchmarks Track},
year={2026}
}

مجموعات البيانات ذات الصلة

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

منذ 20 أيام

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

منذ 11 أيام

استعارة فيديو Vimu لفهم مجموعة البيانات

منذ 24 أيام

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

منذ شهر واحد

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

منذ شهر واحد

مجموعة بيانات تصنيف أمراض قاع العين

منذ شهر واحد

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

منذ 6 أيام

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

منذ 2 أشهر

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

منذ 6 أيام

مجموعة بيانات التدريب والتعليم المسبق Sutra 10B

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

الاستشهاد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

استعارة فيديو Vimu لفهم مجموعة البيانات

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات التدريب والتعليم المسبق Sutra 10B

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

استعارة فيديو Vimu لفهم مجموعة البيانات

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات التدريب والتعليم المسبق Sutra 10B

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعات البيانات ذات الصلة

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

استعارة فيديو Vimu لفهم مجموعة البيانات

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات التدريب والتعليم المسبق Sutra 10B

مجموعات البيانات ذات الصلة

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

استعارة فيديو Vimu لفهم مجموعة البيانات

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات التدريب والتعليم المسبق Sutra 10B