@inproceedings{ren2026memlens, title={{MemLens}: Benchmarking Multimodal Long-Context Conversational Memory in Vision-Language Models}, author={Ren, Xiyu and Wang, Zhaowei and Du, Yiming and Xie, Zhongwei and Liu, Chi and Yang, Xinlin and Feng, Haoyue and Pan, Wenjun and Zheng, Tianshi and Xu, Baixuan and Li, Zhengnan and Song, Yangqiu and Wong, Ginny and See, Simon}, booktitle={Advances in Neural Information Processing Systems (NeurIPS), Datasets and Benchmarks Track}, year={2026} }

Utiliser ce jeu de données Discuter sur Discord

Date

il y a un mois

Licence

CC BY 4.0

Balises

Multimodal

Benchmarks

Agent

MemLens est un jeu de données de référence pour l'évaluation de la mémoire de dialogue à long terme dans les modèles de langage visuel. Il est conçu pour tester la capacité du modèle à récupérer, rappeler, mettre à jour et inférer des informations visuelles et textuelles intégrées dans des dialogues multiconversationnels au sein de fenêtres contextuelles de 32K, 64K, 128K et 256K. Cet ensemble de données contient 789 questions, couvrant cinq types d'évaluation : extraction d'informations, mise à jour des connaissances, raisonnement temporel, raisonnement multiconversationnel et rejet (abstention). Il propose quatre configurations de longueur de contexte (32 000, 64 000, 128 000 et 256 000). Un sous-ensemble stratifié à niveau fixe de 195 questions est fourni spécifiquement pour l'évaluation des agents à mémoire augmentée, afin d'équilibrer les coûts d'inférence.

Citation

@inproceedings{ren2026memlens,
title={{MemLens}: Benchmarking Multimodal Long-Context Conversational Memory in Vision-Language Models},
author={Ren, Xiyu and Wang, Zhaowei and Du, Yiming and Xie, Zhongwei and Liu, Chi and Yang, Xinlin and Feng, Haoyue and Pan, Wenjun and Zheng, Tianshi and Xu, Baixuan and Li, Zhengnan and Song, Yangqiu and Wong, Ginny and See, Simon},
booktitle={Advances in Neural Information Processing Systems (NeurIPS), Datasets and Benchmarks Track},
year={2026}
}

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Base De Données De Connaissances TACK Targeted Chimera

il y a 20 jours

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

il y a 11 jours

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

il y a 24 jours

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

il y a un mois

Ensemble De Données De Référence En Monde Réel Claw-Eval

il y a un mois

Ensemble De Données De Classification Des Maladies Du Fond d'œil

il y a un mois

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

il y a 6 jours

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

il y a 6 jours

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données Discuter sur Discord

Date

il y a un mois

Licence

CC BY 4.0

Balises

Multimodal

Benchmarks

Agent

Citation

@inproceedings{ren2026memlens,
title={{MemLens}: Benchmarking Multimodal Long-Context Conversational Memory in Vision-Language Models},
author={Ren, Xiyu and Wang, Zhaowei and Du, Yiming and Xie, Zhongwei and Liu, Chi and Yang, Xinlin and Feng, Haoyue and Pan, Wenjun and Zheng, Tianshi and Xu, Baixuan and Li, Zhengnan and Song, Yangqiu and Wong, Ginny and See, Simon},
booktitle={Advances in Neural Information Processing Systems (NeurIPS), Datasets and Benchmarks Track},
year={2026}
}

undefined

Base De Données De Connaissances TACK Targeted Chimera

il y a 20 jours

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

il y a 11 jours

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

il y a 24 jours

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

il y a un mois

Ensemble De Données De Référence En Monde Réel Claw-Eval

il y a un mois

Ensemble De Données De Classification Des Maladies Du Fond d'œil

il y a un mois

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

il y a 6 jours

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

il y a 6 jours

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

Citation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

Citation

undefined

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

Citation

undefined

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

undefined

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données MIA Sur Les Trajectoires d'inférence Et De Décision Multi-étapes

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B