HyperAIHyperAI

Ensemble De Données De Référence De Questions-réponses Vidéo Longues M3-Bench

Date

il y a un mois

Organisation

Graine ByteDance

URL de publication

huggingface.co

URL de l'article

2508.09736

Licence

非商业用途

Aide au téléchargement

*Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.

M3-Bench est un ensemble de données de référence de type questions-réponses vidéo publié par ByteDance Seed Team en 2025. Les résultats de l'article associé sont «Voir, écouter, se souvenir et raisonner : un agent multimodal doté d'une mémoire à long terme", qui vise à évaluer la mémoire à long terme et la capacité de raisonnement des agents intelligents multimodaux.

L'ensemble de données contient 1 020 échantillons vidéo, chacun incluant des sous-titres, des sorties intermédiaires et des cartes mémoire. M3-Bench utilise principalement des questions-réponses ouvertes (QRE) sur de longues vidéos, chaque vidéo étant accompagnée d'une série de questions ouvertes.

Composition des données :

  • M3-Bench-robot : 100 nouvelles vidéos à la première personne de scénarios réels (du point de vue du robot) enregistrées par l'équipe de recherche
  • M3-Bench-web : 920 longues vidéos provenant d'Internet, couvrant une gamme plus large de contenus et de scénarios

Ensemble De Données De Référence De Questions-réponses Vidéo Longues M3-Bench | Ensembles de données | HyperAI