MUVR (Multimodal Uncropped Video Retrieval Benchmark)
MUVR est un jeu de données de référence pour les tâches de recherche de vidéos multimodales non recadrées. Il a été publié en 2025 par l'Université d'aéronautique et d'astronautique de Nanjing, en collaboration avec l'Université de Nanjing et l'Université polytechnique de Hong Kong. Parmi les articles associés, on peut citer… MUVR : un banc d’essai de recherche vidéo multimodale non rognée avec correspondance visuelle multiniveauIl a été sélectionné pour les ensembles de données et les benchmarks NeurIPS 2025, dans le but de promouvoir la recherche sur la récupération vidéo dans des scénarios de plateformes vidéo longues.
Cet ensemble de données contient environ 53 000 vidéos non éditées, 1 050 requêtes multimodales et 84 000 correspondances requête-vidéo issues de Bilibili, couvrant divers types de vidéos courants tels que l'actualité, les voyages et la danse. Afin de distinguer clairement les différents niveaux de correspondance, l'ensemble de données définit six niveaux visuels (copie, événement, scène, instance, action et autres), selon un modèle de recherche de type un-à-plusieurs, où chaque requête peut correspondre à plusieurs vidéos complètes contenant du contenu pertinent. Les formats de requête incluent des descriptions textuelles détaillées, des suggestions de tags vidéo et des masques de recherche pour exprimer des besoins de recherche précis.

Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec co-codage IA gratuit, environnement prêt à l'emploi et meilleur prix de GPU.