MUVR Multimodal Uncropped Video Retrieval Benchmark
MUVR ist ein Benchmark-Datensatz für multimodale, unbeschnittene Videoabrufaufgaben, der 2025 von der Nanjing University of Aeronautics and Astronautics in Zusammenarbeit mit der Nanjing University und der Hong Kong Polytechnic University veröffentlicht wurde. Zugehörige Veröffentlichungen umfassen… MUVR: Ein multimodaler Benchmark für die unbeschnittene Videowiedergabe mit mehrstufiger visueller KorrespondenzEs wurde für die NeurIPS 2025 Datensätze und Benchmarks ausgewählt, um die Forschung zur Videosuche in Szenarien mit langen Videoplattformen zu fördern.
Dieser Datensatz umfasst ca. 53.000 ungeschnittene Videos, 1.050 multimodale Suchanfragen und 84.000 Suchanfrage-Video-Zuordnungen von Bilibili. Er deckt verschiedene gängige Videotypen wie Nachrichten, Reise und Tanz ab. Um die unterschiedlichen Zuordnungsebenen klar zu unterscheiden, definiert der Datensatz sechs visuelle Korrespondenzebenen (Kopie, Ereignis, Szene, Instanz, Aktion und Sonstige). Dabei wird ein Eins-zu-Viele-Abfragemodell verwendet, bei dem jede Suchanfrage mehreren vollständigen Videos mit relevanten Inhalten zugeordnet werden kann. Die Suchanfragen können lange Textbeschreibungen, Video-Tag-Hinweise und Maskenhinweise enthalten, um detaillierte Suchanforderungen zu formulieren.

KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.