HyperAIHyperAI

Command Palette

Search for a command to run...

Konsole

MUVR Multimodal Uncropped Video Retrieval Benchmark

Der Discord-Community beitreten

Datum

vor einem Tag

Organisation

Universität Nanjing

Lizenz

CC BY 4.0

MUVR ist ein Benchmark-Datensatz für multimodale, unbeschnittene Videoabrufaufgaben, der 2025 von der Nanjing University of Aeronautics and Astronautics in Zusammenarbeit mit der Nanjing University und der Hong Kong Polytechnic University veröffentlicht wurde. Zugehörige Veröffentlichungen umfassen… MUVR: Ein multimodaler Benchmark für die unbeschnittene Videowiedergabe mit mehrstufiger visueller KorrespondenzEs wurde für die NeurIPS 2025 Datensätze und Benchmarks ausgewählt, um die Forschung zur Videosuche in Szenarien mit langen Videoplattformen zu fördern.

Dieser Datensatz umfasst ca. 53.000 ungeschnittene Videos, 1.050 multimodale Suchanfragen und 84.000 Suchanfrage-Video-Zuordnungen von Bilibili. Er deckt verschiedene gängige Videotypen wie Nachrichten, Reise und Tanz ab. Um die unterschiedlichen Zuordnungsebenen klar zu unterscheiden, definiert der Datensatz sechs visuelle Korrespondenzebenen (Kopie, Ereignis, Szene, Instanz, Aktion und Sonstige). Dabei wird ein Eins-zu-Viele-Abfragemodell verwendet, bei dem jede Suchanfrage mehreren vollständigen Videos mit relevanten Inhalten zugeordnet werden kann. Die Suchanfragen können lange Textbeschreibungen, Video-Tag-Hinweise und Maskenhinweise enthalten, um detaillierte Suchanforderungen zu formulieren.

Dataset-Beispiel

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-Co-Programmierung
Einsatzbereite GPUs
Bestpreis

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp