HyperAIHyperAI

Command Palette

Search for a command to run...

WildQA: In-the-Wild Video Question Answering

Santiago Castro Naihao Deng Pingxuan Huang Mihai Burzo Rada Mihalcea

Zusammenfassung

Bisherige Datensätze für die Videoverstehensforschung konzentrieren sich hauptsächlich auf menschliche Interaktionen und achten wenig auf „in the wild“-Szenarien, bei denen die Videos im Freien aufgenommen wurden. Wir stellen WILDQA vor, einen Datensatz für das Videoverstehen, der aus Videos im Außenbereich besteht. Neben der Aufgabe des Video-Fragenbeantwortens (Video QA) führen wir zudem eine neue Aufgabe ein: die Identifizierung visueller Beweise für eine gegebene Frage und Antwort (Video-Evidenz-Auswahl). Durch die Bewertung einer Vielzahl von Baseline-Modellen zeigen wir, dass WILDQA neuen Herausforderungen für die Forschungsgemeinschaften im Bereich Vision und Sprache entspricht. Der Datensatz ist unter https://lit.eecs.umich.edu/wildqa/ verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp