Datum

vor 4 Jahren

Organisation

Veröffentlichungs-URL

value-benchmark.github.io

Paper-URL

arxiv.org

Lizenz

Other

Tags

Multimodal

Videobegreifen

Visuelle Fragebeantwortung

VALUE steht für Video-And-Language Understanding Evaluation und ist ein Datensatz zur Bewertung des Video- und Sprachverständnisses. Der Datensatz ist eine Sammlung von 11 VidL-Datensätzen (Video und Sprache), die für drei gängige Aufgaben verwendet werden können: Text-zu-Video-Abruf; Beantwortung von Videofragen und Videountertitelung. Das Ziel von VALUE besteht darin, ein breites Spektrum an Videotypen, Videolängen, Datenmengen und Aufgabenschwierigkeitsgraden abzudecken. VALUE konzentriert sich nicht nur auf visuelle Informationen aus Einzelkanalvideos, sondern fördert auch Modelle, die Informationen aus Videobildern und den zugehörigen Untertiteln verwenden, sowie Modelle, die Wissen über mehrere Aufgaben hinweg weitergeben. Die für den VALUE-Datensatz-Benchmark verwendeten Datensätze sind:TVQA , TVR , TVC , How2R , How2QA , VIOLINE , VLEP , YouCook2(YC2C, YC2R), Mehrwertsteuer

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor 4 Jahren

Organisation

Veröffentlichungs-URL

value-benchmark.github.io

Paper-URL

arxiv.org

Lizenz

Other

Zugehörige Datensätze

RoVid-X-Roboter-Videogenerierungsdatensatz

vor 8 Tagen

TransPhy3D Transparent Reflection Synthesis Video Dataset

vor 5 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 8 Tagen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

VALUE-Datensatz Zur Auswertung Des Sprachverständnisses Von Videos

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

VALUE-Datensatz Zur Auswertung Des Sprachverständnisses Von Videos

Zugehörige Datensätze

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

VALUE-Datensatz Zur Auswertung Des Sprachverständnisses Von Videos

Zugehörige Datensätze

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

Zugehörige Datensätze

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz