Command Palette
Search for a command to run...
VALUE-Datensatz Zur Auswertung Des Sprachverständnisses Von Videos
Datum
Veröffentlichungs-URL
Paper-URL
Lizenz
Andere

VALUE steht für Video-And-Language Understanding Evaluation und ist ein Datensatz zur Bewertung des Video- und Sprachverständnisses. Der Datensatz ist eine Sammlung von 11 VidL-Datensätzen (Video und Sprache), die für drei gängige Aufgaben verwendet werden können: Text-zu-Video-Abruf; Beantwortung von Videofragen und Videountertitelung. Das Ziel von VALUE besteht darin, ein breites Spektrum an Videotypen, Videolängen, Datenmengen und Aufgabenschwierigkeitsgraden abzudecken. VALUE konzentriert sich nicht nur auf visuelle Informationen aus Einzelkanalvideos, sondern fördert auch Modelle, die Informationen aus Videobildern und den zugehörigen Untertiteln verwenden, sowie Modelle, die Wissen über mehrere Aufgaben hinweg weitergeben.
Die für den VALUE-Datensatz-Benchmark verwendeten Datensätze sind:TVQA , TVR , TVC , How2R , How2QA , VIOLINE , VLEP , YouCook2(YC2C, YC2R), Mehrwertsteuer
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.