HyperAI

VALUE-Datensatz Zur Auswertung Des Sprachverständnisses Von Videos

Datum

vor 3 Jahren

Organisation

Microsoft

Veröffentlichungs-URL

value-benchmark.github.io

Lizenz

其他

Kategorien

Download-Hilfe
特色图像

VALUE steht für Video-And-Language Understanding Evaluation und ist ein Datensatz zur Bewertung des Video- und Sprachverständnisses. Der Datensatz ist eine Sammlung von 11 VidL-Datensätzen (Video und Sprache), die für drei gängige Aufgaben verwendet werden können: Text-zu-Video-Abruf; Beantwortung von Videofragen und Videountertitelung. Das Ziel von VALUE besteht darin, ein breites Spektrum an Videotypen, Videolängen, Datenmengen und Aufgabenschwierigkeitsgraden abzudecken. VALUE konzentriert sich nicht nur auf visuelle Informationen aus Einzelkanalvideos, sondern fördert auch Modelle, die Informationen aus Videobildern und den zugehörigen Untertiteln verwenden, sowie Modelle, die Wissen über mehrere Aufgaben hinweg weitergeben.

Die für den VALUE-Datensatz-Benchmark verwendeten Datensätze sind:TVQA , TVR , TVC , How2R , How2QA , VIOLINE , VLEP , YouCook2(YC2C, YC2R), Mehrwertsteuer