HyperAIHyperAI

Command Palette

Search for a command to run...

VALUE-Datensatz Zur Auswertung Des Sprachverständnisses Von Videos

Datum

vor 3 Jahren

Organisation

Microsoft

Veröffentlichungs-URL

value-benchmark.github.io

Paper-URL

arxiv.org

Lizenz

Andere

Treten Sie der Discord-Community bei
Featured Image

VALUE steht für Video-And-Language Understanding Evaluation und ist ein Datensatz zur Bewertung des Video- und Sprachverständnisses. Der Datensatz ist eine Sammlung von 11 VidL-Datensätzen (Video und Sprache), die für drei gängige Aufgaben verwendet werden können: Text-zu-Video-Abruf; Beantwortung von Videofragen und Videountertitelung. Das Ziel von VALUE besteht darin, ein breites Spektrum an Videotypen, Videolängen, Datenmengen und Aufgabenschwierigkeitsgraden abzudecken. VALUE konzentriert sich nicht nur auf visuelle Informationen aus Einzelkanalvideos, sondern fördert auch Modelle, die Informationen aus Videobildern und den zugehörigen Untertiteln verwenden, sowie Modelle, die Wissen über mehrere Aufgaben hinweg weitergeben.

Die für den VALUE-Datensatz-Benchmark verwendeten Datensätze sind:TVQA , TVR , TVC , How2R , How2QA , VIOLINE , VLEP , YouCook2(YC2C, YC2R), Mehrwertsteuer

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
VALUE-Datensatz Zur Auswertung Des Sprachverständnisses Von Videos | Datensätze | HyperAI