HyperAIHyperAI

Command Palette

Search for a command to run...

VALUE-Datensatz Zur Auswertung Des Sprachverständnisses Von Videos

Discuss on Discord

Date

vor 3 Jahren

Organization

Microsoft

Paper URL

arxiv.org

License

Other

Featured Image

VALUE steht für Video-And-Language Understanding Evaluation und ist ein Datensatz zur Bewertung des Video- und Sprachverständnisses. Der Datensatz ist eine Sammlung von 11 VidL-Datensätzen (Video und Sprache), die für drei gängige Aufgaben verwendet werden können: Text-zu-Video-Abruf; Beantwortung von Videofragen und Videountertitelung. Das Ziel von VALUE besteht darin, ein breites Spektrum an Videotypen, Videolängen, Datenmengen und Aufgabenschwierigkeitsgraden abzudecken. VALUE konzentriert sich nicht nur auf visuelle Informationen aus Einzelkanalvideos, sondern fördert auch Modelle, die Informationen aus Videobildern und den zugehörigen Untertiteln verwenden, sowie Modelle, die Wissen über mehrere Aufgaben hinweg weitergeben.

Die für den VALUE-Datensatz-Benchmark verwendeten Datensätze sind:TVQA , TVR , TVC , How2R , How2QA , VIOLINE , VLEP , YouCook2(YC2C, YC2R), Mehrwertsteuer

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp