HyperAIHyperAI

Command Palette

Search for a command to run...

VAP-Data Visual Action Performance Dataset

Date

vor 2 Monaten

Organization

Bytedance
Die Chinesische Universität von Hongkong

Paper URL

2510.20888

License

Apache 2.0

VAP-Data, das 2025 von ByteDance in Zusammenarbeit mit der Chinesischen Universität Hongkong veröffentlicht wurde, ist derzeit der größte semantisch kontrollierte Datensatz zur Videogenerierung. Die zugehörige Forschungsarbeit trägt den Titel „Video als Eingabeaufforderung: Einheitliche semantische Steuerung für die VideogenerierungZiel ist es, hochwertige Trainings- und Bewertungsstandards für die kontrollierte Videogenerierung, die kontrollierte Bewegungssynthese und multimodale Videomodelle bereitzustellen.

Dieser Datensatz umfasst über 90.000 sorgfältig ausgewählte Videopaare, die 100 fein abgestufte semantische Bedingungen in vier semantischen Kategorien abdecken: Konzept, Stil, Handlung und Einstellung. Jede semantische Kategorie enthält mehrere Sätze aufeinander abgestimmter Videoinstanzen. Die Videoinhalte weisen eine große Vielfalt hinsichtlich Beleuchtung, Perspektive, Szene und Dynamik auf und ermöglichen so die Entwicklung semantikübergreifender, präzise gesteuerter Videogenerierungssysteme. Zudem bietet er eine umfassende Evaluierungsumgebung für die Steuerbarkeit und Generalisierungsfähigkeit des Modells.

Dataset-Beispiel

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp