Datum

vor 6 Monaten

Organisation

Paper-URL

2510.20888

Lizenz

Apache 2.0

Tags

Text-zu-Video

Bild-zu-Video

VAP-Data, das 2025 von ByteDance in Zusammenarbeit mit der Chinesischen Universität Hongkong veröffentlicht wurde, ist derzeit der größte semantisch kontrollierte Datensatz zur Videogenerierung. Die zugehörige Forschungsarbeit trägt den Titel „Video als Eingabeaufforderung: Einheitliche semantische Steuerung für die VideogenerierungZiel ist es, hochwertige Trainings- und Bewertungsstandards für die kontrollierte Videogenerierung, die kontrollierte Bewegungssynthese und multimodale Videomodelle bereitzustellen. Dieser Datensatz umfasst über 90.000 sorgfältig ausgewählte Videopaare, die 100 fein abgestufte semantische Bedingungen in vier semantischen Kategorien abdecken: Konzept, Stil, Handlung und Einstellung. Jede semantische Kategorie enthält mehrere Sätze aufeinander abgestimmter Videoinstanzen. Die Videoinhalte weisen eine große Vielfalt hinsichtlich Beleuchtung, Perspektive, Szene und Dynamik auf und ermöglichen so die Entwicklung semantikübergreifender, präzise gesteuerter Videogenerierungssysteme. Zudem bietet er eine umfassende Evaluierungsumgebung für die Steuerbarkeit und Generalisierungsfähigkeit des Modells.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor 6 Monaten

Organisation

Paper-URL

2510.20888

Lizenz

Apache 2.0

Zugehörige Datensätze

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

VAP-Data Visual Action Performance Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

VAP-Data Visual Action Performance Dataset

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

VAP-Data Visual Action Performance Dataset

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz