Command Palette
Search for a command to run...
Ensemble De Données VAP-Data Sur Les Performances Des Actions Visuelles
Date
Paper URL
License
Apache 2.0
VAP-Data, publié en 2025 par ByteDance en collaboration avec l'Université chinoise de Hong Kong, est actuellement le plus grand ensemble de données de génération vidéo sémantiquement contrôlé. L'article de recherche associé s'intitule « VAP-Data ».Video-As-Prompt : contrôle sémantique unifié pour la génération vidéoL'objectif est de fournir des référentiels de formation et d'évaluation de haute qualité pour la génération vidéo contrôlée, la synthèse de mouvement contrôlée et les modèles vidéo multimodaux.
Cet ensemble de données contient plus de 90 000 paires d'échantillons soigneusement sélectionnés, couvrant 100 conditions sémantiques précises réparties en quatre catégories sémantiques : concept, style, action et plan. Chaque catégorie sémantique comprend plusieurs ensembles d'instances vidéo mutuellement alignées. Le contenu vidéo présente une grande diversité d'éclairage, de perspective, de scène et de dynamique, permettant la construction de systèmes de génération vidéo intersémantiques et finement contrôlés, et offrant un environnement d'évaluation complet de la contrôlabilité et de la capacité de généralisation du modèle.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.