Command Palette
Search for a command to run...
Ensemble De Données VAP-Data Sur Les Performances Des Actions Visuelles
Date
URL du document
Licence
Apache 2.0
VAP-Data, publié en 2025 par ByteDance en collaboration avec l'Université chinoise de Hong Kong, est actuellement le plus grand ensemble de données de génération vidéo sémantiquement contrôlé. L'article de recherche associé s'intitule « VAP-Data ».Video-As-Prompt : contrôle sémantique unifié pour la génération vidéoL'objectif est de fournir des référentiels de formation et d'évaluation de haute qualité pour la génération vidéo contrôlée, la synthèse de mouvement contrôlée et les modèles vidéo multimodaux.
Cet ensemble de données contient plus de 90 000 paires d'échantillons soigneusement sélectionnés, couvrant 100 conditions sémantiques précises réparties en quatre catégories sémantiques : concept, style, action et plan. Chaque catégorie sémantique comprend plusieurs ensembles d'instances vidéo mutuellement alignées. Le contenu vidéo présente une grande diversité d'éclairage, de perspective, de scène et de dynamique, permettant la construction de systèmes de génération vidéo intersémantiques et finement contrôlés, et offrant un environnement d'évaluation complet de la contrôlabilité et de la capacité de généralisation du modèle.

Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.