Jeu De Données Vidéo Du Projet Open Sora Dataset
Date
URL de publication
Catégories

Open-Sora-Plan est un projet open source qui vise à reproduire le Sora d'OpenAI (modèle T2V) et à développer des connaissances sur Video-VQVAE (VideoGPT) + DiT. Le projet a été lancé conjointement par l'Université de Pékin et Tuzhan Intelligent Technology Co., Ltd., et la recherche a considérablement amélioré la qualité de la génération vidéo et la capacité de contrôler le texte. Le modèle est capable de générer des vidéos HD 1024×1024 de 10 secondes, 24 FPS, et prend également en charge la génération d'images haute résolution, offrant aux utilisateurs une expérience visuelle plus riche et plus détaillée.
Cet ensemble de données est un ensemble de données vidéo pour son projet. L'équipe de recherche a analysé 40 258 vidéos provenant de sites Web open source sous licence CC0. Toutes les vidéos sont de haute qualité et sans filigrane, dont environ 60% sont des données en mode paysage. La durée totale est d'environ 274h 05m 13s .
Les principales sources de données sont divisées en trois parties :
- kit de mixage:Le nombre total de vidéos collectées par l'équipe de recherche est 1 234, la durée totale est d'environ 6h 19m 32s, le nombre total d'images est 570,815 .
- pexels:Le nombre total de vidéos collectées par l'équipe de recherche est 7 408,La durée totale est d'environ 48h 49m 24s, le nombre total d'images est 5,038,641 .
- pixabay:Le nombre total de vidéos collectées par l'équipe de recherche est 31 616,La durée totale est d'environ 218h 56m 17s, le nombre total d'images est 23,508,970 .