Ensemble De Données D'édition D'instances Vidéo VIRESET
Date
il y a 4 jours
URL de publication
Cet ensemble de données est un ensemble de données d'édition d'instances vidéo publié par l'Université de Pékin et OpenBayes Bayesian computing en 2025. Les résultats de l'article pertinents sont :VIRES : Redessin d'instances vidéo via la génération guidée par croquis et texte", qui vise à fournir un support d'annotation précis pour des tâches telles que le redessin d'instances vidéo et la segmentation de séries chronologiques.
L'ensemble de données contient :
- SA-V améliore l'annotation des masques, ajoute un nouveau champ masklet_continues dans le fichier JSON d'origine, qui peut être analysé par le décodage base64 et l'outil pycocotools.mask.
- 86 000 clips vidéo, dont 85 000 vidéos de formation et 1 000 vidéos d'évaluation, chaque vidéo se compose de 51 images de 24 FPS, d'images de résolution 512 × 512, et est accompagnée d'une séquence de croquis de structure et de descriptions de texte d'apparence.

Exemples de montage vidéo