HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Date

il y a une heure

URL du document

2603.06688

Licence

Apache 2.0

EAVSD est un jeu de données de storyboards vidéo publicitaires pour le e-commerce, publié par une équipe de l'Université de Pékin en 2026. Il vise à faciliter la génération d'images multiples thématiques et la planification narrative. Parmi les articles de recherche associés, on peut citer… Tisseur de récits : Vers une cohérence visuelle à longue portée contrôlable grâce au conditionnement multimodalIl est largement utilisé dans les tâches de génération d'images multiples orientées sujet et de planification narrative, avec un accent particulier sur la génération de storyboards pour les vidéos publicitaires de commerce électronique et la recherche sur la cohérence visuelle à long terme contrôlable. Cet ensemble de données contient 50 538 échantillons de produits et un total de 401 351 images de scènes, couvrant 8 catégories de produits e-commerce anonymisées. Chaque échantillon comprend une image de référence, 8 descriptions de scènes en anglais et l'image de scène correspondante générée. L'image de référence a été extraite et nettoyée de la liste de produits originale par le modèle Qwen-VL, et les descriptions de scènes ont été conçues et développées en descriptions cinématographiques en anglais par un modèle de langage étendu. Les images de scènes finales ont été générées à l'aide de l'API d'édition d'images de Novita AI, et toutes les images de scènes sont des données synthétisées par le modèle.

Champs de données

  • id : Identifiant unique de la ressource (par exemple, category_a_000123)
  • catégorie : La catégorie de produit à laquelle il appartient (catégorie_a ~ catégorie_h)
  • Référence : Nom du fichier de l'image du produit référencé
  • n_scenes_generated / n_scenes_total : Le nombre réel de scènes générées par rapport au nombre total prévu (fixé à 8).
  • scene_prompts : Une liste de suggestions en anglais pour la scène correspondante (en conservant le préfixe du modèle généré).
  • scene_filenames / scene_errors : Liste des noms de fichiers du graphe de scène et des messages d’erreur correspondants pour les scènes ayant échoué.

Citation

@article{yao2026narrative,
title   = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning},
author  = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye},
journal = {arXiv preprint arXiv:2603.06688},
year    = {2026}
}

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp