@article{yao2026narrative, title = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning}, author = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye}, journal = {arXiv preprint arXiv:2603.06688}, year = {2026} }

Utiliser ce jeu de données Discuter sur Discord

Date

il y a 2 mois

URL du document

2603.06688

Licence

Apache 2.0

Balises

Compréhension Vidéo

Génération D'images

EAVSD est un jeu de données de storyboards vidéo publicitaires pour le e-commerce, publié par une équipe de l'Université de Pékin en 2026. Il vise à faciliter la génération d'images multiples thématiques et la planification narrative. Parmi les articles de recherche associés, on peut citer… Tisseur de récits : Vers une cohérence visuelle à longue portée contrôlable grâce au conditionnement multimodalIl est largement utilisé dans les tâches de génération d'images multiples orientées sujet et de planification narrative, avec un accent particulier sur la génération de storyboards pour les vidéos publicitaires de commerce électronique et la recherche sur la cohérence visuelle à long terme contrôlable. Cet ensemble de données contient 50 538 échantillons de produits et un total de 401 351 images de scènes, couvrant 8 catégories de produits e-commerce anonymisées. Chaque échantillon comprend une image de référence, 8 descriptions de scènes en anglais et l'image de scène correspondante générée. L'image de référence a été extraite et nettoyée de la liste de produits originale par le modèle Qwen-VL, et les descriptions de scènes ont été conçues et développées en descriptions cinématographiques en anglais par un modèle de langage étendu. Les images de scènes finales ont été générées à l'aide de l'API d'édition d'images de Novita AI, et toutes les images de scènes sont des données synthétisées par le modèle.

Champs de données

id : Identifiant unique de la ressource (par exemple, category_a_000123)
catégorie : La catégorie de produit à laquelle il appartient (catégorie_a ~ catégorie_h)
Référence : Nom du fichier de l'image du produit référencé
n_scenes_generated / n_scenes_total : Le nombre réel de scènes générées par rapport au nombre total prévu (fixé à 8).
scene_prompts : Une liste de suggestions en anglais pour la scène correspondante (en conservant le préfixe du modèle généré).
scene_filenames / scene_errors : Liste des noms de fichiers du graphe de scène et des messages d’erreur correspondants pour les scènes ayant échoué.

Citation

@article{yao2026narrative,
title   = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning},
author  = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye},
journal = {arXiv preprint arXiv:2603.06688},
year    = {2026}
}

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données De Référence FigureBench Pour La Génération d'illustrations Scientifiques

il y a 21 jours

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

il y a un mois

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

il y a un mois

Command Palette

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Champs de données

Citation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Champs de données

Citation

undefined

Ensemble De Données De Référence FigureBench Pour La Génération d'illustrations Scientifiques

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données De Détection De Fissures d'infrastructure DeepCrack

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Séismes Mondiaux De Magnitude 4,5 : Un Ensemble De Données Sur Les Séismes De Magnitude 4,5 Et Plus Dans Le Monde entier.

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Champs de données

Citation

undefined

Ensemble De Données De Référence FigureBench Pour La Génération d'illustrations Scientifiques

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données De Détection De Fissures d'infrastructure DeepCrack

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Séismes Mondiaux De Magnitude 4,5 : Un Ensemble De Données Sur Les Séismes De Magnitude 4,5 Et Plus Dans Le Monde entier.

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données De Référence FigureBench Pour La Génération d'illustrations Scientifiques

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données De Détection De Fissures d'infrastructure DeepCrack

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Séismes Mondiaux De Magnitude 4,5 : Un Ensemble De Données Sur Les Séismes De Magnitude 4,5 Et Plus Dans Le Monde entier.

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Classification Des Maladies Du Fond d'œil

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)