Command Palette
Search for a command to run...
EAVSD 电商广告视频分镜数据集
EAVSD 是由北京大学团队于 2026 年发布的电商广告视频分镜数据集,旨在支持面向主体的多图像生成与叙事规划任务。相关论文成果为 Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning,广泛应用于面向主体的多图像生成与叙事规划任务,核心聚焦电商广告视频分镜生成与可控长程视觉一致性研究。 该数据集包含 50,538 个产品样本,总计 401,351 张场景图,涵盖 8 个匿名化电商产品类别,每个样本包含 1 张参考图片、 8 条英文场景提示词及对应生成的场景图,参考图像由 Qwen-VL 模型从原始商品列表中提取清洗,场景提示词由大语言模型规划并扩展为电影级英文描述,最终场景图像通过 Novita AI 的图像编辑 API 生成,所有场景图均为模型合成数据。
数据字段
- id:资产唯一标识符(如 category_a_000123)
- category:所属产品类别(category_a ~ category_h)
- reference:参考产品图文件名
- n_scenes_generated / n_scenes_total:实际生成的场景数量与总计划数量(固定为 8)
- scene_prompts:对应场景的英文提示词列表(保留生成模板前缀)
- scene_filenames / scene_errors:场景图文件名列表及对应失败场景的错误信息
Citation
@article{yao2026narrative,
title = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning},
author = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye},
journal = {arXiv preprint arXiv:2603.06688},
year = {2026}
}