HyperAIHyperAI

Command Palette

Search for a command to run...

EAVSD 电商广告视频分镜数据集

日期

1 小时前

论文 URL

2603.06688

许可证

Apache 2.0

EAVSD 是由北京大学团队于 2026 年发布的电商广告视频分镜数据集,旨在支持面向主体的多图像生成与叙事规划任务。相关论文成果为 Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning,广泛应用于面向主体的多图像生成与叙事规划任务,核心聚焦电商广告视频分镜生成与可控长程视觉一致性研究。 该数据集包含 50,538 个产品样本,总计 401,351 张场景图,涵盖 8 个匿名化电商产品类别,每个样本包含 1 张参考图片、 8 条英文场景提示词及对应生成的场景图,参考图像由 Qwen-VL 模型从原始商品列表中提取清洗,场景提示词由大语言模型规划并扩展为电影级英文描述,最终场景图像通过 Novita AI 的图像编辑 API 生成,所有场景图均为模型合成数据。

数据字段

  • id:资产唯一标识符(如 category_a_000123)
  • category:所属产品类别(category_a ~ category_h)
  • reference:参考产品图文件名
  • n_scenes_generated / n_scenes_total:实际生成的场景数量与总计划数量(固定为 8)
  • scene_prompts:对应场景的英文提示词列表(保留生成模板前缀)
  • scene_filenames / scene_errors:场景图文件名列表及对应失败场景的错误信息

Citation

@article{yao2026narrative,
title   = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning},
author  = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye},
journal = {arXiv preprint arXiv:2603.06688},
year    = {2026}
}

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供