@article{yao2026narrative, title = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning}, author = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye}, journal = {arXiv preprint arXiv:2603.06688}, year = {2026} }

日期

2 个月前

论文 URL

2603.06688

许可证

Apache 2.0

标签

视频理解

图像生成

EAVSD 是由北京大学团队于 2026 年发布的电商广告视频分镜数据集，旨在支持面向主体的多图像生成与叙事规划任务。相关论文成果为 Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning，广泛应用于面向主体的多图像生成与叙事规划任务，核心聚焦电商广告视频分镜生成与可控长程视觉一致性研究。该数据集包含 50,538 个产品样本，总计 401,351 张场景图，涵盖 8 个匿名化电商产品类别，每个样本包含 1 张参考图片、 8 条英文场景提示词及对应生成的场景图，参考图像由 Qwen-VL 模型从原始商品列表中提取清洗，场景提示词由大语言模型规划并扩展为电影级英文描述，最终场景图像通过 Novita AI 的图像编辑 API 生成，所有场景图均为模型合成数据。

数据字段

id：资产唯一标识符（如 category_a_000123）
category：所属产品类别（category_a ~ category_h）
reference：参考产品图文件名
n_scenes_generated / n_scenes_total：实际生成的场景数量与总计划数量（固定为 8）
scene_prompts：对应场景的英文提示词列表（保留生成模板前缀）
scene_filenames / scene_errors：场景图文件名列表及对应失败场景的错误信息

Citation

@article{yao2026narrative,
title   = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning},
author  = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye},
journal = {arXiv preprint arXiv:2603.06688},
year    = {2026}
}

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

Command Palette

EAVSD 电商广告视频分镜数据集

数据字段

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

EAVSD 电商广告视频分镜数据集

数据字段

Citation

相关数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

TACK 靶向嵌合体知识库数据集

DeepCrack 基础设施裂缝检测数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

VisCoR-55K 视觉推理数据集

Global Earthquake-M4.5 全球 4.5 级以上地震数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

Breast Cancer：Multi-Modal Fusion 乳腺癌多模态融合数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

PanScale 遥感全色锐化数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

Groundsource 全球洪水事件数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

EAVSD 电商广告视频分镜数据集

数据字段

Citation

相关数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

TACK 靶向嵌合体知识库数据集

DeepCrack 基础设施裂缝检测数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

VisCoR-55K 视觉推理数据集

Global Earthquake-M4.5 全球 4.5 级以上地震数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

Breast Cancer：Multi-Modal Fusion 乳腺癌多模态融合数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

PanScale 遥感全色锐化数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

Groundsource 全球洪水事件数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

TACK 靶向嵌合体知识库数据集

DeepCrack 基础设施裂缝检测数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

VisCoR-55K 视觉推理数据集

Global Earthquake-M4.5 全球 4.5 级以上地震数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

Breast Cancer：Multi-Modal Fusion 乳腺癌多模态融合数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

PanScale 遥感全色锐化数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集