Command Palette
Search for a command to run...
EAVSD(電子商取引広告ビデオストーリーボードデータセット)
EAVSDは、北京大学の研究チームが2026年に公開したeコマース広告動画のストーリーボードデータセットです。主題指向型の複数画像生成と物語構成タスクを支援することを目的としています。関連する研究論文には、以下のようなものがあります。 物語の紡ぎ手:マルチモーダル条件付けによる制御可能な長距離視覚的一貫性の実現に向けてこれは、主題指向型の複数画像生成や物語構成のタスクで広く使用されており、特にeコマース広告動画のストーリーボード生成や、制御可能な長距離視覚的一貫性に関する研究に重点が置かれている。 このデータセットには、50,538個の製品サンプルと合計401,351枚のシーン画像が含まれており、8つの匿名化されたeコマース製品カテゴリを網羅しています。各サンプルには、1枚の参照画像、8つの英語のシーンプロンプト、および対応する生成シーン画像が含まれています。参照画像は、Qwen-VLモデルによって元の製品リストから抽出およびクリーニングされ、シーンプロンプトは、大規模言語モデルによって計画され、映画のような英語の説明に展開されました。最終的なシーン画像は、Novita AIの画像編集APIを使用して生成され、すべてのシーン画像はモデル合成データです。
データフィールド
- id: アセットの一意の識別子(例:category_a_000123)
- カテゴリ: 製品が属するカテゴリ (カテゴリ a ~ カテゴリ h)
- 参照: 参照対象の製品画像のファイル名
- n_scenes_generated / n_scenes_total: 実際に生成されたシーン数と計画された合計シーン数(8に固定)の比率。
- scene_prompts: 対応するシーンの英語のプロンプトのリスト(生成されたテンプレートの接頭辞を保持)。
- scene_filenames / scene_errors: 失敗したシーンのシーングラフファイル名と、それに対応するエラーメッセージのリスト。
引用
@article{yao2026narrative,
title = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning},
author = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye},
journal = {arXiv preprint arXiv:2603.06688},
year = {2026}
}