@article{yao2026narrative, title = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning}, author = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye}, journal = {arXiv preprint arXiv:2603.06688}, year = {2026} }

日付

2ヶ月前

Paper URL

2603.06688

ライセンス

Apache 2.0

タグ

ビデオ理解

画像生成

EAVSDは、北京大学の研究チームが2026年に公開したeコマース広告動画のストーリーボードデータセットです。主題指向型の複数画像生成と物語構成タスクを支援することを目的としています。関連する研究論文には、以下のようなものがあります。物語の紡ぎ手：マルチモーダル条件付けによる制御可能な長距離視覚的一貫性の実現に向けてこれは、主題指向型の複数画像生成や物語構成のタスクで広く使用されており、特にeコマース広告動画のストーリーボード生成や、制御可能な長距離視覚的一貫性に関する研究に重点が置かれている。このデータセットには、50,538個の製品サンプルと合計401,351枚のシーン画像が含まれており、8つの匿名化されたeコマース製品カテゴリを網羅しています。各サンプルには、1枚の参照画像、8つの英語のシーンプロンプト、および対応する生成シーン画像が含まれています。参照画像は、Qwen-VLモデルによって元の製品リストから抽出およびクリーニングされ、シーンプロンプトは、大規模言語モデルによって計画され、映画のような英語の説明に展開されました。最終的なシーン画像は、Novita AIの画像編集APIを使用して生成され、すべてのシーン画像はモデル合成データです。

データフィールド

id: アセットの一意の識別子（例：category_a_000123）
カテゴリ: 製品が属するカテゴリ (カテゴリ a ～カテゴリ h)
参照: 参照対象の製品画像のファイル名
n_scenes_generated / n_scenes_total: 実際に生成されたシーン数と計画された合計シーン数（8に固定）の比率。
scene_prompts: 対応するシーンの英語のプロンプトのリスト（生成されたテンプレートの接頭辞を保持）。
scene_filenames / scene_errors: 失敗したシーンのシーングラフファイル名と、それに対応するエラーメッセージのリスト。

引用

@article{yao2026narrative,
title   = {Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning},
author  = {Yao, Zhengjian and Li, Yongzhi and Gao, Xinyuan and Chen, Quan and Jiang, Peng and Lu, Yanye},
journal = {arXiv preprint arXiv:2603.06688},
year    = {2026}
}

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

Command Palette

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

データフィールド

引用

AIでAIを構築

HyperAI Newsletters

Command Palette

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

データフィールド

引用

関連データセット

FigureBench科学イラスト生成ベンチマークデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

DeepCrackインフラストラクチャ亀裂検出データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

ViMUビデオメタファー理解データセット

イネ葉病害データセット

VisCoR-55K ビジュアル推論データセット

世界の地震データ（マグニチュード4.5以上）：世界中で発生したマグニチュード4.5以上の地震のデータセット。

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

乳がん：マルチモーダル融合データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

DRACOクロスドメイン深層研究ベンチマークデータセット

Nemotron Personas France（フランス合成ペルソナデータセット）

地上情報源による世界洪水イベントデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

データフィールド

引用

関連データセット

FigureBench科学イラスト生成ベンチマークデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

DeepCrackインフラストラクチャ亀裂検出データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

ViMUビデオメタファー理解データセット

イネ葉病害データセット

VisCoR-55K ビジュアル推論データセット

世界の地震データ（マグニチュード4.5以上）：世界中で発生したマグニチュード4.5以上の地震のデータセット。

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

乳がん：マルチモーダル融合データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

DRACOクロスドメイン深層研究ベンチマークデータセット

Nemotron Personas France（フランス合成ペルソナデータセット）

地上情報源による世界洪水イベントデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

FigureBench科学イラスト生成ベンチマークデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

DeepCrackインフラストラクチャ亀裂検出データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

ViMUビデオメタファー理解データセット

イネ葉病害データセット

VisCoR-55K ビジュアル推論データセット

世界の地震データ（マグニチュード4.5以上）：世界中で発生したマグニチュード4.5以上の地震のデータセット。

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

乳がん：マルチモーダル融合データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

DRACOクロスドメイン深層研究ベンチマークデータセット

Nemotron Personas France（フランス合成ペルソナデータセット）