Command Palette
Search for a command to run...
Paper2Video 論文ビデオベンチマークデータセット
※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。
Paper2Video は、シンガポール国立大学が 2025 年に公開した、論文とビデオのペアリングに関する最初のベンチマーク データセットです。Paper2Video: 科学論文からの自動ビデオ生成「」は、学術論文からプレゼンテーション ビデオ (スライド、字幕、音声、スピーカー アバターを含む) を自動生成するタスクの標準的なベンチマークと評価リソースを提供することを目的としています。
このデータセットには、101組の論文と動画が含まれています。各論文は平均約28.7ページ、約13,300語、44.7図で構成されています。各動画の長さは平均約6分15秒で、最大14分までで、平均16枚のスライドが含まれています。論文と動画に加えて、各サンプルには論文のメタデータ(タイトル、リンク、会議、年など)、講演者の画像、音声サンプルが含まれています。
データ構成
- メタデータ ファイル: 各サンプルの論文タイトル (paper)、論文リンク (paper_link)、プレゼンテーション ビデオ リンク (presentation_link)、会議名 (conference)、年 (year) などのフィールドが含まれます。
 - 作成者 ID ファイル。パーソナライズされたスピーカー合成、スピーカー レンダリング、アバター ビデオ生成などのタスクに使用できます。
- 各著者は識別画像(例:ref_img.png)を含める必要があります。
 - 音声サンプル(ref_audio.wavなど)
 
 
Paper2Video.torrent
シーディング 1ダウンロード中 0ダウンロード完了 1総ダウンロード数 19