HyperAI超神経

Sora Dataset プロジェクトのビデオ データ セットを開く

ダウンロードヘルプ
特色图像

Open-Sora-Plan は、OpenAI の Sora (T2V モデル) を再現し、Video-VQVAE (VideoGPT) + DiT に関する知識を構築することを目的としたオープンソース プロジェクトです。このプロジェクトは北京大学と Tuzhan Intelligence Company によって共同で開始され、この研究によりビデオ生成の品質とテキスト制御機能が大幅に向上しました。このモデルは、10 秒、24FPS 1024×1024 の高解像度ビデオを生成でき、高解像度画像の生成もサポートしており、ユーザーにより豊かで詳細な視覚体験を提供します。

このデータセットは、プロジェクトのビデオ データセットです。研究チームは、CC0 ライセンスに基づいてオープンソース Web サイトから 40,258 本のビデオをスクレイピングしました。すべてのビデオはウォーターマークなしの高品質で、そのうち約 60% が風景データです。合計所要時間は約です。 274時間05分13秒

主なデータ ソースは 3 つの部分に分かれています。

  1. ミックスキット: 研究チームが収集したビデオの総数は 1,234、合計期間はおよそ 6時間19分32秒、フレームの総数は 570,815
  2. ピクセル: 研究チームが収集したビデオの総数は 7,408、合計所要時間は約です。 48時間49分24秒、フレームの総数は 5,038,641
  3. ピクサベイ: 研究チームが収集したビデオの総数は 31,616、合計所要時間は約です。 218時間56分17秒、フレームの総数は 23,508,970