Sora Dataset プロジェクトのビデオ データ セットを開く

Open-Sora-Plan は、OpenAI の Sora (T2V モデル) を再現し、Video-VQVAE (VideoGPT) + DiT に関する知識を構築することを目的としたオープンソース プロジェクトです。このプロジェクトは北京大学と Tuzhan Intelligence Company によって共同で開始され、この研究によりビデオ生成の品質とテキスト制御機能が大幅に向上しました。このモデルは、10 秒、24FPS 1024×1024 の高解像度ビデオを生成でき、高解像度画像の生成もサポートしており、ユーザーにより豊かで詳細な視覚体験を提供します。
このデータセットは、プロジェクトのビデオ データセットです。研究チームは、CC0 ライセンスに基づいてオープンソース Web サイトから 40,258 本のビデオをスクレイピングしました。すべてのビデオはウォーターマークなしの高品質で、そのうち約 60% が風景データです。合計所要時間は約です。 274時間05分13秒 。
主なデータ ソースは 3 つの部分に分かれています。