Allegro ビデオ生成デモ

チュートリアルの紹介
该教程至少需要 NVIDIA RTX A6000 48GB 启动。
Allegro は、2024 年に Rhymes AI によって開発された最先端のテキストからビデオへの生成モデルです。基本的なテキスト入力を高解像度のビデオ コンテンツに変換する機能があり、特に 720p の解像度、15 フレーム/秒の滑らかさなどで表されます。 ~ 6 秒単位のビデオの長さ。関連する論文結果は「Allegro: 商用レベルのビデオ生成モデルのブラック ボックスを開く”。 このモデルは、ビデオ合成の分野で優れたパフォーマンスを発揮し、品質と時間的コヒーレンスの両方に優れています。説明テキストに基づいて動的なビジュアル コンテンツを迅速に生成でき、コンテンツ作成者にビデオを作成するための柔軟で制御可能な方法を提供します。 ユーザー調査では、Allegro モデルは既存のオープンソース モデルやほとんどの商用モデルを上回るパフォーマンスを実証しました。さらに、Allegro は、モデルのスケーリング、即時改良の適応性、ビデオ トークナイザーの設計などの基本機能の強化に関する洞察とガイダンスを提供します。これらの機能強化により、入力テキストの物語の詳細に基づいて複雑なビデオ コンテンツを生成するモデルの機能が向上します。
このチュートリアルはモデル推論チュートリアルです。モデルのビデオ生成には時間がかかるため、このチュートリアルでは 5 秒のビデオしか生成できません (所要時間は約 40 分)。
ステップの実行
コンテナーを複製して起動した後、API アドレスをクリックして Web インターフェイスに入ります。

1. テキストからビデオへの生成
- テキスト プロンプトの単語を入力し、[送信] をクリックします (起動時にモデルをロードするのに約 30 秒かかります。その後、進行状況バーが表示され、ビデオの生成が開始されます。5 つのメッセージを生成するには約 40 分かかります)。 2番目のビデオなのでしばらくお待ちください)
以下に示すように

- ビデオの生成が完了すると、進行状況バーが再生用のビデオに自動的に変わります。
以下に示すように

2.ビデオのダウンロード
- 動画の右側にあるダウンロードボタンをクリックして動画をダウンロードします。
以下に示すように

交流とディスカッション
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。
