日付

1年前

サイズ

291.26 MB

タグ

GitHub

論文URL

チュートリアルの紹介

该教程至少需要 NVIDIA RTX A6000 48GB 启动。

Allegroは、Rhymes AIが2024年に開発した最先端のテキスト動画生成モデルです。基本的なテキスト入力を高解像度の動画コンテンツに変換する機能を備えており、具体的には720pの解像度、毎秒15フレームの滑らかな動画再生、最大6秒の動画再生を実現しています。関連研究論文も公開されています。 Allegro: 商用レベルのビデオ生成モデルのブラックボックスを開くこのモデルは、動画合成において卓越した性能を発揮し、品質と時間的一貫性の両方において優れています。説明文から動的なビジュアルコンテンツを迅速に生成することで、コンテンツ制作者に柔軟かつ制御可能な動画制作アプローチを提供します。ユーザー調査では、Allegroモデルは既存のオープンソースモデルやほとんどの商用モデルよりも優れた性能を示しました。さらに、Allegroは、モデル拡張、キュー改良の適応性、動画セグメンテーション設計など、強化された基本機能に関する詳細な洞察とガイダンスを提供します。これらの機能強化により、入力テキストの物語の詳細に基づいて複雑な動画コンテンツを生成するモデルの能力が向上します。

このチュートリアルはモデル推論チュートリアルです。モデルのビデオ生成には時間がかかるため、このチュートリアルでは 5 秒のビデオしか生成できません (所要時間は約 40 分)。

ステップの実行

コンテナーを複製して起動した後、API アドレスをクリックして Web インターフェイスに入ります。

1. テキストからビデオへの生成

テキストプロンプトの単語を入力し、[送信] をクリックします (起動時にモデルをロードするのに約 30 秒かかります。その後、進行状況バーが表示され、ビデオの生成が開始されます。5 つのメッセージを生成するには約 40 分かかります)。 2番目のビデオなのでしばらくお待ちください）

以下に示すように

ビデオの生成が完了すると、進行状況バーが再生用のビデオに自動的に変わります。

以下に示すように

2.ビデオのダウンロード

動画の右側にあるダウンロードボタンをクリックして動画をダウンロードします。

以下に示すように

交流とディスカッション

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行 Discordで議論

日付

1年前

サイズ

291.26 MB

タグ

GitHub

論文URL

チュートリアルの紹介

该教程至少需要 NVIDIA RTX A6000 48GB 启动。

ステップの実行

コンテナーを複製して起動した後、API アドレスをクリックして Web インターフェイスに入ります。

1. テキストからビデオへの生成

テキストプロンプトの単語を入力し、[送信] をクリックします (起動時にモデルをロードするのに約 30 秒かかります。その後、進行状況バーが表示され、ビデオの生成が開始されます。5 つのメッセージを生成するには約 40 分かかります)。 2番目のビデオなのでしばらくお待ちください）

以下に示すように

ビデオの生成が完了すると、進行状況バーが再生用のビデオに自動的に変わります。

以下に示すように

2.ビデオのダウンロード

動画の右側にあるダウンロードボタンをクリックして動画をダウンロードします。

以下に示すように

交流とディスカッション

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

2ヶ月前

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

21日前

TRELLIS.2 3D生成デモ

19日前

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

3ヶ月前

Krea-realtime-video: リアルタイムビデオ生成モデル

3ヶ月前

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

1ヶ月前

ドクリング: ドキュメント解析アーティファクト

2ヶ月前

Ministry-3-14B-Instructのワンクリック展開

2ヶ月前

HunyuanWorld-Mirror: 3D世界生成モデル

3ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

Allegro ビデオ生成デモ

チュートリアルの紹介

ステップの実行

1. テキストからビデオへの生成

2.ビデオのダウンロード

交流とディスカッション

AIでAIを構築

HyperAI Newsletters

Command Palette

Allegro ビデオ生成デモ

チュートリアルの紹介

ステップの実行

1. テキストからビデオへの生成

2.ビデオのダウンロード

交流とディスカッション

関連 ノートブック

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

TRELLIS.2 3D生成デモ

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

Krea-realtime-video: リアルタイムビデオ生成モデル

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

ドクリング: ドキュメント解析アーティファクト

Ministry-3-14B-Instructのワンクリック展開

HunyuanWorld-Mirror: 3D世界生成モデル

AIでAIを構築

HyperAI Newsletters

Command Palette

Allegro ビデオ生成デモ

チュートリアルの紹介

ステップの実行

1. テキストからビデオへの生成

2.ビデオのダウンロード

交流とディスカッション

関連 ノートブック

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

TRELLIS.2 3D生成デモ

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

Krea-realtime-video: リアルタイムビデオ生成モデル

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

ドクリング: ドキュメント解析アーティファクト

Ministry-3-14B-Instructのワンクリック展開

HunyuanWorld-Mirror: 3D世界生成モデル

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

TRELLIS.2 3D生成デモ

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

Krea-realtime-video: リアルタイムビデオ生成モデル

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

ドクリング: ドキュメント解析アーティファクト

Ministry-3-14B-Instructのワンクリック展開

HunyuanWorld-Mirror: 3D世界生成モデル

関連 ノートブック

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

TRELLIS.2 3D生成デモ

MonkeyOCR: 構造認識関係のトリプルパラダイムに基づく文書解析

Krea-realtime-video: リアルタイムビデオ生成モデル

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

ドクリング: ドキュメント解析アーティファクト

Ministry-3-14B-Instructのワンクリック展開

HunyuanWorld-Mirror: 3D世界生成モデル

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック