プロジェクト概要

Vchitect-2.0は、上海人工知能研究所のチームによって2024年9月に開発された高品質動画生成システムです。このモデルは革新的な並列Transformerアーキテクチャ設計を採用し、20億個のパラメータを誇り、テキストプロンプトに基づいて滑らかで高品質な動画コンテンツを生成することができます。関連論文では… Vchitect-2.0: ビデオ拡散モデルのスケールアップのための並列トランスフォーマー。

このチュートリアルでは、単一カード A6000 のリソースを使用します。

ステップの実行

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。

2. ウェブページに入ると、モデルと対話することができます

動画を生成するには、テキストプロンプトを入力する必要があります。テキストプロンプトは英語のみに対応しています。テキストプロンプトの長さは任意ですが、100文字以内を推奨します。100文字を超えると、生成される動画が長くなりすぎて画質に影響する可能性があります。動画の生成には2～5分ほどかかりますので、しばらくお待ちください。

交流とディスカッション

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

Githubユーザーに感謝ジャンジュンチャンこのチュートリアルの展開では、プロジェクト参照情報は次のとおりです。

@article{fan2025vchitect, title={Vchitect-2.0: Parallel Transformer for Scaling Up Video Diffusion Models}, author={Fan, Weichen and Si, Chenyang and Song, Junhao and Yang, Zhenyu and He, Yinan and Zhuo, Long and Huang, Ziqi and Dong, Ziyue and He, Jingwen and Pan, Dongwei and others}, journal={arXiv preprint arXiv:2501.08453}, year={2025} }

HyperAI

このNotebookを実行 Discordで議論

日付

8ヶ月前

サイズ

395.28 MB

タグ

テキストから動画

動画生成

ライセンス

Apache 2.0

GitHub

Vchitect/Vchitect-2.0

論文URL

2501.08453

プロジェクト概要

このチュートリアルでは、単一カード A6000 のリソースを使用します。

ステップの実行

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。

2. ウェブページに入ると、モデルと対話することができます

動画を生成するには、テキストプロンプトを入力する必要があります。テキストプロンプトは英語のみに対応しています。テキストプロンプトの長さは任意ですが、100文字以内を推奨します。100文字を超えると、生成される動画が長くなりすぎて画質に影響する可能性があります。動画の生成には2～5分ほどかかりますので、しばらくお待ちください。

交流とディスカッション

引用情報

Githubユーザーに感謝ジャンジュンチャンこのチュートリアルの展開では、プロジェクト参照情報は次のとおりです。

@article{fan2025vchitect,
  title={Vchitect-2.0: Parallel Transformer for Scaling Up Video Diffusion Models},
  author={Fan, Weichen and Si, Chenyang and Song, Junhao and Yang, Zhenyu and He, Yinan and Zhuo, Long and Huang, Ziqi and Dong, Ziyue and He, Jingwen and Pan, Dongwei and others},
  journal={arXiv preprint arXiv:2501.08453},
  year={2025}
}

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行 Discordで議論

日付

8ヶ月前

サイズ

395.28 MB

タグ

テキストから動画

動画生成

ライセンス

Apache 2.0

GitHub

Vchitect/Vchitect-2.0

論文URL

2501.08453

プロジェクト概要

このチュートリアルでは、単一カード A6000 のリソースを使用します。

ステップの実行

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。

2. ウェブページに入ると、モデルと対話することができます

動画を生成するには、テキストプロンプトを入力する必要があります。テキストプロンプトは英語のみに対応しています。テキストプロンプトの長さは任意ですが、100文字以内を推奨します。100文字を超えると、生成される動画が長くなりすぎて画質に影響する可能性があります。動画の生成には2～5分ほどかかりますので、しばらくお待ちください。

交流とディスカッション

引用情報

Githubユーザーに感謝ジャンジュンチャンこのチュートリアルの展開では、プロジェクト参照情報は次のとおりです。

@article{fan2025vchitect,
  title={Vchitect-2.0: Parallel Transformer for Scaling Up Video Diffusion Models},
  author={Fan, Weichen and Si, Chenyang and Song, Junhao and Yang, Zhenyu and He, Yinan and Zhuo, Long and Huang, Ziqi and Dong, Ziyue and He, Jingwen and Pan, Dongwei and others},
  journal={arXiv preprint arXiv:2501.08453},
  year={2025}
}

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

3ヶ月前

Krea-realtime-video: リアルタイムビデオ生成モデル

3ヶ月前

SAM3: 視覚セグメンテーションモデル

2ヶ月前

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

2ヶ月前

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

21日前

TRELLIS.2 3D生成デモ

19日前

Supertonic: ONNXに基づく高速TTS音声合成モデル

2ヶ月前

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

1ヶ月前

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

2ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

Vchitect-2.0 ビデオ拡散モデルデモ

プロジェクト概要

ステップの実行

交流とディスカッション

引用情報

AIでAIを構築

HyperAI Newsletters

Command Palette

Vchitect-2.0 ビデオ拡散モデルデモ

プロジェクト概要

ステップの実行

交流とディスカッション

引用情報

関連 ノートブック

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

Krea-realtime-video: リアルタイムビデオ生成モデル

SAM3: 視覚セグメンテーションモデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

TRELLIS.2 3D生成デモ

Supertonic: ONNXに基づく高速TTS音声合成モデル

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

AIでAIを構築

HyperAI Newsletters

Command Palette

Vchitect-2.0 ビデオ拡散モデルデモ

プロジェクト概要

ステップの実行

交流とディスカッション

引用情報

関連 ノートブック

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

Krea-realtime-video: リアルタイムビデオ生成モデル

SAM3: 視覚セグメンテーションモデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

TRELLIS.2 3D生成デモ

Supertonic: ONNXに基づく高速TTS音声合成モデル

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

Krea-realtime-video: リアルタイムビデオ生成モデル

SAM3: 視覚セグメンテーションモデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

TRELLIS.2 3D生成デモ

Supertonic: ONNXに基づく高速TTS音声合成モデル

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

関連 ノートブック

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

Krea-realtime-video: リアルタイムビデオ生成モデル

SAM3: 視覚セグメンテーションモデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

Nemotron-Speech-Streaming-ASR: 自動音声認識デモ

TRELLIS.2 3D生成デモ

Supertonic: ONNXに基づく高速TTS音声合成モデル

Kiss3DGen: 画像拡散モデルに基づく3Dアセット生成フレームワーク

Z-Image-Turbo: 高効率6Bパラメータ画像生成モデル

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック