HyperAIHyperAI

Command Palette

Search for a command to run...

ComfyUI Hunyuanカスタムビデオ生成ワークフローチュートリアル

Date

8ヶ月前

Size

3.28 GB

Paper URL

2505.04512

1. チュートリアルの概要

建てる

このチュートリアルでは、リソースとしてRTX 4090カード1枚を使用し、ビデオ生成には約10分かかります。より良い生成品質を得るには、80GBのメモリを搭載したGPUの使用を推奨します。

テンセントのHunyuanチームが2025年5月9日にリリースしたHunyuanCustomは、マルチモーダルなカスタマイズ動画生成フレームワークです。Hunyuan Video生成フレームワークを基盤とし、トピックの一貫性を重視したマルチモーダルかつ条件付き制御可能な生成モデルです。テキスト、画像、音声、動画を入力として、トピックの一貫性のある動画を生成できます。HunyuanCustomのマルチモーダル機能を活用することで、様々な下流タスクを実現できます。例えば、複数の画像を入力として取得することで、HunyuanCustomはバーチャルヒューマンによる広告やバーチャルメイクアップの試着を容易にします。関連研究論文も公開されています。 HunyuanCustom: カスタマイズされたビデオ生成のためのマルチモーダル駆動型アーキテクチャ

このワークフロー チュートリアルでは、合計で次のモデル ファイルを使用します。

  • hunyuan_video_custom_720p_fp8_scaled.safetensors
  • llava_llama3_fp16.セーフテンソル
  • hunyuan_video_vae_bf16.safetensors
  • clip_l.safetensors

2. プロジェクト例

マルチモーダルビデオのカスタマイズ

さまざまなアプリケーション

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

2. 機能デモンストレーション 

利用手順

  1. 最初のクローンでは、ロード用のワークフローファイルを手動でインポートする必要があります。
  1. 画像生成ビデオ

画像を選択

入力プロンプト 

結果出力 

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。 

引用情報

このプロジェクトの引用情報は次のとおりです。

@misc{hu2025hunyuancustom,
      title={HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation}, 
      author={Teng Hu and Zhentao Yu and Zhengguang Zhou and Sen Liang and Yuan Zhou and Qin Lin and Qinglin Lu},
      year={2025},
      eprint={2505.04512},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2505.04512}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています