HyperAI超神経

ComfyUI Hunyuanカスタムビデオ生成ワークフローチュートリアル

1. チュートリアルの概要

建てる

このチュートリアルでは、リソースとしてRTX 4090カード1枚を使用し、ビデオ生成には約10分かかります。より良い生成品質を得るには、80GBのメモリを搭載したGPUの使用を推奨します。

HunyuanCustomは、テンセントHunyuanチームが2025年5月9日にリリースしたマルチモーダルなカスタム動画生成フレームワークです。Hunyuan Video生成フレームワークを基盤として構築された、被写体の一貫性を中心としたマルチモーダルで条件付き制御可能な生成モデルです。テキスト、画像、音声、動画の入力を条件として、被写体の一貫性のある動画の生成をサポートします。HunyuanCustomのマルチモーダル機能により、多くの下流タスクを実行できます。例えば、複数の写真を入力として取り込むことで、HunyuanCustomはバーチャルヒューマン広告やバーチャルメイクアップトライアルを容易に実現できます。関連する論文結果は以下です。HunyuanCustom: カスタマイズされたビデオ生成のためのマルチモーダル駆動型アーキテクチャ”。

このワークフロー チュートリアルでは、合計で次のモデル ファイルを使用します。

  • hunyuan_video_custom_720p_fp8_scaled.safetensors
  • llava_llama3_fp16.セーフテンソル
  • hunyuan_video_vae_bf16.safetensors
  • clip_l.safetensors

2. プロジェクト例

マルチモーダルビデオのカスタマイズ

さまざまなアプリケーション

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

2. 機能デモンストレーション 

利用手順

  1. 最初のクローンでは、ロード用のワークフローファイルを手動でインポートする必要があります。
  1. 画像生成ビデオ

画像を選択

入力プロンプト 

結果出力 

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。 

引用情報

このプロジェクトの引用情報は次のとおりです。

@misc{hu2025hunyuancustom,
      title={HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation}, 
      author={Teng Hu and Zhentao Yu and Zhengguang Zhou and Sen Liang and Yuan Zhou and Qin Lin and Qinglin Lu},
      year={2025},
      eprint={2505.04512},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2505.04512}, 
}