Command Palette
Search for a command to run...
HunyuanImage-2.1: 高解像度(2K)Hunyuan画像のための拡散モデル
1. チュートリアルの概要

HunyuanImage-2.1は、テンセントHunyuanチームが2025年9月にリリースしたオープンソースの文学画像モデルです。ネイティブ2K解像度をサポートし、強力な複雑な意味理解機能を備え、シーンの詳細、キャラクターの表情や動作を正確に生成できます。このモデルは中国語と英語の入力をサポートし、画像内のテキストと詳細を安定的に制御しながら、漫画やフィギュアなど、様々なスタイルの画像を生成できます。このモデルは、デュアルチャネルテキストエンコーダーや高圧縮VAEなどの技術に基づいており、トレーニングと推論の効率を大幅に向上させます。関連する論文の結果は次のとおりです。PromptEnhancer: 思考連鎖プロンプト書き換えによるテキスト画像変換モデルを強化するシンプルなアプローチ”。
このチュートリアルでは、単一の RTX PRO 6000 グラフィック カードをコンピューティング リソースとして使用し、テスト用のテキストから画像への生成と画像の改良という 2 つの機能を提供します。
2. エフェクト表示
テキストから画像への生成

画像の改良

3. 操作手順
1. コンテナを起動します
「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

2. 使用手順
1. テキストから画像への生成

パラメータの説明:
- 蒸留モデルの使用: 蒸留モデルを使用すると、結果はより速く生成されますが、品質は若干低下します。
- プロンプト:ここにテキストを入力できます。
- 否定プロンプト: AI に「何かを生成しない」ように指示する否定プロンプト。
- アスペクト比: 生成する画像のアスペクト比を選択します。
- 推論ステップ: 推論ステップ。ステップ数が多いほど品質は向上しますが、生成速度は遅くなります。
- ガイダンススケール: プロンプトにどれだけ厳密に従うか。
- シード:種子。
- リファイナーの使用: 画像のリファイニングを使用するかどうか。
2. 画像の改良

パラメータの説明:
- 絞り込みプロンプト:ここにテキストを入力できます。
- 幅: 出力画像の幅。
- 高さ: 出力画像の高さ。
- 改良ステップ:推論ステップを改良します。ステップ数が多いほど品質は向上しますが、生成速度は遅くなります。
- ガイダンススケール: プロンプトにどれだけ厳密に従うか。
- シード:種子。
4. 議論
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
このプロジェクトの引用情報は次のとおりです。
@misc{HunyuanImage-2.1,
title={HunyuanImage 2.1: An Efficient Diffusion Model for High-Resolution (2K) Text-to-Image Generation},
author={Tencent Hunyuan Team},
year={2025},
howpublished={\url{https://github.com/Tencent-Hunyuan/HunyuanImage-2.1}},
}