UNO: ユニバーサルカスタマイズ画像生成

1. チュートリアルの概要
UNOプロジェクトは、ByteDanceの知能創造チームが2025年4月にリリースしたAI画像生成モデルです。単一被写体と複数被写体の両方の画像生成をサポートし、複数のタスクを1つのモデルに統合し、強力な一般化機能を発揮できます。関連する論文の結果は以下の通りである。より少ないものからより多くのものへの一般化:コンテキスト内生成による制御性の向上”。
このプロジェクトは、複数のデータ形式とストレージ バックエンドをサポートし、強力なクエリ最適化機能と柔軟なスケーラビリティを備えており、大規模なデータ分析シナリオに適しています。 UNO は、シンプルな API と豊富な機能を通じて開発者が効率的なデータ処理プロセスを簡単に構築できるように支援し、企業と開発者に信頼性の高いデータ インフラストラクチャ サポートを提供することに取り組んでいます。
このチュートリアルでは、単一の RTX 4090 カードのリソースを使用します。
👉 このプロジェクトでは以下のモデルを提供します:
- FLUX.1-dev-fp 8: これは、テキストの説明から画像を生成できる 120 億パラメータ整流トランスです。
プロジェクト例

2. 操作手順
1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります
「モデル」が表示されない場合は、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってからページを更新してください。

2. Web ページに入ると、モデルと会話を開始できます。
❗️重要な使用上のヒント:
- ステップ数: モデルの反復回数または推論プロセスのステップ数を表し、モデルが結果を生成するために使用する最適化ステップの数を表します。通常、ステップ数が多いほど、より正確な結果が生成されますが、計算時間が長くなる可能性があります。
- ガイダンス: これは、生成モデル内の条件付き入力 (テキストや画像など) が生成される結果に影響を与える度合いを制御するために使用されます。ガイダンス値を高くすると、生成される結果が入力条件に近くなりますが、値を低くするとランダム性が高まります。
- シード: 生成プロセスのランダム性を制御するために使用される乱数シードです。同じシード値では同じ結果が生成されます (他のパラメータが同じである場合)。これは、結果を再現する上で非常に重要です。
利用手順

交流とディスカッション
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
Githubユーザーに感謝 xxxjjjyyy1 このチュートリアルを作成するためのプロジェクト参照情報は次のとおりです。
@article{wu2025less,
title={Less-to-More Generalization: Unlocking More Controllability by In-Context Generation},
author={Wu, Shaojin and Huang, Mengqi and Wu, Wenxu and Cheng, Yufeng and Ding, Fei and He, Qian},
journal={arXiv preprint arXiv:2504.02160},
year={2025}
}