HyperAI超神経

PhotoMaker V2 はパーソナライズされた写真を数秒で生成します デモ

PhotoMaker V2: V1 と比較して ID 忠実度が向上し、制御性が向上しました

チュートリアルの紹介

PhotoMaker は、2024 年に Tencent チームによってオープンソース化された効率的なポートレート カスタマイズ モデルです。ポートレートに基づいてカスタマイズされた芸術的なスタイルの写真を迅速に生成できます。キャラクターのパーソナライズされた写真を生成するだけでなく、キャラクターの年齢や性別を変更したり、さまざまなキャラクターの特徴を統合して新しいキャラクター情報を作成したりすることもできる、非常に実用的な AI ペイント ツールです。このチュートリアルは PhotoMaker のバージョン 2.0 であり、V1 に比べて文字の一貫性と操作性が大幅に向上しています。

このチュートリアルには関連する環境がセットアップされています。デモを体験するにはコマンドを入力するだけです。

PhotoMaker V2 の主な改善点

  • ID の忠実度は、特に単一画像入力とアジア人の顔入力でさらに向上しました。より多くの顔画像を入力すると、より良い結果が得られる可能性があります。
  • ControlNet、twi-adapter、および IP-Adapter を統合することにより、生成プロセスはより制御可能になります。研究チームは、参考として対応するスクリプトを提供しています。さらに、PhotoMaker V2 では、IP-Adapter-FaceID、InstantID、Character LoRA と組み合わせることで、より優れた ID の一貫性を実現できます。
  • PhotoMaker V2 は、高品質で多様な生成機能、強力なテキスト コントロールなど、PhotoMaker V1 の優れた機能を継承しています。さらに、古い写真や絵画の人物を現実に復元したり、アイデンティティを混合したり、年齢や性別を変更したりするなど、以前のモデルを統合できます。

エフェクト表示

実行メソッド

1. コンテナーを複製して起動した後、ワークスペースを開きます

1

2. 新しいターミナルを作成し、コマンドを入力します。 bash run.sh

3. ポート 8080 が表示されたら、右側の API アドレスのリンクをクリックしてモデル エクスペリエンスを入力します。

4. Web サイトに入ると、次のインターフェイスが表示されます。

  • 使用したいポートレート画像をアップロードします(複数の画像をアップロードできます)
  • 英語の入力プロンプトを使用すると、モデルは入力プロンプトに基づいて画像を生成します。

生成されるカテゴリ語彙は、男性 img、女性 img、少女 img などのトリガー ワード img を使用する必要があることに注意してください。

  • スタイル テンプレートから目的のスタイルを選択します。これらのスタイルはプリセットキューです。
  • 「送信」をクリックして画像を生成します。

ウェブサイトの下部にいくつかの例があります。クリックして直接ロードしてください。

同時に、必要に応じて詳細設定を変更することもできます。以下にいくつかのパラメーターの説明を示します。

  • ネガティブ プロンプト: これは、出力を生成するときに避けるべき機能を指定します。 「対称性が悪い、品質が悪い、低品質、イラスト、3D、2D、絵画、漫画、スケッチ、口を開けている」などの用語を入力すると、モデルは生成される画像にこれらの特徴が含まれないようにします。
  • サンプル ステップ数: 画像生成時にモデルが実行するステップ数を制御します。ステップが増えると、モデルの出力を改良する機会が増えるため、通常はより高品質の画像が生成されます。
  • スタイルの強さ: 指定されたスタイルが出力画像にどの程度影響を与えるかを示します。パーセンテージが高いほど、スタイルの影響が大きくなります。
  • 出力画像の数: モデルが 1 回の生成プロセスで生成する画像の数を決定します。
  • ガイダンス スケール: このパラメーターは、モデルがプロンプトにどの程度従う必要があるかを調整します。ブートストラップ率が高いほど、モデルがキューに忠実に従うことを意味し、結果はより正確になりますが、創造性が低下する可能性があります。
  • シード: シード値は乱数ジェネレーターを初期化するために使用され、出力に影響します。特定のシードを設定することで、再現可能な結果を保証できます。 Randomize シードをチェックすると、毎回異なる画像が生成されます。

話し合ってコミュニケーションする

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しましたので、お友達がコードをスキャンしてメモを作成し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりするためにグループに参加することを歓迎します↓。