HyperAI超神経

オンラインチュートリアル: ByteDanceがInfiniteYou画像生成フレームワークをオープンソース化し、高忠実度の顔特徴移行を実現

特色图像

InfiniteYou (略称 InfU) は、ByteDance Intelligent Creation が最近リリースした Diffusion Transformers をベースにした、アイデンティティ保存型画像生成フレームワークです。高度な技術を使用して、画像を生成する際に人物のアイデンティティの一貫性を維持します。つまり、さまざまなシーンの写真を生成するときに顔の特徴を正確に保持できます。

InfU は、この分野で Diffused Transformers (DiTs) を活用する最も初期のフレームワークの 1 つとして、既存の方法の 3 つの主要な問題 (不十分な ID 類似性、画像とテキストの配置バイアス、生成品質と美的パフォーマンスの低下) に体系的に対処します。その中核となるイノベーションである InfuseNet は、残余接続を通じて DiT ベース モデルに ID 機能を注入し、生成機能を維持しながら ID の忠実度を大幅に向上させます。事前トレーニングと、合成単一人物マルチサンプル (SPMS) データを使用した教師あり微調整 (SFT) を含む多段階トレーニング戦略を採用して、画像とテキストの配置をさらに最適化し、生成品質を向上させ、顔の重複の影響を効果的に軽減します。広範囲にわたる実験により、InfU はあらゆる面で既存のベースライン メソッドを上回り、SOTA レベルのパフォーマンスを達成することが示されました。

現在、HyperAI公式サイトのチュートリアルセクションにて「InfiniteYou高忠実度画像生成デモ」チュートリアルが公開されています。ご興味がございましたら、ぜひ一度お試しください!

チュートリアルのアドレス:

https://go.hyper.ai/xQnpS

デモの実行

1. hyper.ai にログインし、チュートリアル ページで InfiniteYou High-Fidelity Image Generation Demo を選択し、このチュートリアルをオンラインで実行をクリックします。

2. ページがジャンプしたら、右上隅の「クローン」をクリックしてチュートリアルを独自のコンテナにクローンします。

3. 「NVIDIA RTX A6000」と「PyTorch」のイメージを選択します。 OpenBayes プラットフォームは 4 つの課金方法を提供します。ニーズに応じて、「従量制」または「日次/週次/月次」を選択できます。 「続行」をクリックします。以下の招待リンクを使用してサインアップした新規ユーザーは、4 時間の RTX 4090 + 5 時間の CPU を無料で入手できます。

HyperAI限定招待リンク(コピーしてブラウザで開く):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. リソースが割り当てられるのを待ちます。最初のクローン作成プロセスには約 2 分かかります。ステータスが「実行中」に変わったら、「API アドレス」の横にあるジャンプ矢印をクリックしてデモ ページに移動します。 APIアドレスアクセス機能を使用する前に、ユーザーは実名認証を完了する必要がありますのでご注意ください。

エフェクト表示

1. デモページに入ったら、まず「アイデンティティ画像」に顔が写っている写真をアップロードし、プロンプトを入力して「モデルバージョン」でモデルバージョンを選択します。ここでは、画像とテキストの配置と生成効果を向上させるために、デフォルトで「aes_stage2」が使用されます。より高いID類似度が必要な場合は、「sim_stage1」を試してください。 「コントロール画像【任意】」では、顔のコントロール画像をアップロードできます。モデルは、生成を制御するために 5 つの顔のキー ポイントを抽出します。これは必須のアイテムではありません。最後に、「生成」をクリックして画像を生成します。

2. Yann Lecun の写真がここにアップロードされており、生成されたエフェクトがかなり優れていることがわかります。

*プロンプト: 自信を漂わせる洗練された紳士。彼は、1990年代の襟の高い茶色のチェック柄ジャケットにダークグレーのタートルネックを合わせています。彼のズボンは仕立てられており、チャコールカラーで、なめらかな革のベルトが付いています。背景には、本棚、大理石の暖炉、温かみのある照明を備えたエレガントな図書室が描かれており、洗練された居心地の良い雰囲気を醸し出しています。彼のリラックスした姿勢とポケットに手を入れたカジュアルな姿勢は、落ち着いたスタイリッシュな雰囲気を醸し出している。

以上が今回HyperAIが推奨するチュートリアルです。ぜひご自身でお試しください!

チュートリアルのアドレス:https://go.hyper.ai/xQnpS