2ヶ月前

StackGAN++: スタック型生成対抗ネットワークを用いた現実的な画像合成

Han Zhang; Tao Xu; Hongsheng Li; Shaoting Zhang; Xiaogang Wang; Xiaolei Huang; Dimitris Metaxas
StackGAN++: スタック型生成対抗ネットワークを用いた現実的な画像合成
要約

生成対抗ネットワーク(GANs)は様々なタスクで著しい成功を収めていますが、高品質な画像の生成には依然として課題が存在します。本論文では、高解像度の写実的な画像を生成することを目指したスタック型生成対抗ネットワーク(StackGAN)を提案します。まず、テキストから画像への合成に焦点を当てた二段階の生成対抗ネットワークアーキテクチャであるStackGAN-v1を提案します。Stage-I GANは、与えられたテキスト記述に基づいて物体の基本的な形状と色をスケッチし、低解像度の画像を生成します。Stage-II GANはStage-Iの結果とテキスト記述を入力として受け取り、写実的な詳細を持つ高解像度の画像を生成します。次に、条件付きおよび非条件付きの両方の生成タスク向けに進歩した多段階の生成対抗ネットワークアーキテクチャであるStackGAN-v2を提案します。我々のStackGAN-v2は木構造のように複数のジェネレータとディスクリミネータで構成されており、同じシーンに対応する複数スケールの画像が木構造内の異なる枝から生成されます。StackGAN-v2は、複数分布を同時近似することでStackGAN-v1よりも安定した学習挙動を示します。広範な実験により、提案されたスタック型生成対抗ネットワークが他の最先端手法よりも著しく優れた写実的な画像生成性能を持つことが確認されました。

StackGAN++: スタック型生成対抗ネットワークを用いた現実的な画像合成 | 最新論文 | HyperAI超神経