
要約
生成対抗ネットワーク(Generative Adversarial Networks: GANs)は最近、複雑なデータ分布を成功裏に近似することを示しています。このモデルの重要な拡張が条件付きGANs(conditional GANs: cGANs)であり、外部情報の導入により生成された画像の特定の表現を決定することが可能になります。本研究では、cGANの逆写像を行うエンコーダーを評価します。つまり、実際の画像を潜在空間と条件付き表現にマッピングするプロセスです。これにより、例えば任意の属性に基づいて顔の実際の画像を再構成し、変更することが可能になります。さらに、cGANの設計も評価します。エンコーダーとcGANを組み合わせたモデル、これを可逆cGAN(Invertible cGAN: IcGAN)と呼ぶことで、確定的な複雑な変更を加えて実際の画像を再生成することが可能となります。