11日前

オムニGAN:cGANの秘密とそれ以上のもの

Peng Zhou, Lingxi Xie, Bingbing Ni, Cong Geng, Qi Tian
オムニGAN:cGANの秘密とそれ以上のもの
要約

条件付き生成対抗ネットワーク(cGAN)は高品質な画像生成に有効なツールであるが、従来の手法は多くが満足のいく性能を発揮できず、またモード崩壊(mode collapse)のリスクに直面している。本論文では、モデルの学習に適切な識別器(discriminator)を設計する際の「難しさ」を明らかにしたcGANの新バージョン、Omni-GANを提案する。本手法の鍵は、識別器に強力な監視信号を提供して概念を正しく捉えさせつつ、同時に適度な正則化により崩壊を回避することにある。Omni-GANは実装が容易であり、既存のエンコーディング手法(例:陰関数ニューラル表現、INR)と自由に統合可能である。実験により、Omni-GANおよびOmni-INR-GANが幅広い画像生成および復元タスクにおいて優れた性能を示すことが確認された。特に、Omni-INR-GANはImageNetデータセットにおいて、画像サイズ128と256のそれぞれで262.85および343.22という顕著なInceptionスコアを達成し、従来の記録を100点以上上回った。さらに、生成器の事前知識(generator prior)を活用することで、Omni-INR-GANは低解像度画像を任意の解像度まで拡張可能であり、最大で60倍以上の高解像度まで再構成が可能である。コードは公開されている。

オムニGAN:cGANの秘密とそれ以上のもの | 最新論文 | HyperAI超神経