
要約
生成対抗ネットワーク(GANs)は、高次元の確率分布を暗黙的に学習するための非常に人気のあるツールとなっています。元のGANフォーミュレーションにはモード崩壊、収束問題、エンタングルメント、画像の視覚的品質の低さなどの欠点がありましたが、それらに対処するためにいくつかの改良が加えられています。視覚的品質の向上に多くの努力が注がれてきた一方で、オブジェクティブな画像品質指標がGANの目的関数においてコスト関数や正則化項として利用されていないことは意外です。本研究では、構造的類似度指数(SSIM, 一般的なフルリファレンス画像品質評価アルゴリズム)の変種である距離指標と、自然画像品質評価器(NIQE, 一般的なノーリファレンス画像品質評価アルゴリズム)から着想を得た新しい品質認識型ディスクリミネーター勾配罰則関数をそれぞれ優れた正則化項としてGANの目的関数に適用する方法を示します。特に、CIFAR-10、STL10およびCelebAデータセット上でWasserstein GAN勾配罰則(WGAN-GP)フレームワークを使用して最先端の性能を達成することを実証しています。