Command Palette
Search for a command to run...
自己注意生成対抗ネットワーク
自己注意生成対抗ネットワーク
Han Zhang Ian Goodfellow Dimitris Metaxas Augustus Odena
概要
本論文では、画像生成タスクにおいてアテンション駆動の長距離依存関係モデリングを可能にする自己注意生成対抗ネットワーク(Self-Attention Generative Adversarial Network: SAGAN)を提案します。従来の畳み込みGANは、高解像度の詳細を低解像度の特徴マップ内の空間的に局所的な点のみの関数として生成します。SAGANでは、すべての特徴位置からのヒントを使用して詳細を生成することができます。さらに、識別器は画像の遠隔部分に存在する非常に詳細な特徴が互いに一貫しているかどうかを確認できます。また、最近の研究では、ジェネレータの条件付けがGANの性能に影響を与えることが示されています。この洞察に基づいて、スペクトル正規化をGANジェネレータに適用し、これが学習ダイナミクスを改善することを見出しました。提案されたSAGANは最新かつ最高の結果を達成し、困難なImageNetデータセット上で最良公表値であるインセプションスコアを36.8から52.52へと向上させ、フロベニウス・インセプション距離も27.62から18.65へと低下させました。アテンション層の可視化により、ジェネレータが固定形状の局所領域ではなく物体形状に対応する近傍を利用していることが確認されました。