2ヶ月前

多様な画像合成のためのモード探索生成対抗ネットワーク

Qi Mao; Hsin-Ying Lee; Hung-Yu Tseng; Siwei Ma; Ming-Hsuan Yang
多様な画像合成のためのモード探索生成対抗ネットワーク
要約

多くの条件付き生成タスクは、単一の条件付きコンテキストに対して多様な出力を期待しています。しかし、条件付きジェネレーティブ・アドバーザリアル・ネットワーク(cGANs)はしばしば事前条件情報に焦点を当て、出力の変動に寄与する入力ノイズベクトルを無視します。cGANsのモード崩壊問題を解決する最近の試みは、通常、特定のタスクに限定され、計算コストが高くなります。本研究では、cGANsのモード崩壊問題に対処するためのシンプルかつ効果的な正則化項を提案します。提案手法は、生成画像間の距離と対応する潜在コード間の距離の比率を明示的に最大化することで、訓練中にジェネレーターがより小さなモードを探求することを促進します。このモード探索正則化項は、訓練オーバーヘッドを課すことなく、元のネットワーク構造を変更することなく、さまざまな条件付き生成タスクに容易に適用できます。我々は異なるベースラインモデルを使用して、カテゴリ生成、画像から画像への翻訳、およびテキストから画像への合成という3つの条件付き画像合成タスクで提案アルゴリズムを検証しました。定性的評価と定量的評価の両方の結果が示すように、提案された正則化手法は品質を損なうことなく多様性を向上させる効果があります。

多様な画像合成のためのモード探索生成対抗ネットワーク | 最新論文 | HyperAI超神経