
要約
LR-GANの提案:シーン構造とコンテキストを考慮した敵対的画像生成モデル本稿では、LR-GAN(Long-Range Generative Adversarial Network)を提案します。これは、シーンの構造とコンテキストを考慮に入れた画像生成モデルです。従来の生成敵対ネットワーク(GANs)とは異なり、提案されたGANは背景と前景を別々にかつ再帰的に学習し、コンテキストに関連する方法で前景を背景上に貼り付け、完全な自然画像を生成します。各前景に対して、モデルはその外観、形状および姿勢を生成することを学びます。全体的なモデルは教師なしであり、勾配降下法を使用してエンドツーエンドで訓練されます。実験結果は、LR-GANがDCGANよりもより自然な画像を生成できること、特に人間が認識しやすい物体を持つ画像を生成できることが示されています。