
要約
人間は画像の境界を超えるもの予測において優れた能力を発揮しますが、深層モデルは保持された情報を通じてコンテキストや外挿を理解することが困難です。このタスクは「画像外補完(image outpainting)」と呼ばれ、画像の境界を現実的に拡張することを目的としています。現在のモデルでは、生成対抗ネットワーク(Generative Adversarial Networks, GANs)を使用していますが、その結果は局所的な画像特徴の一貫性に欠け、偽物に見えます。私たちはこの問題を改善するための2つの手法を提案します:局所および全局判別器の使用と、ネットワークのエンコーディングセクション内に残差ブロック(residual blocks)を追加することです。私たちのモデルとベースラインモデルとのL1損失、平均二乗誤差(Mean Squared Error, MSE)損失、ならびに定性的な違いの比較により、私たちのモデルが既存手法よりも自然に物体の境界を延長し、より内部一貫性のある画像を生成できることが示されました。ただし、忠実度は低いままです。