2ヶ月前

レイアウトから対象中心の画像生成

Sylvain, Tristan ; Zhang, Pengchuan ; Bengio, Yoshua ; Hjelm, R Devon ; Sharma, Shikhar
レイアウトから対象中心の画像生成
要約

最近の単一物体や単一ドメインの画像生成における印象的な結果にもかかわらず、複数の物体を含む複雑なシーンの生成は依然として課題となっています。本論文では、モデルが複雑なシーンを良好に生成するためには、個々の物体と物体間の関係性を理解する能力が必要であるという考えから始めています。我々が提案するレイアウトから画像生成を行う方法、Object-Centric Generative Adversarial Network(OC-GAN)は、新しいScene-Graph Similarity Module(SGSM)に依存しています。SGSMはシーン内の物体間の空間的関係性を学習し、これによりモデルのレイアウト忠実度が向上します。また、ジェネレータの条件付け機構に対する変更点も提案しており、これにより物体インスタンス認識能力が強化されます。これらの貢献により、画像品質が向上するとともに、以前の手法で見られた2つの問題点が軽減されます:(1) レイアウトに対応するバウンディングボックスなしで不適切な物体が生成される問題と、(2) レイアウト内の重複したバウンディングボックスによって画像内で物体が合成される問題です。広範な定量評価とアブレーションスタディを通じて、我々の貢献の影響を示しており、COCO-StuffおよびVisual Genomeデータセットにおいて既存の最先端手法を上回る性能を達成しています。最後に、以前の研究で使用された評価指標的重要制約に対処するために、SceneFID -- 人気のあるFréchet Inception Distance指標の物体中心型アダプテーション -- を導入します。これは多物体画像に対してより適している指標です。

レイアウトから対象中心の画像生成 | 最新論文 | HyperAI超神経