17日前

意味画像合成のためのデュアルピラミッド生成的逆作戦ネットワーク

Shijie Li, Ming-Ming Cheng, Juergen Gall
意味画像合成のためのデュアルピラミッド生成的逆作戦ネットワーク
要約

セマンティック画像合成の目的は、セマンティックラベルマップから写実的な画像を生成することである。この技術は、コンテンツ生成や画像編集などのタスクにおいて極めて重要である。しかし、現在の最先端手法は、さまざまなスケールにおけるリアルなオブジェクトの生成に依然として課題を抱えている。特に、小さなオブジェクトはしばしば視認できず、大きなオブジェクトはしばしばパッチの合成物として生成されてしまう。この問題に対処するために、本研究では、すべてのスケールで空間的に適応する正規化ブロックの条件付けを統合的に学習する二重ピラミッド生成対抗ネットワーク(DP-GAN)を提案する。これにより、スケール情報が双方向的に利用され、異なるスケールにおける統合的な監視が実現される。定性的および定量的な実験結果から、本手法が最先端手法と比較して、小さなオブジェクトおよび大きなオブジェクトがより写実的に生成されることを示している。

意味画像合成のためのデュアルピラミッド生成的逆作戦ネットワーク | 最新論文 | HyperAI超神経