17日前

StyleGAN-XL:大規模で多様なデータセットへのStyleGANのスケーリング

Axel Sauer, Katja Schwarz, Andreas Geiger
StyleGAN-XL:大規模で多様なデータセットへのStyleGANのスケーリング
要約

コンピュータグラフィックス分野では、写実的かつ制御可能なコンテンツ生成を実現するためのデータ中心型アプローチが近年急激に進展している。特にStyleGANは、画像の品質および制御性の観点から、生成モデルの新たな基準を確立している。しかし、ImageNetのような大規模で非構造的なデータセットでは、StyleGANの性能は著しく低下する。StyleGANは制御性を重視して設計されているため、従来の研究ではその制限的なアーキテクチャが多様なデータセットには不適切であるとされてきた。一方、本研究では主な制約要因は現在の学習戦略にあると発見した。最近提案されたProjected GANの枠組みに従い、強力なニューラルネットワーク事前知識とプログレッシブ成長戦略を活用することで、最新のStyleGAN3ジェネレータをImageNet上で成功裏に学習させることができた。本研究で得られた最終モデルであるStyleGAN-XLは、大規模画像生成において新たな最先端の性能を達成し、初めてこのようなデータセット規模で解像度1024²の画像生成を実現した。さらに、このモデルがポートレートや特定の物体クラスに限定されない範囲で画像の再構成および編集が可能であることを実証した。

StyleGAN-XL:大規模で多様なデータセットへのStyleGANのスケーリング | 最新論文 | HyperAI超神経