18日前

限られた訓練データを用いた顔アライメントにおけるStyleGAN潜在空間の探索

{Bertrand Coüasnon, Yann Ricquebourg, Christian Raymond, Philippe-Henri Gosselin, Martin Dornier}
限られた訓練データを用いた顔アライメントにおけるStyleGAN潜在空間の探索
要約

近年、ディープラーニングモデルの規模はますます大きくなり、現在では10億パラメータを超えるモデルも登場している。それに伴い、大規模かつアノテーション済みの学習データセットの必要性も高まっている。この問題を軽減するため、自己教師学習(self-supervised learning)への関心が高まっている。特に、生成対抗ネットワーク(Generative Adversarial Networks: GAN)の発展、特にStyleGANの登場により、画像生成の品質は著しく向上している。本論文では、画像生成ではなく、限られた学習データを用いた顔のアライメント(顔のランドマーク検出)にStyleGANを活用する手法を提案する。本研究で提唱するフレームワーク「StyleGAN埋め込みを用いた顔アライメント(Face Alignment using StyleGAN Embeddings: FASE)」は、実画像をStyleGANの潜在空間に射影し、その潜在ベクトルから顔のランドマークを予測する。本手法は、少数の学習サンプル(few-shot)設定において、複数の顔アライメントデータセットで最先端の性能を達成した。

限られた訓練データを用いた顔アライメントにおけるStyleGAN潜在空間の探索 | 最新論文 | HyperAI超神経