Command Palette
Search for a command to run...
構成支援型GANを用いた現実的な顔写真−スケッチ合成のための取り組み
構成支援型GANを用いた現実的な顔写真−スケッチ合成のための取り組み
概要
顔画像・スケッチ生成は、与えられた顔画像またはスケッチを条件として、対応するスケッチまたは画像を生成することを目的とする。この技術はデジタルエンターテインメントや法執行分野など、幅広い応用が期待されている。しかしながら、構造的リアリズムとテクスチャ的一貫性に関する制約により、顔画像やスケッチを正確に再現することは依然として困難である。従来の手法は魅力的な結果を達成しているものの、多くの場合、画像全体にぼやけた効果が生じ、顔の各部位に著しい歪みが発生し、合成画像に現実感の欠如を感じさせることがあった。本研究では、この課題に対処するため、顔の構成情報を活用して顔スケッチ・画像の生成を支援するアプローチを提案する。具体的には、顔スケッチ・画像生成のための新しい構成情報支援型生成的対抗ネットワーク(Composition-Aided Generative Adversarial Network, CA-GAN)を提案する。CA-GANでは、顔画像またはスケッチと、それに対応するピクセル単位の顔部位ラベルをペアで入力として用い、スケッチまたは画像の生成を行う。さらに、難易度の高い部位や繊細な顔の構造に注目して学習を集中させるため、構成に基づく再構成損失(compositional reconstruction loss)を導入する。最後に、欠陥の修正と詳細な表現の追加をさらに強化するために、複数のCA-GANをスタックした構造(Stacked CA-GAN, SCA-GAN)を採用する。実験結果から、本手法は多様な困難なデータに対して、視覚的に快適でかつ顔の同一性を保持した顔スケッチ・画像を生成可能であることが示された。また、既存手法と比較して、最も優れたFrechet Inception Distance(FID)を大幅に改善し、最先端の性能を達成した。さらに、提案手法が優れた汎化能力を有していることも実証した。本研究のコードおよび実験結果は公開しており、以下のURLからアクセス可能である:https://fei-hdu.github.io/ca-gan/。