7일 전
속성 분해 GAN을 활용한 제어 가능한 인물 이미지 합성
Yifang Men, Yiming Mao, Yuning Jiang, Wei-Ying Ma, Zhouhui Lian

초록
이 논문은 제어 가능한 인물 이미지 합성용 새로운 생성 모델인 속성 분해 GAN(Attribute-Decomposed GAN)을 제안한다. 이 모델은 다양한 소스 입력에서 주어진 원하는 인간 속성(예: 자세, 머리, 상의 및 하의)을 갖춘 현실적인 인물 이미지를 생성할 수 있다. 제안된 모델의 핵심 아이디어는 인간 속성을 잠재 공간(latent space)에 독립적인 코드로 통합함으로써, 명시적인 스타일 표현에서의 혼합 및 보간 연산을 통해 속성에 대한 유연하고 연속적인 제어를 가능하게 하는 것이다. 구체적으로, 기존의 어려운 매핑을 여러 더 접근 가능한 하위 작업으로 분해하기 위해, 스타일 블록 연결을 갖춘 두 개의 인코딩 경로를 포함하는 새로운 아키텍처를 제안한다. 소스 경로에서는 사전 학습된 인간 파서를 활용해 구성 요소 레이아웃을 추가로 추출하고, 이를 공유된 글로벌 텍스처 인코더에 입력하여 분해된 잠재 코드를 생성한다. 이 전략은 더 현실적인 출력 이미지 생성과 비라벨링된 속성의 자동 분리가 가능하게 한다. 실험 결과는 제안된 방법이 자세 전이(task)에서 기존 최고 성능 기법보다 우수하며, 새로운 구성 요소 속성 전이(task)에 있어서도 효과적임을 입증한다.