7일 전

속성 분해 GAN을 활용한 제어 가능한 인물 이미지 합성

Yifang Men, Yiming Mao, Yuning Jiang, Wei-Ying Ma, Zhouhui Lian
속성 분해 GAN을 활용한 제어 가능한 인물 이미지 합성
초록

이 논문은 제어 가능한 인물 이미지 합성용 새로운 생성 모델인 속성 분해 GAN(Attribute-Decomposed GAN)을 제안한다. 이 모델은 다양한 소스 입력에서 주어진 원하는 인간 속성(예: 자세, 머리, 상의 및 하의)을 갖춘 현실적인 인물 이미지를 생성할 수 있다. 제안된 모델의 핵심 아이디어는 인간 속성을 잠재 공간(latent space)에 독립적인 코드로 통합함으로써, 명시적인 스타일 표현에서의 혼합 및 보간 연산을 통해 속성에 대한 유연하고 연속적인 제어를 가능하게 하는 것이다. 구체적으로, 기존의 어려운 매핑을 여러 더 접근 가능한 하위 작업으로 분해하기 위해, 스타일 블록 연결을 갖춘 두 개의 인코딩 경로를 포함하는 새로운 아키텍처를 제안한다. 소스 경로에서는 사전 학습된 인간 파서를 활용해 구성 요소 레이아웃을 추가로 추출하고, 이를 공유된 글로벌 텍스처 인코더에 입력하여 분해된 잠재 코드를 생성한다. 이 전략은 더 현실적인 출력 이미지 생성과 비라벨링된 속성의 자동 분리가 가능하게 한다. 실험 결과는 제안된 방법이 자세 전이(task)에서 기존 최고 성능 기법보다 우수하며, 새로운 구성 요소 속성 전이(task)에 있어서도 효과적임을 입증한다.

속성 분해 GAN을 활용한 제어 가능한 인물 이미지 합성 | 최신 연구 논문 | HyperAI초신경