
초록
우리는 주어진 사람의 자세를 원하는 자세로 변환하는 사람 이미지 생성 작업을 위한 새로운 생성적 적대 신경망(XingGAN 또는 CrossingGAN)을 제안한다. 제안된 Xing 생성기(Xing generator)는 사람의 외모 정보와 형태 정보를 각각 모델링하는 두 개의 생성 브랜치로 구성되어 있다. 또한, 기존의 모든 GAN 기반 이미지 생성 기법에서 고려되지 않았던 방식으로, 사람의 형태 및 외모 임베딩을 교차 방식으로 효과적으로 전달하고 업데이트할 수 있도록 두 가지 새로운 블록을 제안한다. 이는 서로 보완하여 성능을 향상시키는 데 기여한다. Market-1501과 DeepFashion이라는 두 가지 도전적인 데이터셋에서 실시한 광범위한 실험 결과는, 제안하는 XingGAN이 객관적인 정량적 점수와 주관적인 시각적 사실성 측면에서 모두 기존의 최고 수준 성능을 넘어선다는 것을 입증한다. 소스 코드와 학습된 모델은 https://github.com/Ha0Tang/XingGAN 에서 공개되어 있다.