2달 전
In2I: 생성적 적대 네트워크를 이용한 비지도 다중 이미지-이미지 변환
Pramuditha Perera; Mahdi Abavisani; Vishal M. Patel

초록
비지도 이미지-이미지 변환에서 목표는 비페어링된 훈련 이미지를 사용하여 입력 이미지와 출력 이미지 간의 매핑을 학습하는 것입니다. 본 논문에서는 비지도 이미지-이미지 변환 문제를 다중 입력 설정으로 확장하는 방법을 제안합니다. 여러 모달에서 얻은 페어링된 이미지 집합이 주어질 때, 입력을 지정된 도메인으로 변환하기 위한 변환이 학습됩니다. 이를 위해 우리는 생성적 적대 네트워크(GAN) 기반 프레임워크와 다중 모달 생성기 구조, 그리고 새로운 손실 항인 잠재 일관성 손실(latent consistency loss)을 소개합니다. 다양한 실험을 통해 다중 입력을 활용하면 일반적으로 변환된 이미지의 시각적 품질이 개선됨을 보여줍니다. 또한, 제안된 방법이 현재 최신의 비지도 이미지-이미지 변환 방법들을 능가함을 입증하였습니다.