2달 전
변형 오토인코더: 모양과 외관의 비지도 분리
Zhixin Shu; Mihir Sahasrabudhe; Alp Guler; Dimitris Samaras; Nikos Paragios; Iasonas Kokkinos

초록
본 연구에서는 이미지에 대한 생성 모델인 변형 오토인코더(Deforming Autoencoders)를 소개합니다. 이 모델은 비지도 방식으로 형태와 외관을 분리합니다. 변형 템플릿 패러다임과 마찬가지로, 형태는 표준 좌표계('템플릿')와 관찰된 이미지 사이의 변형으로 표현되며, 외관은 '표준', 즉 템플릿 좌표계에서 모델링되어 변형으로 인한 변동성을 제거합니다. 우리는 이 접근법을 오토인코더 환경에서 사용할 수 있도록 하는 새로운 기술들을 도입하였으며, 이 방법이 비지도 방식의 그룹별 이미지 정렬에 활용될 수 있음을 보여줍니다. 우리는 인간, 손, 숫자의 표정 모핑(expression morphing), 얼굴 조작(예: 형태와 외관 보간), 그리고 비지도 랜드마크 위치 추정 등의 실험 결과를 제시합니다. 템플릿 좌표계에서 더 강력한 비지도 분리를 실현할 수 있어, 얼굴 이미지를 음영(shading)과 알베도(albedo)로 성공적으로 분해하고 이를 통해 얼굴 이미지를 더욱 조작할 수 있었습니다.