2달 전
FineGAN: 미세한 객체 생성 및 발견을 위한 비지도 계층적 분리
Krishna Kumar Singh; Utkarsh Ojha; Yong Jae Lee

초록
우리는 새로운 비지도 학습 GAN 프레임워크인 FineGAN을 제안합니다. 이 프레임워크는 배경, 객체 형태, 객체 외관을 분리하여 세부 객체 카테고리의 이미지를 계층적으로 생성합니다. 비지도 학습 없이 이러한 요소들을 분리하기 위한 우리의 핵심 아이디어는 정보 이론을 사용하여 각 요소를 잠재 코드에 연결하고, 코드 간의 관계를 특정 방식으로 조건부로 설정하여 원하는 계층 구조를 유도하는 것입니다. 광범위한 실험을 통해 FineGAN이 새, 개, 자동차와 같은 세부 클래스에 속하는 실제적이고 다양한 이미지를 생성할 수 있음을 보여줍니다. 또한 FineGAN이 자동으로 학습한 특징을 사용하여 비지도 학습 기반 세부 객체 카테고리 발견이라는 새로운 문제 해결의 첫 시도로 실제 이미지를 클러스터링합니다. 우리의 코드/모델/데모는 다음 링크에서 확인할 수 있습니다: https://github.com/kkanshul/finegan