2달 전

InfoGAN: 정보 최대화 생성적 적대 네트워크를 통한 해석 가능한 표현 학습

Xi Chen; Yan Duan; Rein Houthooft; John Schulman; Ilya Sutskever; Pieter Abbeel
InfoGAN: 정보 최대화 생성적 적대 네트워크를 통한 해석 가능한 표현 학습
초록

이 논문은 완전히 비지도 방식으로 분리된 표현을 학습할 수 있는 생성적 적대 네트워크(Generative Adversarial Network, GAN)의 정보 이론적 확장인 InfoGAN을 설명합니다. InfoGAN은 작은 부분 잠재 변수와 관찰 사이의 상호 정보를 최대화하는 GAN입니다. 우리는 효율적으로 최적화할 수 있는 상호 정보 목적 함수의 하한을 도출하고, 우리의 학습 절차가 Wake-Sleep 알고리즘의 변형으로 해석될 수 있음을 보여줍니다. 특히, InfoGAN은 MNIST 데이터셋에서 글씨체와 숫자 형태를, 3D 렌더링 이미지에서 포즈와 조명을, SVHN 데이터셋에서 배경 숫자와 중앙 숫자를 성공적으로 분리하였습니다. 또한 CelebA 얼굴 데이터셋에서는 헤어스타일, 안경 착용 여부, 감정 등 시각적 개념을 발견하였습니다. 실험 결과, InfoGAN은 기존 완전 지도 방법으로 학습된 표현과 경쟁력 있는 해석 가능한 표현을 학습한다는 것을 확인할 수 있었습니다.