7일 전

악의적인 잠재 자동에코더

Stanislav Pidhorskyi, Donald Adjeroh, Gianfranco Doretto
악의적인 잠재 자동에코더
초록

자동인코더 네트워크는 인코더-생성기 매핑을 동시에 학습함으로써 생성적 성질과 표현적 성질을 결합하는 비지도 학습 접근법이다. 광범위하게 연구되어 왔음에도 불구하고, 이들이 GAN과 동일한 생성 능력을 갖는지, 또는 분리된 표현을 학습하는지에 대한 문제는 아직 완전히 해결되지 않았다. 본 연구에서는 이러한 문제들을 동시에 해결하는 자동인코더인 적대적 잠재 자동인코더(Adversarial Latent Autoencoder, ALAE)를 제안한다. 이는 최신 GAN 훈련 기법의 개선점을 활용할 수 있는 일반적인 아키텍처이다. 우리는 두 가지 자동인코더를 설계하였다: 하나는 MLP 기반 인코더를 사용하고, 다른 하나는 StyleGAN 생성기를 기반으로 한 것으로, 이를 StyleALAE라 명명하였다. 두 아키텍처의 분리성(disentanglement) 특성을 검증하였다. 실험 결과, StyleALAE는 StyleGAN과 비교해도 손색이 없는 품질로 1024×1024 해상도의 얼굴 이미지를 생성할 뿐만 아니라, 동일한 해상도에서 실제 이미지를 기반으로 한 얼굴 재구성 및 조작도 가능함을 보였다. 이는 ALAE가 생성기 전용 아키텍처와 비교하고, 그 능력을 넘어설 수 있는 최초의 자동인코더임을 시사한다.

악의적인 잠재 자동에코더 | 최신 연구 논문 | HyperAI초신경