2달 전

BIVA: 생성 모델링을 위한 매우 깊은 잠재 변수 계층 구조

Lars Maaløe; Marco Fraccaro; Valentin Liévin; Ole Winther
BIVA: 생성 모델링을 위한 매우 깊은 잠재 변수 계층 구조
초록

변분 오토인코더(VAE)의 도입으로 확률적 잠재 변수 모델이 강력한 생성 모델로서 다시 주목받고 있습니다. 그러나 테스트 가능도와 생성 샘플의 품질 측면에서 VAE의 성능은 확률적 유닛 없이도 우수한 성능을 보이는 자기회귀 모델에 비해 뒤처져 왔습니다. 또한, 최근 유동 기반(flow-based) 모델이 고차원 데이터에 잘 적용되는 매력적인 대안으로 나타났습니다. 본 논문에서는 이러한 성능 차이를 좁히기 위해, 깊은 계층 구조의 확률적 변수를 효과적으로 활용하고 복잡한 공분산 구조를 모델링할 수 있는 VAE 모델을 구성합니다. 우리는 스킵 연결(skip-connected) 생성 모델과 양방향 확률 추론 경로로 구성된 추론 네트워크를 특징으로 하는 양방향 추론 변분 오토인코더(Bidirectional-Inference Variational Autoencoder, BIVA)를 소개합니다. 실험 결과, BIVA는 최신 테스트 가능도에 도달하며 선명하고 일관성 있는 자연 이미지를 생성하며, 잠재 변수의 계층 구조를 통해 데이터 분포의 다양한 측면을 포착하는 것을 확인하였습니다. 우리는 최근 연구 결과와 달리 BIVA가 이상치 탐지(anomaly detection)에 사용될 수 있음을 관찰하였습니다. 이는 고차원 잠재 변수가 고수준 의미론적 특성을 추출할 수 있기 때문이라고 판단됩니다. 마지막으로, 우리는 BIVA를 준지도(semi-supervised) 분류 작업에 확장하여 생성 적대 신경망(generative adversarial networks, GANs)의 최신 결과와 비교할 만한 성능을 보임을 입증하였습니다.

BIVA: 생성 모델링을 위한 매우 깊은 잠재 변수 계층 구조 | 최신 연구 논문 | HyperAI초신경