2달 전

정규화 흐름(Normalizing Flows)은 생성 모델로서의 능력을 갖추고 있다.

Shuangfei Zhai, Ruixiang Zhang, Preetum Nakkiran, David Berthelot, Jiatao Gu, Huangjie Zheng, Tianrong Chen, Miguel Angel Bautista, Navdeep Jaitly, Josh Susskind
정규화 흐름(Normalizing Flows)은 생성 모델로서의 능력을 갖추고 있다.
초록

노멀라이징 플로우(NFs)는 연속 입력에 대한 가능도 기반 모델입니다. 이 모델들은 밀도 추정과 생성 모델링 작업에서 유망한 결과를 보여주었지만, 최근 몇 년 동안 상대적으로 주목을 받지 못했습니다. 본 연구에서는 노멀라이징 플로우가 이전에 생각했던 것보다 더 강력하다는 것을 입증합니다. 우리는 타플로우(TarFlow)라는 간단하면서도 확장성이 뛰어난 아키텍처를 제시합니다. 타플로우는 마스킹 자기회귀 플로우(MAFs)의 트랜스포머 기반 변형으로 이해할 수 있습니다. 이는 이미지 패치 위에 자기회귀 트랜스포머 블록들의 스택을 구성하며, 층 사이에서 자기회귀 방향을 번갈아 가며 적용합니다. 타플로우는 단순히 엔드투엔드(end-to-end)로 훈련할 수 있으며, 픽셀을 직접 모델링하고 생성하는 능력을 가지고 있습니다. 또한, 샘플 품질을 개선하기 위해 세 가지 핵심 기술을 제안합니다: 훈련 중 가우시안 노이즈 증강, 후처리 디노이징 절차, 그리고 클래스 조건부와 비조건부 설정 모두에서 효과적인 안내 방법입니다. 이러한 기술들을 결합하여, 타플로우는 이미지에 대한 가능도 추정에서 새로운 최고 성능 결과를 달성하며, 이전 최고 방법들보다 크게 우수한 성능을 보였습니다. 또한, 독립적인 노멀라이징 플로우 모델로서 처음으로 확산 모델과 비교할 만한 품질과 다양성을 가진 샘플을 생성하였습니다. 우리의 코드는 https://github.com/apple/ml-tarflow 에서 제공됩니다.