2달 전
병렬 다중 스케일 자기회귀 밀도 추정
Scott Reed; Aäron van den Oord; Nal Kalchbrenner; Sergio Gómez Colmenarejo; Ziyu Wang; Dan Belov; Nando de Freitas

초록
픽셀CNN은 자연 이미지의 밀도 추정에서 최고 수준의 성과를 달성하였습니다. 훈련 과정은 빠르지만, 추론은 비용이 많이 들며, 각 픽셀마다 하나의 네트워크 평가가 필요합니다(픽셀 N개에 대해 O(N)). 이 과정을 활성화 캐싱으로 가속화할 수 있지만, 여전히 각 픽셀을 순차적으로 생성해야 합니다. 본 연구에서는 이러한 문제를 해결하기 위해 특정 픽셀 그룹들을 조건부 독립으로 모델링하여 더 효율적인 추론이 가능한 병렬화된 픽셀CNN을 제안합니다. 새로운 픽셀CNN 모델은 경쟁력 있는 밀도 추정 성능을 유지하면서도 샘플링 속도를 수십 배 이상 높였습니다(O(N) 대신 O(log N)) - 이를 통해 512x512 크기의 이미지를 실용적으로 생성할 수 있게 되었습니다. 우리는 이 모델을 클래스 조건부 이미지 생성, 텍스트-이미지 합성, 액션 조건부 동영상 생성 등 다양한 작업에서 평가하였으며, 결과적으로 우리의 모델은 효율적인 샘플링이 가능한 비-픽셀 자기회귀 밀도 모델 중 가장 우수한 성능을 보였습니다.