2달 전

PixelCNN++: 이산화 로지스틱 혼합 우도 및 기타 수정을 통해 PixelCNN 개선

Tim Salimans; Andrej Karpathy; Xi Chen; Diederik P. Kingma

초록

픽셀CNN은 최근 제안된 강력한 생성 모델의 한 종류로, 계산 가능한尤似度(likelihood)를 갖습니다. 여기서는 오픈AI에서 제공하는 https://github.com/openai/pixel-cnn에서 사용할 수 있는 우리의 픽셀CNN 구현에 대해 논의합니다. 우리의 구현은 원래 모델의 구조를 단순화하고 성능을 향상시키는 여러 수정 사항을 포함하고 있습니다. 1) 픽셀에 대해 256-방식 소프트맥스 대신 이산화된 로지스틱 혼합尤似度(discretized logistic mixture likelihood)를 사용하여 학습 속도를 높였습니다. 2) R/G/B 서브-픽셀이 아닌 전체 픽셀에 조건부로 적용하여 모델 구조를 단순화했습니다. 3) 다운샘플링을 사용하여 여러 해상도에서 구조를 효율적으로 포착하였습니다. 4) 최적화 과정을 더욱 가속하기 위해 추가적인 단축 연결(short-cut connections)을 도입하였습니다. 5) 드롭아웃(dropout)을 사용하여 모델을 규제하였습니다. 마지막으로, 이러한 수정 사항들의 유용성을 입증하기 위해 CIFAR-10 데이터셋에서 최고 수준의 로그尤似度(log likelihood) 결과를 제시합니다.注：在韩文中，“尤似度”（likelihood）并不是一个常用的术语，通常会直接使用“우도”来表示。因此，建议将原文中的“尤似度”替换为“우도”。以下是修正后的翻译：픽셀CNN은 최근 제안된 강력한 생성 모델의 한 종류로, 계산 가능한 우도를 갖습니다. 여기서는 오픈AI에서 제공하는 https://github.com/openai/pixel-cnn에서 사용할 수 있는 우리의 픽셀CNN 구현에 대해 논의합니다. 우리의 구현은 원래 모델의 구조를 단순화하고 성능을 향상시키는 여러 수정 사항을 포함하고 있습니다. 1) 픽셀에 대해 256-방식 소프트맥스 대신 이산화된 로지스틱 혼합 우도(discretized logistic mixture likelihood)를 사용하여 학습 속도를 높였습니다. 2) R/G/B 서브-픽셀이 아닌 전체 픽셀에 조건부로 적용하여 모델 구조를 단순화했습니다. 3) 다운샘플링을 사용하여 여러 해상도에서 구조를 효율적으로 포착하였습니다. 4) 최적화 과정을 더욱 가속하기 위해 추가적인 단축 연결(short-cut connections)을 도입하였습니다. 5) 드롭아웃(dropout)을 사용하여 모델을 규제하였습니다. 마지막으로, 이러한 수정 사항들의 유용성을 입증하기 위해 CIFAR-10 데이터셋에서 최고 수준의 로그 우도(log likelihood) 결과를 제시합니다.