2달 전

스택된 캡슐 오토인코더

Adam R. Kosiorek; Sara Sabour; Yee Whye Teh; Geoffrey E. Hinton
스택된 캡슐 오토인코더
초록

물체는 기하학적으로 구성된 여러 부품으로 이루어져 있습니다. 우리는 이러한 부품 간의 기하학적 관계를 이용하여 물체에 대해 추론하는 비지도 캡슐 오토인코더(SCAE, Stacked Capsule Autoencoder)를 소개합니다. 이러한 관계가 시점에 영향을 받지 않기 때문에, 우리의 모델은 시점 변화에 강건합니다. SCAE는 두 단계로 구성됩니다. 첫 번째 단계에서는 모델이 이미지에서 직접 부품 템플릿의 존재와 자세를 예측하고, 이 템플릿들을 적절히 배열하여 이미지를 재구성하려고 합니다. 두 번째 단계에서는 SCAE가 몇 개의 물체 캡슐의 매개변수를 예측하며, 이 매개변수들은 다시 부품 자세를 재구성하는 데 사용됩니다. 이 모델에서의 추론은 사전 학습된 신경망 인코더를 통해 수행되며, 이는 이전 캡슐 네트워크와 달리 암모르타이즈드(amortized) 방식입니다. 우리는 물체 캡슐의 존재가 물체 클래스에 매우 유용한 정보임을 발견하였으며, 이를 통해 SVHN(55%) 및 MNIST(98.7%) 데이터셋에서 비지도 분류에 있어 최상의 결과를 얻었습니다. 코드는 https://github.com/google-research/google-research/tree/master/stacked_capsule_autoencoders 에서 확인할 수 있습니다.

스택된 캡슐 오토인코더 | 최신 연구 논문 | HyperAI초신경