11일 전
자연 데이터에서 시간적 희소 코딩을 통한 비선형 분리적 표현 학습
David Klindt, Lukas Schott, Yash Sharma, Ivan Ustyuzhaninov, Wieland Brendel, Matthias Bethge, Dylan Paiton

초록
우리는 자연스러운 영상에서의 변동 인자들을 비선형적으로 분리하는 비지도 학습 모델을 구축하였다. 기존 연구들은 환경 내 몇 가지 인자 외의 모든 인자가 시간적으로 일정하게 유지될 경우 표현이 분리될 수 있다고 제안하고 있다. 그 결과, 이 문제에 대한 기존 알고리즘들은 이러한 특성을 정확히 만족하는 철저히 설계된 데이터셋에서만 테스트되어 왔으며, 이러한 알고리즘이 자연 장면에 일반화될 수 있는지 여부는 여전히 명확하지 않았다. 본 연구에서는 분할된 자연 영상 속 객체들이 일반적으로 크기가 작은 전이를 겪으며, 드물게 큰 점프를 하는 경향이 있음을 보여주며, 이는 시간적으로 희소한 분포의 특징임을 밝혔다. 본 연구는 이러한 발견을 활용하여, 시간적으로 인접한 관측치들 사이에 희소 사전(prior)을 도입함으로써 변화하는 인자의 수에 대한 어떠한 가정도 필요 없이 생성 인자를 분리하는 비지도 표현 학습 모델인 SlowVAE를 제안한다. 또한, 모델의 식별 가능성( identifiability)에 대한 증명을 제시하며, 여러 표준 벤치마크 데이터셋에서 신뢰성 있게 분리된 표현을 학습함을 보여준다. 특히, 최신 기준을 초월하는 성능을 보이며, 자연스러운 역학을 가진 영상 데이터셋인 Natural Sprites와 KITTI Masks로의 전이 가능성도 입증하였다. 본 연구는 이러한 데이터셋을 분리 연구를 위한 새로운 벤치마크로 기여함으로써, 분리 연구가 더 자연스러운 데이터 영역으로 나아가도록 유도할 수 있을 것으로 기대된다.