2달 전

SOM-VAE: 시계열 데이터의 해석 가능한 이산 표현 학습

Vincent Fortuin; Matthias Hüser; Francesco Locatello; Heiko Strathmann; Gunnar Rätsch
SOM-VAE: 시계열 데이터의 해석 가능한 이산 표현 학습
초록

고차원 시계열 데이터는 많은 분야에서 흔히 볼 수 있습니다. 인간의 인지는 고차원 공간에서 효과적으로 작동하도록 최적화되어 있지 않기 때문에, 이러한 분야들은 해석 가능한 저차원 표현을 통해 혜택을 받을 수 있습니다. 그러나 대부분의 시계열 데이터를 위한 표현 학습 알고리즘은 해석하기 어렵습니다. 이는 데이터 특성과 표현의 주요 속성 간의 직관적이지 않은 매핑과 시간에 따른 부드러움이 부족하기 때문입니다. 이 문제를 해결하기 위해, 우리는 해석 가능한 이산 차원 축소와 깊은 생성 모델링 아이디어를 기반으로 하는 새로운 표현 학습 프레임워크를 제안합니다. 이 프레임워크는 시계열 데이터의 이산 표현을 학습할 수 있게 하며, 이를 통해 클러스터링 성능이 우수한 부드럽고 해석 가능한 임베딩을 생성할 수 있습니다.우리는 이산 표현 학습에서 미분 불가능성을 극복하는 새로운 방법을 소개하며, 전통적인 자기 조직 지도(self-organizing map) 알고리즘의 그래디언트 기반 버전을 제시합니다. 이 버전은 원래 알고리즘보다 더 우수한 성능을 보입니다. 또한, 우리의 방법에 대한 확률적 해석을 가능하게 하기 위해, 표현 공간에 마르코프 모델(Markov model)을 통합하였습니다. 이 모델은 시간적 전이 구조를 밝혀내며, 클러스터링 성능을 더욱 개선하고 추가적인 설명력을 제공하며 불확실성의 자연스러운 표현도 가능하게 합니다.우리는 정적 (패션-)MNIST 데이터, 선형 보간된 (패션-)MNIST 이미지 시계열, 두 개의 거시 상태를 가진 카오틱 로렌츠 어트랙터 시스템 및 eICU 데이터 세트에서 복잡한 실제 의료 시계열 응용 프로그램에 대해 우리의 모델의 클러스터링 성능과 해석성을 평가하였습니다. 학습된 표현은 경쟁 방법들과 비교하여 유리하며, 실제 세계 데이터에서 후속 작업들을 용이하게 합니다.