2달 전

비선형 상태 공간 모델을 위한 구조적 추론 네트워크

Rahul G. Krishnan; Uri Shalit; David Sontag
비선형 상태 공간 모델을 위한 구조적 추론 네트워크
초록

가우시안 상태 공간 모델은 수십 년 동안 순차 데이터의 생성 모델로 사용되어 왔습니다. 이 모델들은 직관적인 확률 해석을 허용하며, 함수 형태가 간단하고, 널리 채택되고 있습니다. 본 연구에서는 선형 및 비선형 상태 공간 모델의 광범위한 클래스를 효율적으로 학습할 수 있는 통합 알고리즘을 소개합니다. 이 알고리즘은 딥 뉴럴 네트워크로 방출 분포와 전이 분포를 모델링하는 변형도 포함합니다. 우리의 학습 알고리즘은 추론 네트워크와 생성 모델을 동시에 학습하며, 재귀 신경망으로 매개변수화된 구조적 변분 근사를 활용하여 사후 분포를 모방합니다. 우리는 이 학습 알고리즘을 합성 데이터셋과 실제 세계 데이터셋에 적용하여 그 확장성과 유연성을 입증하였습니다. 구조적 사후 근사 사용 결과, 검증 세트에서 상당히 더 높은 우도를 가진 모델이 생성되는 것을 확인하였습니다.

비선형 상태 공간 모델을 위한 구조적 추론 네트워크 | 최신 연구 논문 | HyperAI초신경