9일 전
Z-Order 순환 신경망을 이용한 영상 예측
{Philip S Yu, Wang Jianmin, Mingsheng Long, Yunbo Wang, Jianjin Zhang}
초록
히스토리적 관측 데이터를 바탕으로 미래의 비디오 프레임을 예측하기 위해, 우리는 Z-Order RNN(Znet)을 제안한다. 본 연구는 결정론적 모델링과 확률론적 모델링 두 가지 관점에서 주요 기여를 한다. 첫째, 결정론적 동역학을 모델링하기 위한 새로운 RNN 아키텍처를 제안하며, 이는 은닉 상태를 Z-순서 곡선을 따라 업데이트함으로써 반사층의 특징 간 일관성을 향상시킨다. 둘째, 확률적 변동을 모델링하기 위해 이중 스트림 Znet에 대안적 훈련 방식을 도입한다. 이 방식은 Znet-Predictor가 Znet-Probe의 행동을 모방하도록 유도한다. 이 이중 스트림 아키텍처는 이미지 공간이 아닌 특징 공간에서 대안적 훈련을 수행할 수 있게 한다. 제안된 모델은 두 개의 비디오 데이터셋에서 최신 기술 수준의 예측 정확도를 달성하였다.