9일 전
효율적이고 정보를 보존하는 미래 프레임 예측 및 그 이상
{Yichao Lu, Wei Yu, Sanja Fidler, Steve Easterbrook}

초록
해상도 보존 블록을 적용하는 것은 비디오 예측에서 정보 손실을 최소화하기 위한 일반적인 기법이지만, 높은 메모리 사용량으로 인해 적용 가능성이 제한된다. 본 연구에서는 조건부 가역 구조를 활용하여 이항(양방향) 오토인코더와 보완적인 순환 예측기로 구성된 가역 네트워크인 CrevNet을 제안한다. 제안한 모델은 특징 추출 과정에서 정보 손실이 이론적으로 보장되지 않으며, 메모리 소비가 현저히 낮고 계산 효율성이 뛰어나다. 가볍고 효율적인 구조 덕분에 메모리 병목 현상 없이 3D 합성곱을 효과적으로 통합할 수 있어, 단기적 및 장기적 시계열 의존성을 동시에 효과적으로 포착할 수 있는 능력을 향상시켰다. 제안한 방법은 Moving MNIST, Traffic4cast, KITTI 등 다양한 데이터셋에서 최신 기술 수준의 성능을 달성하였다. 또한, KITTI 데이터셋에서 객체 탐지 작업에 대해 학습된 특징을 활용함으로써, 제안한 자기지도 학습 방법의 전이 가능성(transferability)을 입증하였다. 경쟁력 있는 실험 결과는 CrevNet이 하류 작업을 안내하는 생성형 사전 학습 전략으로 활용될 수 있는 잠재력을 보여준다.