11일 전
흐름 유도형 순환 신경망 인코더를 이용한 비디오 주목 객체 탐지
{Liang Lin, Keze Wang, Tianhao Wei, Guanbin Li, Yuan Xie}

초록
최근 딥 컨볼루션 신경망의 발전으로 인해 이미지 색인성 탐지(Image saliency detection) 분야는 큰 진전을 이루었다. 그러나 최첨단의 색인성 탐지 기법을 이미지에서 영상(video)으로 확장하는 것은 여전히 도전 과제이다. 영상에서는 객체나 카메라의 움직임, 그리고 등장 특성 대비의 급격한 변화로 인해 주목할 만한 객체 탐지 성능이 저하되는 문제가 존재한다. 본 논문에서는 영상의 주목할 만한 객체 탐지를 위한 정확하고 엔드투엔드(end-to-end) 학습 프레임워크인 흐름 유도 순환 신경망 인코더(FGRNE: Flow Guided Recurrent Neural Encoder)를 제안한다. FGRNE는 각 프레임의 특징 간 시간적 일관성을 강화함으로써 작동하며, 이를 위해 광학 흐름(optical flow)을 통한 운동 정보와 LSTM(Long Short-Term Memory) 네트워크를 통한 시계열 특징 진화 인코딩을 동시에 활용한다. 이는 기존의 FCN 기반 정적 색인성 탐지기(FCN-based static saliency detector)를 영상 색인성 객체 탐지로 확장하는 유용한 보편적 프레임워크로 간주될 수 있다. 철저한 실험 결과를 통해 FGRNE의 각 구성 요소의 효과성이 입증되었으며, DAVIS 및 FBMS와 같은 공개 벤치마크에서 제안하는 방법이 기존 최첨단 기법들을 상당히 능가함을 확인하였다.