17일 전
DPFlow: 이중 피라미드 프레임워크를 통한 적응형 광학 흐름 추정
Henrique Morimitsu, Xiaobin Zhu, Roberto M. Cesar Jr., Xiangyang Ji, Xu-Cheng Yin

초록
광학 흐름 추정은 영상 복원 및 동작 인식과 같은 영상 처리 작업에서 핵심적인 역할을 한다. 최근 영상 품질은 끊임없이 향상되어 현재 기준은 8K 해상도에 이르렀다. 그러나 기존의 광학 흐름 방법들은 일반적으로 저해상도 환경을 가정하여 설계되어 있으며, 고정된 아키텍처 구조로 인해 대규모 입력에 대한 일반화 능력이 부족하다. 이러한 방법들은 입력 크기를 줄이기 위해 다운스케일링 또는 입력 타일링을 사용하지만, 이 과정에서 세부 정보와 전역 정보가 손실된다. 또한 고해상도 샘플에서 기존 방법의 실제 성능을 평가할 수 있는 광학 흐름 벤치마크가 부족한 실정이다. 기존 연구들은 고해상도 평가를 수작업으로 선택한 샘플들에 대해 주관적인 방법으로만 수행하였다. 본 논문은 이와 같은 광학 흐름 추정 분야의 공백을 두 가지 방식으로 보완한다. 먼저, 저해상도 샘플만으로 학습함에도 불구하고 최대 8K 해상도 입력에 대해 일반화 가능한 적응형 광학 흐름 아키텍처인 DPFlow를 제안한다. 또한 1K에서 8K에 이르는 다양한 입력 해상도를 지원하는 광학 흐름 평가를 위한 새로운 벤치마크인 Kubric-NK를 도입한다. 본 연구에서 제시한 고해상도 평가를 통해 기존 방법의 한계를 넘어서는 성능을 검증하고, 그 일반화 능력에 대한 새로운 통찰을 제시한다. 광범위한 실험 결과를 통해 DPFlow가 MPI-Sintel, KITTI 2015, Spring 등 다양한 고해상도 벤치마크에서 최고 성능을 달성함을 확인할 수 있다.