18일 전

RAPIDFlow: 반복적 적응형 피라미드와 반복 디코딩을 통한 효율적인 광학 흐름 추정

{Xu-Cheng Yin, Xiangyang Ji, Roberto M. Cesar-Jr., Xiaobin Zhu, Henrique Morimitsu}
RAPIDFlow: 반복적 적응형 피라미드와 반복 디코딩을 통한 효율적인 광학 흐름 추정
초록

비디오에서 광학 흐름 추정을 통해 운동 정보를 추출하는 것은 다양한 실용적 로봇 응용 분야에서 매우 중요하다. 현재의 광학 흐름 기법들은 높은 정확도를 보이지만, 최고 성능을 발휘하는 방법들은 높은 계산 비용을 수반하며 임베디드 장치에 적합하지 않다. 일부 이전 연구들은 저비용 광학 흐름 전략 개발에 초점을 맞추었지만, 그들의 추정 정확도는 더 강건한 방법들과 비교해 눈에 띄는 격차를 보였다. 본 논문에서는 임베디드 장치에서 고품질 광학 흐름을 효율적으로 추정할 수 있는 새로운 방법을 제안한다. 제안하는 RAPIDFlow 모델은 특징 피라미드 기반의 완전 재귀 구조와 효율적인 NeXt1D 컨볼루션 블록을 결합하여 계산 비용을 줄이면서도 추정 정확도에 큰 영향을 주지 않는다. 유연한 재귀 인코더는 단일 공유 블록을 통해 다중 스케일 특징을 생성하며, 추론 시점에서 피라미드 길이를 조정할 수 있어 입력 크기의 변화에 더 강건하게 대응할 수 있다. 또한 모델은 정확도와 속도 사이의 다양한 트레이드오프를 제공함으로써 다양한 응용에 적합하게 설계되었다. Jetson Orin NX 임베디드 시스템을 사용하여 MPI-Sintel 및 KITTI 공개 벤치마크에서 수행한 실험 결과, RAPIDFlow는 이전 방법들보다 뚜렷한 성능 우위를 보이며 더 빠른 속도로 작동함을 확인하였다.