
밀도 높은 광학 흐름 추정은 다양한 로봇 시각 작업에서 핵심적인 역할을 한다. 최근 몇 년간 딥러닝의 등장과 함께 광학 흐름 추정 분야에서 큰 진전을 이뤘다. 그러나 현재의 대부분의 네트워크는 방대한 수의 파라미터를 포함하고 있어 높은 계산 비용을 수반하며, 이는 스마트폰과 같은 저전력 소비 장치에서의 적용을 크게 제한하고 있다. 본 논문에서는 이러한 도전 과제에 대응하여 빠르고 정확한 광학 흐름 예측을 위한 경량 모델을 설계한다. 제안하는 FastFlowNet은 널리 사용되는 거친 것에서 세밀한 것으로의 파라다임(coarse-to-fine)을 따르면서 다음과 같은 혁신을 도입한다. 첫째, 고해상도 피라미드 특징을 강화하면서 파라미터 수를 감소시키는 새로운 헤드 강화 풀링 피라미드(HEPP) 특징 추출기를 도입한다. 둘째, 계산 부담을 줄이면서도 넓은 탐색 반경을 유지할 수 있는 컴팩트한 비용 볼륨(cost volume)을 구성하기 위해 새로운 중심 밀도 확장 상관(correlation, CDDC) 레이어를 제안한다. 셋째, 각 피라미드 레벨에 효율적인 셔플 블록 디코더(SBD)를 삽입하여 정확도의 약간의 감소로 교환하더라도 흐름 추정 속도를 크게 향상시킨다. 합성 데이터셋인 Sintel과 실제 환경 데이터셋인 KITTI에서 수행한 실험 결과는 제안된 방법의 효과성을 입증한다. 제안된 모델은 비교 가능한 네트워크에 비해 계산량의 1/10만으로 동등한 정확도를 달성한다. 특히 FastFlowNet은 단지 137만 개의 파라미터만을 가지며, 해상도 1024×436인 Sintel 이미지 쌍에 대해 단일 GTX 1080Ti에서는 90 FPS, 임베디드 Jetson TX2 GPU에서는 5.7 FPS로 실행 가능하다.