18일 전
고해상도 다중 규모 RAFT (강건한 비전 도전 과제 2022)
Azin Jahedi, Maximilian Luz, Lukas Mehl, Marc Rivinius, Andrés Bruhn

초록
이 보고서에서는 2022년 로버스트 비전 챌린지(Robust Vision Challenge 2022)에서 우승한 광학 흐름 기법인 MS-RAFT+를 제안한다. 본 방법은 단일 해상도 RAFT에 여러 다중 해상도 개념을 성공적으로 통합한 MS-RAFT 기법을 기반으로 한다. 본 연구에서는 추가적인 더 세밀한 해상도를 활용하여 흐름을 추정하는 방식으로 기존 방법을 확장하였으며, 필요에 따라 비용을 계산하는 방식을 도입함으로써 이를 가능하게 했다. 이를 통해 원래 해상도의 절반에서 작동할 뿐만 아니라, MS-RAFT의 공유 볼록 상승기(share convex upsampler)를 활용하여 전체 해상도의 흐름을 산출할 수 있다. 또한, 학습 과정에서 보다 적절한 미세 조정(fine-tuning) 전략을 도입함으로써 다양한 벤치마크 간의 일반화 성능을 향상시키는 데 초점을 맞추었다. 로버스트 비전 챌린지에 참가한 모든 방법 중에서 본 방법은 VIPER에서 1위, KITTI, Sintel, Middlebury에서 각각 2위를 기록하여 종합 순위에서 1위를 차지하였다.