16일 전
시야각 조건화 확산 모델을 이용한 제로샷 메트릭 깊이 측정
Saurabh Saxena, Junhwa Hur, Charles Herrmann, Deqing Sun, David J. Fleet

초록
단안 깊이 추정 기법은 기준 벤치마크에서 상당한 발전을 이뤘지만, 제로샷 메트릭 깊이 추정은 여전히 해결되지 않은 과제이다. 주요 과제로는 실내와 실외 장면의 동시 모델링이 있으며, 이들 장면은 RGB 및 깊이 분포에서 크게 다른 특성을 보인다. 또한 카메라 내부 파라미터가 미지인 상태에서 발생하는 깊이 스케일 모호성 문제도 존재한다. 최근 연구에서는 실내와 실외 장면을 동시에 모델링하기 위해 특화된 다중 헤드 아키텍처를 제안했다. 반면 본 연구에서는 일반적이고 작업에 종속되지 않는 확산 모델을 제안하며, 실내 및 실외 장면의 동시 모델링을 가능하게 하는 로그 스케일 깊이 파라미터화, 깊이 스케일 모호성을 해소하기 위해 시야각(Field-of-View, FOV)을 조건으로 사용하는 기법, 그리고 학습 중에 가상으로 시야각을 증강하여 훈련 데이터셋에 제한된 카메라 내부 파라미터를 초월한 일반화를 달성하는 등의 기술적 진전을 이룬다. 더불어 일반적인 훈련 혼합 방식보다 더 다양한 데이터를 활용하고, 효율적인 확산 파라미터화를 적용함으로써, DMD(Diffusion for Metric Depth)라는 제안된 방법은 소수의 노이즈 제거 단계만으로도 현재 최고 수준(SOTA) 기법 대비 제로샷 실내 데이터셋에서 상대 오차(REL)를 25% 감소시키고, 제로샷 실외 데이터셋에서는 33% 감소시키는 성과를 달성하였다. 개요는 다음 링크를 참조하시기 바랍니다: https://diffusion-vision.github.io/dmd