
초록
단일 이미지에서 깊이 추정을 넘어서, 단안 시각 힌트는 다른 이용 가능한 깊이 힌트를 활용하여 정확도를 개선하는 등 더 넓은 범위의 깊이 추론 응용 프로그램과 환경에서 유용합니다. 현재, 다양한 추론 작업과 깊이 힌트의 조합을 가진 서로 다른 응용 프로그램들은 각각 별도로 훈련된 전문적인 네트워크를 통해 해결되고 있습니다. 대신에, 우리는 입력 컬러 이미지로부터 장면의 깊이에 대한 확률 분포를 출력하는 다목적이고 작업 독립적인 단안 모델을 제안합니다. 이 모델은 패치별 조건부 VAE(변분 오토인코더)의 출력 샘플 근사값으로 작동합니다. 우리는 이 분포형 출력이 각 응용 프로그램마다 재훈련 없이 다양한 추론 작업을 수행할 수 있음을 보여줍니다. 다양한 응용 프로그램(깊이 완성, 사용자 안내 추정 등)에서 우리의 공통 모델은 고정확도 결과를 제공하며, 이는 애플리케이션 특화 네트워크에 의존하는 최신 방법들과 비교해도 비슷하거나 그보다 우수한 성능을 보입니다.