15일 전

어떤 깊이에서나 희석하기: 희석 기법이 강력한 단안 깊이 추정기 생성

Xiankang He, Dongyan Guo, Hongji Li, Ruibo Li, Ying Cui, Chi Zhang
어떤 깊이에서나 희석하기: 희석 기법이 강력한 단안 깊이 추정기 생성
초록

단안 깊이 추정(Monocular Depth Estimation, MDE)은 단일 RGB 이미지로부터 장면의 깊이를 예측하는 것을 목표로 하며, 3차원 장면 이해에 핵심적인 역할을 한다. 최근의 제로샷 MDE 기법은 정규화된 깊이 표현과 추론 기반 학습(정규화 기반 학습)을 활용하여 다양한 장면 간 일반화 능력을 향상시키고 있다. 그러나 기존의 추론 과정에서 사용되는 깊이 정규화 방법은 전역 정규화(global normalization)에 의존하여 노이즈가 포함된 가상 레이블(pseudo-labels)을 증폭시켜 추론 효과를 저하시키는 문제가 있다. 본 논문에서는 다양한 깊이 정규화 전략이 가상 레이블 추론에 미치는 영향을 체계적으로 분석한다. 분석 결과를 바탕으로, 전역과 국소적 깊이 정보를 통합하여 가상 레이블의 품질을 향상시키는 ‘크로스 컨텍스트 추론(Cross-Context Distillation)’을 제안한다. 또한, 서로 보완적인 강점을 지닌 다양한 깊이 추정 모델을 활용하는 다교사(multi-teacher) 추론 프레임워크를 도입하여 더욱 견고하고 정확한 깊이 예측을 가능하게 한다. 기준 데이터셋에서 실시한 광범위한 실험 결과, 제안하는 방법이 기존 최고 성능 기법들에 비해 정량적·정성적 측면에서 모두 뚜렷한 성능 향상을 보였다.

어떤 깊이에서나 희석하기: 희석 기법이 강력한 단안 깊이 추정기 생성 | 최신 연구 논문 | HyperAI초신경