2달 전

DepthMaster: 단일 카메라 깊이 추정을 위한 확산 모델 제어

Ziyang Song, Zerong Wang, Bo Li, Hao Zhang, Ruijie Zhu, Li Liu, Peng-Tao Jiang, Tianzhu Zhang
DepthMaster: 단일 카메라 깊이 추정을 위한 확산 모델 제어
초록

단일 카메라 깊이 추정은 확산-노이즈 제거 패러다임에서 뛰어난 일반화 능력을 보여주지만, 추론 속도가 낮다는 단점이 있습니다. 최근의 방법들은 유사한 성능을 유지하면서 추론 효율성을 개선하기 위해 단계적인 결정적 패러다임을 채택하고 있지만, 생성적 특성과 판별적 특성 사이의 차이를 간과하여 최적의 결과를 얻지 못하는 경우가 많습니다. 본 연구에서는 판별적 깊이 추정 작업에 적합하도록 생성적 특성을 조정한 단계적인 확산 모델인 DepthMaster를 제안합니다.첫째, 생성적 특성으로 인해 발생하는 텍스처 세부 정보에 대한 과적합을 완화하기 위해 고품질의 의미론적 특성을 통합하여 노이즈 제거 네트워크의 표현 능력을 강화하는 Feature Alignment 모듈을 제안합니다. 둘째, 단계적인 결정적 프레임워크에서 미세한 세부 정보가 부족하다는 문제를 해결하기 위해 저주파 구조와 고주파 세부 정보를 적응적으로 균형 잡아주는 Fourier Enhancement 모듈을 제안합니다.우리는 두 단계의 학습 전략을 채택하여 두 모듈의 잠재력을 최대한 활용합니다. 첫 번째 단계에서는 Feature Alignment 모듈을 사용하여 전반적인 장면 구조를 학습하는 데 중점을 두고, 두 번째 단계에서는 Fourier Enhancement 모듈을 활용하여 시각적 품질을 개선합니다. 이러한 노력 덕분에 우리의 모델은 일반화와 세부 정보 보존 측면에서 최상의 성능을 달성하며, 다양한 데이터셋에서 다른 확산 기반 방법들을 능가합니다.프로젝트 페이지는 https://indu1ge.github.io/DepthMaster_page 에서 확인할 수 있습니다.

DepthMaster: 단일 카메라 깊이 추정을 위한 확산 모델 제어 | 최신 연구 논문 | HyperAI초신경