HyperAI초신경

Distill-Any-Depth: 단안경 깊이 추정기

1. 튜토리얼 소개

짓다

Distill-Any-Depth는 저장이공대학교, 웨스트레이크대학교, 허난대학교, 싱가포르국립대학교가 2025년 2월 28일에 공동으로 발표한 혁신적인 단안 깊이 추정 프로젝트입니다. 이 프로젝트는 증류 알고리즘을 통해 여러 오픈소스 모델의 장점을 통합하고, 소량의 미분류 데이터만으로도 고정밀 깊이 추정을 달성하여 현재의 SOTA(State-of-the-Art) 성능을 새롭게 향상시킵니다.모든 깊이를 증류하세요: 증류는 더 강력한 단안경 깊이 추정기를 생성합니다.".

핵심 요점은 다음과 같습니다.

  • 다중 교사 증류 프레임워크
    • 여러 교사 모델을 무작위로 선택하여 가상 레이블을 생성함으로써 다양한 모델의 장점을 결합하여 가상 레이블의 품질을 향상시킵니다.
    • 로컬 세부 정보와 글로벌 정보를 결합하기 위해 교차 컨텍스트 증류 메커니즘이 도입되어 모델의 견고성이 크게 향상되었습니다.
  • 지역 정규화 전략
    • 기존의 전역 정규화는 노이즈를 증폭시킵니다. 본 프로젝트에서는 잘린 영역 내에서 정규화를 수행하여 객체의 경계 및 작은 구멍 구조와 같은 국소적인 세부 정보를 유지하고 예측 정확도를 향상시키는 방안을 제안합니다.
  • 낮은 데이터 종속성
    • 레이블이 지정되지 않은 이미지는 20,000개만 필요하며(기존 방식에서 필요했던 수백만 개의 주석보다 훨씬 적음), 이를 통해 데이터 주석 비용이 크게 절감됩니다.
  • 일반화
    • NYUv2(실내), KITTI(실외 주행), DIODE(복잡한 조명) 등의 벤치마크 테스트에서 오차 지표(AbsRel)가 기존 모델보다 상당히 개선되었습니다.
  • 견고성
    • 이 제품은 투명한 물체, 반사 표면, 역동적인 장면에서 안정적으로 작동하며, 복잡한 조건에서 기존 모델이 실패하는 문제를 해결합니다.
  • 능률
    • 추론 속도는 확산 기반 모델(예: Marigold)보다 10배 이상 빠르므로 실시간 애플리케이션을 지원합니다.

이 튜토리얼에서 사용된 컴퓨팅 리소스는 RTX 4090 카드 1개입니다.

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

2. 사용 단계

결과 

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@article{he2025distill,
  title   = {Distill Any Depth: Distillation Creates a Stronger Monocular Depth Estimator},
  author  = {Xiankang He and Dongyan Guo and Hongji Li and Ruibo Li and Ying Cui and Chi Zhang},
  year    = {2025},
  journal = {arXiv preprint arXiv: 2502.19204}
}