
要約
私たちは、Depth Anything at Any Condition (DepthAnything-AC) を提案します。これは、多様な環境条件下で扱うことができる基礎的な単眼深度推定 (Monocular Depth Estimation: MDE) モデルです。従来の基礎 MDE モデルは一般的なシーンで優れた性能を達成していますが、照明の変動、悪天候、センサによる歪みなどの困難な条件を含む複雑なオープンワールド環境では十分な性能を発揮していません。これらの課題であるデータの不足と、破損した画像から高品質な疑似ラベルを生成できない問題を克服するために、私たちは比較的小規模の無ラベルデータのみを必要とする非監督的一貫性正則化ファインチューニングパラダイムを提案します。さらに、モデルがパッチレベルの相対的な関係性を学習するように明示的に強制する空間距離制約 (Spatial Distance Constraint) を提案します。これにより、より明瞭な意味論的境界とより正確な詳細が得られます。実験結果は、DepthAnything-AC が多様なベンチマーク(実世界での悪天候ベンチマーク、合成破損ベンチマーク、一般ベンチマークなど)においてゼロショット能力を持つことを示しています。プロジェクトページ: https://ghost233lism.github.io/depthanything-AC-pageコード: https://github.com/HVision-NKU/DepthAnythingAC