
要約
マルチビュー立体視はコンピュータビジョンにおける重要な研究課題でありながら、依然として高い挑戦性を有している。近年、ディープラーニングに基づく手法がこのタスクにおいて優れた性能を示している。特に、粗〜細の段階的精緻化により深度マップを改善するコストボリュームピラミッドネットワークに基づく手法は、メモリ消費を抑えつつ有望な結果を達成している。しかし、これらの手法は各段階におけるコストボリュームの特性を十分に考慮していないため、各コストボリューム段階に対して同一の範囲探索戦略を採用しており、効率的な情報利用が不十分である。本研究では、マルチビュー立体視に向けた新たなコストボリュームピラミッドベースのネットワークを提案し、各段階に異なる探索戦略を適用する。異なる深度範囲のサンプリング戦略を選択し、適応型単峰フィルタリングを導入することで、低解像度段階でもより正確な深度推定を実現し、逐次的に深度マップを任意の解像度にアップサンプリングすることが可能となる。本手法はDTUおよびBlendedMVSデータセットにおいて広範な実験を実施し、多数の最先端手法を上回る性能を示した。