
要約
我々は、高品質なマルチビュー対応を実現する新たな大規模並列手法を提案する。本研究は「Patchmatch」のアイデアを基盤としており、シーン空間内にランダムに生成された3D平面から出発し、最適な平面を反復的に伝搬・精緻化することで、各ビューに対して3D深度場および法線場を獲得する。その目的は、すべての画像間で堅牢な写真的一貫性(photo-consistency)を最大化することにある。本手法の主な革新点は以下の2点である。第一に、Patchmatchをシーン空間内で定式化したことにより、複数ビューにわたる画像類似性を統合可能となり、より高精度な深度マップの生成が可能になった。第二に、拡散(diffusion)に類似した改良型の伝搬スキームを採用したことにより、大規模並列処理が可能となり、コンシューマークラスのGPU上で10枚の1.9メガピクセル画像に対して、3秒以内に密なマルチビュー対応を生成できる。本手法は斜め支持窓(slanted support window)を用いるため、フロントパラレル(fronto-parallel)なバイアスが存在せず、完全に局所的かつ並列的な構造を有している。その結果、計算時間は画像サイズに比例し、並列スレッド数に反比例する線形スケーラビリティを実現する。さらに、メモリ使用量が極めて低く(ピクセルあたり4つの値に固定、深度範囲に依存しない)、特に大規模な複数画像を高深度解像度で処理する場面において優れたスケーラビリティを発揮する。DTUおよびMiddleburyのマルチビューデータセット、ならびに斜め方向からの航空画像を用いた実験結果から、本手法はさまざまなシナリオにおいて、高精度かつ高完成度の結果を達成し、競争力のある性能を示した。