HyperAIHyperAI
vor 3 Monaten

Kosten-Volumen-Pyramiden-Netzwerk mit Mehrstrategien-Bereichssuche für die Mehransichts-Stereobildverarbeitung

Shiyu Gao, Zhaoxin Li, Zhaoqi Wang
Kosten-Volumen-Pyramiden-Netzwerk mit Mehrstrategien-Bereichssuche für die Mehransichts-Stereobildverarbeitung
Abstract

Multi-View-Stereo ist eine wichtige Forschungsaufgabe im Bereich der Computer Vision, bleibt jedoch weiterhin herausfordernd. In den letzten Jahren haben tiefes Lernen-basierte Methoden auf diesem Gebiet eine überlegene Leistung gezeigt. Kostenvolumen-Pyramiden-Netzwerke, die die Tiefenkarte schrittweise von grob nach fein verfeinern, haben vielversprechende Ergebnisse erzielt, wobei weniger Speicher verwendet wird. Dennoch berücksichtigen diese Methoden die Eigenschaften der Kostenvolumen in jeder Stufe nicht ausreichend, wodurch für jedes Kostenvolumenstadium ähnliche Suchstrategien angewendet werden. In dieser Arbeit präsentieren wir ein neuartiges, auf Kostenvolumen-Pyramiden basierendes Netzwerk mit unterschiedlichen Suchstrategien für die Multi-View-Stereo-Aufgabe. Durch die Auswahl unterschiedlicher Tiefenbereich-Abtaststrategien und die Anwendung adaptiver unimodaler Filter erreichen wir eine genauere Tiefenschätzung in den niedrigen Auflösungsstufen und können die Tiefenkarte iterativ auf beliebige Auflösungen hochskalieren. Wir haben umfangreiche Experimente sowohl auf den DTU- als auch auf den BlendedMVS-Datensätzen durchgeführt, und die Ergebnisse zeigen, dass unsere Methode die meisten aktuellen State-of-the-Art-Methoden übertrifft.