MoCha-Stereo: Motif Channel Attention Netzwerk für Stereomatching

Lernbasierte Stereo-Matching-Techniken haben erhebliche Fortschritte gemacht. Bestehende Methoden verlieren jedoch unvermeidlich geometrische Strukturinformationen während des Prozesses der Erzeugung von Merkmalskanälen, was zu Fehlern in der Kanten-Detail-Zuordnung führt. In dieser Arbeit wurde das Motif Channel Attention Stereo Matching Network (MoCha-Stereo) entwickelt, um dieses Problem anzugehen. Wir stellen das Motif Channel Correlation Volume (MCCV) zur Verfügung, um präzisere Kanten-Matching-Kosten zu bestimmen. Das MCCV wird durch die Projektion von Motif-Kanälen erreicht, die gemeinsame geometrische Strukturen in den Merkmalskanälen erfassen, auf die Merkmalskarten und Kostenvolumina. Zudem beeinflussen Kantenvariationen in potentiellen Merkmalskanälen der Rekonstruktionsfehlerkarte ebenfalls die Detailzuordnung. Dazu schlagen wir das Modul für den Rekonstruktionsfehler-Motif-Penalty (REMP) vor, um die volle Auflösung der Diskrepanzschätzung weiter zu verfeinern. Das REMP integriert die Frequenzinformation typischer Kanalmerkmale aus dem Rekonstruktionsfehler. MoCha-Stereo belegt den ersten Platz in den KITTI-2015 und KITTI-2012 Reflective Leaderboards. Unsere Struktur zeigt auch ausgezeichnete Leistungen im Bereich des Multi-View-Stereo. Der Quellcode ist unter https://github.com/ZYangChen/MoCha-Stereo verfügbar.