HyperAIHyperAI
vor 2 Monaten

Aufmerksamkeitskonglomeratvolumen für genaue und effiziente Stereomatching

Gangwei Xu; Junda Cheng; Peng Guo; Xin Yang
Aufmerksamkeitskonglomeratvolumen für genaue und effiziente Stereomatching
Abstract

Stereo-Matching ist ein grundlegendes Baustein für viele Anwendungen im Bereich Vision und Robotik. Eine informativ und prägnant gestaltete Kosten-Volumendarstellung ist entscheidend für Stereo-Matching mit hoher Genauigkeit und Effizienz. In dieser Arbeit stellen wir eine neuartige Methode zur Konstruktion von Kostenvolumen vor, die Aufmerksamkeitsgewichte aus Korrelationshinweisen generiert, um redundante Informationen zu unterdrücken und matchingspezifische Informationen im Verkoppelungsvolumen zu verstärken. Um verlässliche Aufmerksamkeitsgewichte zu erzeugen, schlagen wir eine mehrstufige adaptive Patch-Matching-Technik vor, um die Unterscheidbarkeit der Matchingkosten bei verschiedenen Disparitäten auch in texturfreien Bereichen zu verbessern. Das vorgeschlagene Kostenvolumen wird als Aufmerksamkeitsverkoppelungsvolumen (Attention Concatenation Volume, ACV) bezeichnet und kann nahtlos in die meisten Stereo-Matching-Netze integriert werden. Die resultierenden Netze können ein leichteres Aggregationsnetz verwenden und gleichzeitig höhere Genauigkeit erzielen, z.B. erreicht GwcNet mit nur 1/25 der Parameter des Aggregationsnetzes eine höhere Genauigkeit. Darüber hinaus haben wir ein hochgenaues Netzwerk (ACVNet) auf Basis unseres ACV entwickelt, das auf mehreren Benchmarks den aktuellen Stand der Technik übertreffen kann.