Attention Concatenation Volume pour une Correspondance Stéréoscopique Précise et Efficace

Le couplage stéréoscopique est un élément fondamental de nombreux systèmes d'imagerie et de robotique. Une représentation du volume de coût à la fois informative et concise est essentielle pour assurer une précision et une efficacité élevées dans le couplage stéréoscopique. Dans cet article, nous présentons une nouvelle méthode de construction du volume de coût qui génère des poids d'attention à partir d'indices de corrélation afin de réduire les informations redondantes et d'améliorer les informations pertinentes au couplage dans le volume de concaténation. Pour générer des poids d'attention fiables, nous proposons un couplage adaptatif multi-niveaux par patchs pour améliorer la distinctivité du coût de couplage à différentes disparités, même dans les régions dépourvues de texture. Le volume de coût proposé est appelé volume de concaténation avec attention (ACV), qui peut être intégré sans heurts dans la plupart des réseaux de couplage stéréoscopique. Les réseaux résultants peuvent utiliser un réseau d'agrégation plus léger tout en atteignant une précision supérieure, par exemple, en utilisant seulement 1/25 des paramètres du réseau d'agrégation, on peut obtenir une meilleure précision pour GwcNet. De plus, nous avons conçu un réseau très précis (ACVNet) basé sur notre ACV, qui obtient des performances de pointe sur plusieurs benchmarks.