HyperAIHyperAI
il y a 3 mois

Pyramide de volume coûteuse à réseau avec recherche de portée multi-stratégies pour la stéréo à plusieurs vues

Shiyu Gao, Zhaoxin Li, Zhaoqi Wang
Pyramide de volume coûteuse à réseau avec recherche de portée multi-stratégies pour la stéréo à plusieurs vues
Résumé

La stéréo multi-vue constitue une tâche fondamentale en vision par ordinateur, tout en restant particulièrement difficile. Ces dernières années, les méthodes basées sur l’apprentissage profond ont démontré des performances supérieures sur cette tâche. Les méthodes fondées sur les réseaux de pyramide de volumes de coût, qui raffinent progressivement la carte de profondeur de manière grossière à fine, ont obtenu des résultats prometteurs tout en consommant moins de mémoire. Toutefois, ces approches ne tiennent pas pleinement compte des caractéristiques propres aux volumes de coût à chaque étape, entraînant l’adoption de stratégies de recherche de plage similaires à chaque niveau du volume. Dans ce travail, nous proposons un nouveau réseau basé sur la pyramide de volumes de coût, intégrant des stratégies de recherche différentes pour la stéréo multi-vue. En choisissant des stratégies d’échantillonnage adaptatives de la plage de profondeur et en appliquant un filtrage unimodal adapté, nous parvenons à obtenir une estimation de profondeur plus précise aux étapes à faible résolution, puis à interpoler itérativement la carte de profondeur vers une résolution arbitraire. Nous avons mené des expériences approfondies sur les jeux de données DTU et BlendedMVS, et les résultats montrent que notre méthode surpasse la plupart des méthodes de pointe actuelles.