HyperAIHyperAI
il y a 4 mois

Estimation de la profondeur à partir d'une seule image formée par des indices de flou de défocalisation

Gur, Shir ; Wolf, Lior
Estimation de la profondeur à partir d'une seule image formée par des indices de flou de défocalisation
Résumé

L'estimation de la profondeur à partir d'une seule image RGB est une tâche fondamentale en vision par ordinateur, généralement résolue de manière supervisée grâce à l'apprentissage profond. Dans le domaine de l'apprentissage non supervisé de la profondeur à partir d'une seule image RGB, la profondeur n'est pas donnée explicitement. Les travaux existants dans ce domaine utilisent soit un couple stéréoscopique, soit une vidéo monoculaire, ou encore plusieurs vues, et entraînent un réseau d'estimation de la profondeur en utilisant des fonctions de perte basées sur la reconstruction de la structure à partir du mouvement (structure-from-motion). Dans cette étude, nous nous appuyons sur les indices de profondeur issus du flou pour estimer la profondeur, plutôt que sur différentes vues. L'apprentissage repose sur une nouvelle couche convolutive fonctionnelle de diffusion ponctuelle (Point Spread Function), qui applique des noyaux spécifiques à chaque emplacement, issus du cercle de confusion (Circle-Of-Confusion) en chaque point de l'image. Nous évaluons notre méthode sur des données issues de cinq jeux de données couramment utilisés pour l'estimation de la profondeur et les images à champ lumineux, et présentons des résultats comparables aux méthodes supervisées sur les jeux de données KITTI et Make3D, tout en surpassant les approches d'apprentissage non supervisé. Étant donné que le phénomène d'estimation de la profondeur à partir du flou n'est pas spécifique à un jeu de données, nous supposons qu'un apprentissage basé sur ce phénomène serait moins sujet au surapprentissage du contenu spécifique de chaque jeu de données. Nos expériences montrent effectivement que c'est le cas, et qu'un estimateur appris sur un jeu de données grâce à notre méthode fournit des résultats meilleurs sur d'autres jeux de données que les méthodes directement supervisées.