il y a 16 jours

DCPI-Depth : Infusion Explicite d’un Précédent de Correspondance Densité pour l’Estimation Non Supervisée de Profondeur Monoculaire

Mengtan Zhang, Yi Feng, Qijun Chen, Rui Fan

Résumé

Il y a eu récemment une forte montée d'intérêt pour l'apprentissage de la perception de la profondeur à partir de vidéos monoculaires de manière non supervisée. Un défi majeur dans ce domaine réside dans l'obtention d'une estimation de profondeur robuste et précise dans des scénarios complexes, en particulier dans les régions à textures faibles ou où des objets dynamiques sont présents. Cette étude présente trois contributions majeures en explorant en profondeur les priori de correspondance dense afin d'apporter des contraintes géométriques explicites aux cadres existants. La première originalité consiste en une perte de cohérence de profondeur contextuelle-géométrique, qui utilise des cartes de profondeur triangulées à partir de correspondances denses basées sur un mouvement propre estimé pour guider l'apprentissage de la perception de la profondeur à partir d'informations contextuelles, car les cartes de profondeur triangulées explicitement obtenues capturent avec précision les distances relatives entre les pixels. La deuxième originalité découle de l'observation selon laquelle une relation explicite et déductible existe entre la divergence du flux optique et le gradient de profondeur. Une perte de corrélation de propriété différentielle est donc conçue pour affiner l'estimation de profondeur, en mettant un accent particulier sur les variations locales. La troisième originalité est une stratégie d'ajustement bidirectionnel des flux, qui renforce l'interaction entre les flux rigides et les flux optiques, en encourageant ce dernier à atteindre une correspondance plus précise tout en rendant le second plus adaptable à divers scénarios sous l'hypothèse de scènes statiques. Le cadre DCPI-Depth, qui intègre tous ces composants innovants et couple deux flux bidirectionnels et collaboratifs, atteint des performances et une généralisation de pointe sur plusieurs jeux de données publics, surpassant ainsi tous les travaux antérieurs. En particulier, il démontre une estimation de profondeur précise dans les régions sans texture et les zones dynamiques, tout en offrant une lissité plus raisonnable. Le code source sera rendu publique à l'adresse mias.group/DCPI-Depth à la publication.