HyperAIHyperAI
il y a 2 mois

Creuser dans l'estimation de profondeur monoculaire auto-supervisée

Clément Godard; Oisin Mac Aodha; Michael Firman; Gabriel Brostow
Creuser dans l'estimation de profondeur monoculaire auto-supervisée
Résumé

Les données de profondeur au niveau du pixel sont difficiles à acquérir à grande échelle. Pour surmonter cette limitation, l'apprentissage auto-supervisé est apparu comme une alternative prometteuse pour former des modèles à effectuer des estimations de profondeur monoculaire. Dans cet article, nous proposons un ensemble d'améliorations qui, ensemble, conduisent à des cartes de profondeur quantitativement et qualitativement améliorées par rapport aux méthodes auto-supervisées concurrentes.La recherche sur la formation monoculaire auto-supervisée explore généralement des architectures, fonctions de perte et modèles de formation d'images de plus en plus complexes, qui ont récemment contribué à réduire l'écart avec les méthodes entièrement supervisées. Nous montrons qu'un modèle surprenamment simple, ainsi que les choix de conception associés, peuvent conduire à des prédictions supérieures. En particulier, nous proposons (i) une perte de reprojection minimale, conçue pour gérer robustement les occultations, (ii) une méthode d'échantillonnage multi-échelle à pleine résolution qui réduit les artefacts visuels, et (iii) une perte d'auto-masquage pour ignorer les pixels d'entraînement qui violent les hypothèses de mouvement caméra. Nous démontrons l'efficacité de chaque composant individuellement et présentons des résultats de haute qualité, à la pointe de l'état de l'art, sur le benchmark KITTI.

Creuser dans l'estimation de profondeur monoculaire auto-supervisée | Articles de recherche récents | HyperAI