HMS-Net : Réseau hiérarchique multi-échelle invariant à la parcimonie pour l'achèvement de profondeur parcimonieuse

Les indices de profondeur denses sont importants et ont des applications variées dans diverses tâches de vision par ordinateur. Dans le domaine de la conduite autonome, les capteurs LIDAR sont utilisés pour acquérir des mesures de profondeur autour du véhicule afin de percevoir l'environnement environnant. Cependant, les cartes de profondeur obtenues par LIDAR sont généralement peu denses en raison des limitations matérielles. La tâche de complétion de profondeur attire une attention croissante, visant à générer une carte de profondeur dense à partir d'une carte de profondeur éparsse en entrée. Pour utiliser efficacement les caractéristiques multi-échelles, nous proposons trois nouvelles opérations invariantes à la rareté, sur lesquelles repose également un réseau encodeur-décodeur multi-échelle invariant à la rareté (HMS-Net) conçu pour traiter des entrées éparse et des cartes de caractéristiques éparse. Des caractéristiques RGB supplémentaires peuvent être intégrées pour améliorer davantage les performances de complétion de profondeur. Nos expériences approfondies et notre analyse des composants sur deux benchmarks publics, le benchmark KITTI pour la complétion de profondeur et le jeu de données NYU-depth-v2, démontrent l'efficacité de notre approche proposée. Au 12 août 2018, sur le classement KITTI pour la complétion de profondeur, notre modèle proposé sans guidage RGB occupe la première place parmi toutes les méthodes évaluées par des pairs n'utilisant pas d'informations RGB, tandis que notre modèle avec guidage RGB se classe deuxième parmi toutes les méthodes guidées par RGB.