Aerial-PASS : Segmentation panoramique annulaire de scènes dans les vidéos de drones

La perception pixel par pixel de la scène environnante depuis le ciel constitue une tâche essentielle pour les véhicules aériens sans pilote (UAV). Les travaux de recherche antérieurs s'appuient principalement sur des caméras conventionnelles à lentille simple (pinhole) ou des caméras à grand angle (fisheye) comme dispositifs d'imagerie. Toutefois, ces systèmes d'imagerie ne parviennent pas simultanément à offrir un champ de vue (FoV) large, une taille réduite et un poids faible. À cet effet, nous concevons un système UAV intégrant une lentille annulaire panoramique (PAL), caractérisée par sa petite taille, son faible poids et un champ de vue annulaire de 360 degrés. Nous proposons également un modèle de réseau neuronal léger pour la segmentation sémantique panoramique annulaire, permettant une interprétation précise et en temps réel de la scène. En outre, nous présentons le premier jeu de données de segmentation panoramique à perspective drone, nommé Aerial-PASS, doté d'étiquettes annotées pour des catégories telles que les pistes, les champs et autres éléments. Des expérimentations approfondies démontrent que le système conçu s'acquitte efficacement de la tâche de perception panoramique aérienne. En particulier, le modèle proposé atteint un excellent compromis entre performance de segmentation et vitesse d'inférence, validé aussi bien sur des jeux de données publics de scènes de rue que sur notre propre jeu de données de scènes aériennes.