VDD : Jeu de données de drones variés pour la segmentation sémantique

La segmentation sémantique des images prises par drones est essentielle pour de nombreuses tâches de vision aérienne, car elle fournit des informations sémantiques cruciales permettant de comprendre les scènes au sol. Assurer une haute précision des modèles de segmentation sémantique pour les drones nécessite l’accès à des jeux de données diversifiés, à grande échelle et à haute résolution, qui restent souvent rares dans le domaine du traitement d’images aériennes. Alors que les jeux de données existants se concentrent principalement sur des scènes urbaines et sont relativement limités en taille, notre Varied Drone Dataset (VDD) remédie à ces lacunes en proposant une collection à grande échelle, entièrement annotée avec densité, comprenant 400 images à haute résolution couvrant 7 catégories sémantiques. Ce jeu de données inclut une variété de scènes situées dans des environnements urbains, industriels, ruraux et naturels, capturées depuis différents angles de caméra et sous diverses conditions d’éclairage. Nous avons également effectué de nouvelles annotations sur les jeux de données UDD et UAVid, en les intégrant selon les normes d’annotation du VDD, afin de constituer le Integrated Drone Dataset (IDD). Nous avons entraîné sept modèles d’état de l’art sur ces jeux de données afin d’établir des références de base. Il est attendu que notre jeu de données suscite un vif intérêt dans le domaine de la segmentation des images de drones et serve de fondement à d’autres tâches de vision drone. Les jeux de données sont accessibles publiquement à l’adresse suivante : \href{notre site web}{https://github.com/RussRobin/VDD}.