LoveDA : Un jeu de données de télédétection pour la segmentation sémantique adaptative au domaine

Les approches d'apprentissage profond ont montré des résultats prometteurs dans la cartographie des couvertures du sol à haute résolution spatiale (HRS) à partir de données de télédétection. Toutefois, les scènes urbaines et rurales peuvent présenter des paysages géographiques radicalement différents, et la faible généralisation de ces algorithmes entrave la cartographie à l’échelle locale ou nationale. La plupart des jeux de données existants à HRS favorisent principalement la recherche sur l’apprentissage de représentations sémantiques, au détriment de la transférabilité des modèles. Dans cet article, nous introduisons le jeu de données Land-cOVEr Domain Adaptive semantic segmentation (LoveDA), conçu pour favoriser l’apprentissage sémantique et transférable. Le jeu LoveDA comprend 5 987 images à haute résolution spatiale avec 166 768 objets annotés provenant de trois villes différentes. Contrairement aux jeux de données existants, LoveDA englobe deux domaines (urbain et rural), ce qui pose des défis considérables dus à : 1) la présence d’objets à plusieurs échelles ; 2) des échantillons de fond complexes ; et 3) des distributions de classes incohérentes. Le jeu LoveDA est adapté aussi bien à la segmentation sémantique des couvertures du sol qu’aux tâches d’adaptation de domaine non supervisée (UDA). À cet effet, nous avons établi une évaluation comparative du jeu LoveDA sur onze méthodes de segmentation sémantique et huit méthodes d’UDA. Des études exploratoires ont également été menées, incluant l’analyse d’architectures à plusieurs échelles, des stratégies de supervision supplémentaire du fond et une étude des pseudo-étiquettes, afin de relever ces défis. Le code et les données sont disponibles à l’adresse suivante : https://github.com/Junjue-Wang/LoveDA.