HyperAIHyperAI
il y a 17 jours

Segmentation sémantique à partir de données de capteurs à distance et exploitation de l'apprentissage latent pour la classification des tâches auxiliaires

Bodhiswatta Chatterjee, Charalambos Poullis
Segmentation sémantique à partir de données de capteurs à distance et exploitation de l'apprentissage latent pour la classification des tâches auxiliaires
Résumé

Dans cet article, nous abordons trois aspects différents de la segmentation sémantique à partir de données de capteurs à distance en utilisant des réseaux neuronaux profonds. Premièrement, nous nous concentrons sur la segmentation sémantique des bâtiments à partir de données de capteurs à distance et proposons un réseau baptisé ICT-Net. Ce réseau a été évalué sur les jeux de données de référence INRIA et AIRS, et il s'avère surpasser tous les autres états de l'art de plus de 1,5 % et 1,8 % respectivement selon l'indice de Jaccard.Deuxièmement, comme la classification des bâtiments constitue typiquement la première étape du processus de reconstruction, nous étudions la relation entre la précision de classification et la précision de reconstruction.Enfin, nous présentons le concept simple mais convaincant de l’apprentissage latent et les implications qu’il comporte dans le cadre de l’apprentissage profond. Nous supposons qu’un réseau entraîné sur une tâche principale (par exemple, la classification des bâtiments) apprend involontairement des informations sur des tâches auxiliaires (par exemple, la classification des routes, des arbres, etc.), qui sont complémentaires à la tâche principale. Nous avons testé de manière exhaustive cette approche sur le jeu de données de référence ISPRS, qui contient des vérités terrain à plusieurs étiquettes, et rapportons une précision moyenne de classification (score F1) de 54,29 % (écart-type = 17,03) pour les routes, 10,15 % (écart-type = 2,54) pour les voitures, 24,11 % (écart-type = 5,25) pour les arbres, 42,74 % (écart-type = 6,62) pour la végétation basse, et 18,30 % (écart-type = 16,08) pour les éléments de désordre.Le code source et les matériaux complémentaires sont disponibles publiquement à l’adresse suivante : http://www.theICTlab.org/lp/2019ICT-Net/.