HyperAIHyperAI
il y a 8 jours

Méthode de boucle itérative combinant apprentissage actif et apprentissage semi-supervisé pour la segmentation sémantique adaptative au domaine

Licong Guan, Xue Yuan
Méthode de boucle itérative combinant apprentissage actif et apprentissage semi-supervisé pour la segmentation sémantique adaptative au domaine
Résumé

La segmentation sémantique constitue une technique essentielle pour la perception de l’environnement dans les systèmes de transport intelligents. Grâce au développement rapide des réseaux de neurones convolutifs (CNN), l’analyse des scènes routières parvient généralement à des résultats satisfaisants dans le domaine source. Toutefois, garantir une bonne généralisation face à des scénarios variés du domaine cible reste un défi majeur. Récemment, l’apprentissage semi-supervisé et l’apprentissage actif ont été proposés pour atténuer ce problème. L’apprentissage semi-supervisé permet d’améliorer la précision du modèle en exploitant de grandes quantités de données non étiquetées, mais peut générer des pseudo-étiquettes bruitées lorsque les données d’entraînement sont limitées ou déséquilibrées. En l’absence d’intervention humaine, les modèles obtenus risquent d’être sous-optimaux. L’apprentissage actif permet de sélectionner des données plus pertinentes pour l’intervention, mais la précision du modèle ne progresse pas significativement car les données non étiquetées massives ne sont pas exploitées. De plus, lorsque la différence entre les domaines est trop importante, la probabilité de sélectionner des échantillons sous-optimaux augmente, entraînant une hausse du coût d’étiquetage. Ce papier propose une méthode itérative combinant apprentissage actif et apprentissage semi-supervisé pour la segmentation sémantique adaptative au domaine. La méthode utilise d’abord l’apprentissage semi-supervisé pour tirer parti des données non étiquetées en grand nombre, afin d’améliorer la précision du modèle et de fournir un modèle de sélection plus fiable pour l’apprentissage actif. Ensuite, en combinant la stratégie de sélection d’échantillons basée sur l’incertitude prédictive de l’apprentissage actif, une intervention humaine est effectuée pour corriger les pseudo-étiquettes. Enfin, des boucles itératives flexibles permettent d’atteindre les meilleurs performances tout en minimisant le coût d’étiquetage. Des expériences étendues montrent que notre méthode atteint un état de l’art sur les tâches GTAV vers Cityscapes et SYNTHIA vers Cityscapes, avec une amélioration respective de 4,9 % et 5,2 % en mIoU par rapport à la meilleure méthode précédente.