HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

Adaptation de domaine non supervisée pour la segmentation sémantique par auto-entraînement équilibré par classe

{B. V. K. Vijaya Kumar Yang Zou Zhiding Yu Jinsong Wang}

Adaptation de domaine non supervisée pour la segmentation sémantique par auto-entraînement équilibré par classe

Résumé

Les récents réseaux profonds ont atteint des performances de pointe sur une variété de tâches de segmentation sémantique. Malgré ces progrès, ces modèles rencontrent fréquemment des difficultés dans des tâches réelles « sauvages », où existe une grande différence entre les données d'entraînement/origine étiquetées et les données de test/cibles non vues. En particulier, cette différence est souvent qualifiée de « fossé de domaine » (domain gap), pouvant entraîner une dégradation significative des performances, difficilement corrigeable par une simple augmentation de la puissance de représentation du modèle. L’adaptation de domaine non supervisée (Unsupervised Domain Adaptation, UDA) vise à surmonter ce problème sans nécessiter d’étiquettes sur le domaine cible. Dans cet article, nous proposons un nouveau cadre UDA fondé sur une procédure itérative d’apprentissage par auto-étiquetage (self-training, ST), dans lequel le problème est formulé comme une minimisation de perte sur des variables latentes, et peut être résolu par une itération alternée de génération d’étiquettes pseudo sur les données cibles et de re-entraînement du modèle à l’aide de ces étiquettes. Par ailleurs, nous introduisons un cadre novateur d’apprentissage par auto-étiquetage équilibré par classe (class-balanced self-training, CBST), afin d’éviter la domination progressive des grandes classes lors de la génération d’étiquettes pseudo, et nous intégrons des prioris spatiaux pour affiner les étiquettes générées. Des expériences approfondies montrent que les méthodes proposées atteignent des performances de segmentation sémantique de pointe dans plusieurs cadres UDA majeurs.

Benchmarks

BenchmarkMéthodologieMétriques
image-to-image-translation-on-gtav-toCBST
mIoU: 47.0
semi-supervised-semantic-segmentation-on-23CBST (Range View)
mIoU (1% Labels): 35.7
mIoU (10% Labels): 50.7
mIoU (20% Labels): 52.7
mIoU (50% Labels): 54.6
semi-supervised-semantic-segmentation-on-24CBST (Range View)
mIoU (1% Labels): 39.9
mIoU (10% Labels): 53.4
mIoU (20% Labels): 56.1
mIoU (50% Labels): 56.9
semi-supervised-semantic-segmentation-on-25CBST (Range View)
mIoU (1% Labels): 40.9
mIoU (10% Labels): 60.5
mIoU (20% Labels): 64.3
mIoU (50% Labels): 69.3

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp