Boosting adaptatif pour l'adaptation de domaine : Vers des prédictions robustes en segmentation de scène

L’adaptation de domaine vise à transférer les connaissances partagées apprises à partir d’un domaine source vers un nouvel environnement, c’est-à-dire un domaine cible. Une pratique courante consiste à entraîner le modèle sur des données étiquetées du domaine source ainsi que sur des données non étiquetées du domaine cible. Toutefois, les modèles appris sont généralement biaisés en raison de la forte supervision provenant du domaine source. La plupart des chercheurs adoptent une stratégie d’arrêt anticipé (early stopping) afin de prévenir le surapprentissage, mais le moment optimal pour interrompre l’entraînement reste un problème difficile à résoudre, en raison de l’absence d’un ensemble de validation pour le domaine cible. Dans cet article, nous proposons une méthode efficace de bootstrap, appelée AdaBoost Student, qui apprend explicitement des modèles complémentaires durant l’entraînement et libère ainsi l’utilisateur de l’arrêt empirique prématuré. AdaBoost Student combine l’apprentissage de modèles profonds avec une stratégie d’entraînement classique, à savoir l’adaptation par renforcement (adaptive boosting), et permet des interactions entre les modèles appris et l’échantillonneur de données. Nous utilisons un échantillonneur de données adaptatif afin de faciliter progressivement l’apprentissage sur les exemples difficiles, tout en agrégeant des modèles « faibles » pour prévenir le surapprentissage. Des expériences étendues montrent que : (1) Sans avoir à se soucier du moment d’arrêt, AdaBoost Student fournit une solution robuste grâce à un apprentissage efficace de modèles complémentaires pendant l’entraînement ; (2) AdaBoost Student est orthogonal à la plupart des méthodes d’adaptation de domaine, pouvant être combiné avec les approches existantes pour améliorer davantage les performances de l’état de l’art. Nous avons obtenu des résultats compétitifs sur trois benchmarks largement utilisés pour l’adaptation de domaine en segmentation de scènes.