Apprentissage de la détection de classes ouvertes pour l’adaptation de domaine universelle

L’adaptation de domaine universelle (UDA) permet de transférer des connaissances entre des domaines sans contrainte sur les ensembles d’étiquettes, étendant ainsi l’applicabilité de l’adaptation de domaine dans des scénarios réels. En UDA, les ensembles d’étiquettes source et cible peuvent contenir chacun des étiquettes propres, non partagées par l’autre domaine. Un défi de facto de l’UDA consiste à classifier les exemples cibles appartenant aux classes partagées malgré le décalage de domaine. Un autre défi tout aussi crucial réside dans la détection des exemples cibles appartenant à l’ensemble d’étiquettes propres au domaine cible (classes ouvertes), en les marquant comme « inconnus ». Ces deux défis intriqués rendent l’UDA un problème largement sous-exploité. Les travaux antérieurs sur l’UDA se concentrent principalement sur la classification des données dans les classes partagées, en utilisant comme métrique d’évaluation l’exactitude par classe, ce qui biaise fortement les résultats en faveur de l’exactitude sur les classes partagées. Or, une détection précise des classes ouvertes constitue la tâche essentielle permettant de réaliser une adaptation de domaine universelle réelle. Une telle détection transforme en outre le problème UDA en un problème bien établi d’adaptation de domaine à ensemble fermé. Pour améliorer la détection des classes ouvertes, nous proposons une méthode originale, nommée CMU (Calibrated Multiple Uncertainties), basée sur une nouvelle mesure de transférabilité estimée à partir d’un mélange de quantités d’incertitude complémentaires : entropie, confiance et cohérence, définies sur des probabilités conditionnelles calibrées par un modèle d’ensemble de classifieurs multi-classes. Cette nouvelle mesure de transférabilité quantifie avec précision l’inclinaison d’un exemple cible vers les classes ouvertes. Nous introduisons également une nouvelle métrique d’évaluation, appelée H-score, qui met l’accent sur l’importance simultanée de l’exactitude sur les classes partagées et sur la classe « inconnue ». Les résultats expérimentaux dans un cadre UDA montrent que CMU surpasser les méthodes d’adaptation de domaine les plus avancées sur toutes les métriques d’évaluation, et ce, de manière significative, notamment en termes de H-score.