Adaptation de domaine partielle sélective

L’adaptation de domaine partielle (PDA), qui suppose que l’espace des étiquettes du domaine cible est un sous-ensemble de celui du domaine source, a suscité un intérêt croissant ces dernières années. En raison des différences entre les espaces d’étiquettes des deux domaines, il est difficile d’effectuer une alignement direct entre ces derniers dans le cadre de la PDA. Pour résoudre ce problème, nous proposons une méthode d’adaptation de domaine partielle sélective (SPDA), qui sélectionne les données utiles pour l’adaptation au domaine cible. Plus précisément, nous concevons tout d’abord une fonction de similarité basée sur le cosinus maximal (MoC), spécifiquement adaptée à la PDA, afin de sélectionner dans le domaine source les échantillons les plus pertinents afin de réduire le désaccord entre domaines. Dans cette fonction MoC, pour chaque échantillon cible, nous sélectionnons le plus proche échantillon source en termes de similarité cosinus maximale, afin de le prendre en compte pour l’adaptation. Par ailleurs, une méthode d’apprentissage sélectif est conçue pour intégrer des données cibles utiles au domaine source. En détail, cette méthode attribue d’abord des pseudo-étiquettes aux échantillons cibles via une stratégie d’apprentissage auto-étiqueté, puis ajoute aux données source les échantillons cibles dont la confiance associée aux pseudo-étiquettes est élevée. Grâce à ces deux opérations de sélection, la méthode SPDA proposée parvient à sélectionner efficacement des données utiles pour l’adaptation de domaine. Des expériences menées sur plusieurs jeux de données démontrent l’efficacité de la méthode SPDA proposée.