Réseau de pyramide d'attention spatiale pour l'adaptation de domaine non supervisée

L’adaptation de domaine non supervisée est essentielle dans diverses tâches de vision par ordinateur, telles que la détection d’objets, la segmentation d’instances et la segmentation sémantique, dont l’objectif est de réduire la dégradation des performances due au décalage de domaine. La plupart des méthodes précédentes reposent sur une distribution à mode unique des domaines source et cible pour les aligner par apprentissage adversaire, ce qui conduit à des résultats médiocres dans de nombreuses situations. À cet effet, dans cet article, nous proposons un nouveau réseau à pyramide d’attention spatiale pour l’adaptation de domaine non supervisée. Plus précisément, nous construisons d’abord une représentation en pyramide spatiale afin de capturer les informations contextuelles des objets à différentes échelles. Guidés par des informations spécifiques à la tâche, nous combinons efficacement la représentation structurelle globale dense et les motifs locaux de texture à chaque position spatiale à l’aide du mécanisme d’attention spatiale. Ainsi, le réseau est contraint de se concentrer sur les régions discriminantes enrichies d’informations contextuelles pour l’adaptation de domaine. Nous menons des expériences étendues sur plusieurs jeux de données exigeants pour l’adaptation de domaine non supervisée en détection d’objets, segmentation d’instances et segmentation sémantique, démontrant que notre méthode surpasse de manière significative les méthodes de l’état de l’art. Notre code source est disponible à l’adresse suivante : https://isrc.iscas.ac.cn/gitlab/research/domain-adaption.