Command Palette
Search for a command to run...
U2-Net : Aller plus loin avec une structure U imbriquée pour la détection d'objets saillants
U2-Net : Aller plus loin avec une structure U imbriquée pour la détection d'objets saillants
Xuebin Qin, Zichen Zhang, Chenyang Huang, Masood Dehghan, Osmar R. Zaiane, Martin Jagersand
Résumé
Dans cet article, nous concevons une architecture de réseau profond simple mais puissante, U2-Net, pour la détection d'objets saillants (SOD). L'architecture de notre U2-Net est une structure en U à deux niveaux imbriqués. Cette conception présente les avantages suivants : (1) elle est capable de capturer plus d'informations contextuelles à différentes échelles grâce au mélange de champs récepteurs de tailles différentes dans nos blocs ReSidual U (RSU) proposés, (2) elle augmente la profondeur de l'architecture globale sans augmenter significativement le coût computationnel grâce aux opérations de pooling utilisées dans ces blocs RSU. Cette architecture nous permet d'entraîner un réseau profond à partir de zéro sans utiliser des backbones issus de tâches de classification d'images. Nous instancions deux modèles de l'architecture proposée, U2-Net (176,3 Mo, 30 FPS sur GPU GTX 1080Ti) et U2-Net† (4,7 Mo, 40 FPS), afin de faciliter leur utilisation dans différents environnements. Les deux modèles obtiennent des performances compétitives sur six jeux de données SOD. Le code est disponible : https://github.com/NathanUA/U-2-Net.