RegNet : Réseau auto-régulé pour la classification d'images

Les architectures ResNet et leurs variantes ont connu un succès remarquable dans diverses tâches de vision par ordinateur. Malgré leur efficacité dans la facilitation du flux du gradient à travers les blocs de construction, le mécanisme de connexion courte simple limite la capacité à réexploiter de nouvelles caractéristiques potentiellement complémentaires, en raison de la fonction d’addition. Pour remédier à ce problème, nous proposons dans cet article d’introduire un module régulateur agissant comme une mémoire afin d’extraire des caractéristiques complémentaires, qui sont ensuite alimentées dans le réseau ResNet. Plus précisément, le module régulateur est composé de réseaux récurrents convolutifs (par exemple, LSTM convolutifs ou GRU convolutifs), démontrés efficaces pour extraire des informations spatio-temporelles. Nous désignons les nouveaux réseaux régulés par le nom de RegNet. Ce module régulateur peut être facilement implémenté et ajouté à toute architecture ResNet. Nous appliquons également ce module pour améliorer le réseau ResNet à excitation par compression (Squeeze-and-Excitation ResNet), afin de montrer la capacité généralisable de notre méthode. Les résultats expérimentaux sur trois jeux de données de classification d’images démontrent les performances prometteuses de l’architecture proposée par rapport au ResNet standard, au SE-ResNet et à d’autres architectures de pointe.