HyperAIHyperAI
il y a 17 jours

PushPull-Net : ResNet résistante aux dégradations d’images pilotée par inhibition

Guru Swaroop Bennabhaktula, Enrique Alegre, Nicola Strisciuglio, George Azzopardi
PushPull-Net : ResNet résistante aux dégradations d’images pilotée par inhibition
Résumé

Nous introduisons une nouvelle unité computationnelle, nommée PushPull-Conv, placée dans la première couche d'une architecture ResNet, inspirée du phénomène d'inhibition en opposition de phase observé dans le cortex visuel primaire. Cette unité redéfinit la couche convolutive traditionnelle en mettant en œuvre une paire de filtres complémentaires : un noyau entraînable de type « pousser » (push kernel) et son contrepartie, le noyau « tirer » (pull kernel). Le noyau push (analogue à la convolution classique) apprend à répondre à des stimuli spécifiques, tandis que le noyau pull réagit au même stimulus mais avec un contraste opposé. Cette configuration renforce la sélectivité des stimuli et inhibe efficacement les réponses dans les régions ne contenant pas de stimuli préférés. Ce phénomène s'explique par le fait que les noyaux push et pull produisent des réponses d'amplitude comparable dans ces régions, s'annulant mutuellement. L'intégration de PushPull-Conv dans les ResNets accroît significativement leur robustesse aux perturbations d'images. Nos expérimentations sur des jeux de données de corruption standards montrent que PushPull-Conv peut être combiné avec d'autres techniques d'augmentation de données pour améliorer encore davantage la robustesse du modèle. Nous établissons ainsi une nouvelle référence en matière de robustesse sur ResNet50, atteignant un taux d'erreur moyenne corrompue (mCE) de 49,95 % sur ImageNet-C lorsqu'on combine l'augmentation PRIME avec l'inhibition PushPull.