KerCNNs : connexions latérales inspirées de la biologie pour la classification d’images corrompues

L’état de l’art dans de nombreuses tâches de vision par ordinateur repose sur les réseaux de neurones convolutifs (CNN). Bien que leur organisation hiérarchique et leur extraction locale de caractéristiques s’inspirent de la structure des systèmes visuels chez les primates, l’absence de connexions latérales dans ces architectures les distingue fondamentalement du traitement biologique des objets. Ces dernières années, l’idée d’enrichir les CNN par des connexions latérales récurrentes de type convolutif a été mise en œuvre sous la forme de noyaux récurrents appris, sans contrainte géométrique. Dans ce travail, nous introduisons des noyaux latéraux biologiquement plausibles, qui codent une notion de corrélation entre les filtres en aval d’un CNN : à chaque couche, le noyau associé agit comme un noyau de transition sur l’espace des activations. Ces noyaux latéraux sont définis en fonction des filtres du réseau, offrant ainsi une approche sans paramètre pour évaluer la géométrie des connexions horizontales à partir de la structure en aval. Nous testons ensuite cette nouvelle architecture, que nous appelons KerCNN, sur une tâche de généralisation liée à l’analyse de formes globales et au complément de motifs : après entraînement pour une classification d’images de base, le réseau est évalué sur des images corrompues. Les perturbations appliquées visent à compromettre la reconnaissance des images par des caractéristiques locales, ce qui impose une intégration d’informations contextuelles — un processus fortement lié aux connexions latérales dans la vision biologique. Nos expériences montrent que les KerCNN sont nettement plus stables que les CNN classiques et les CNN récurrents face à ces dégradations, validant ainsi une approche inspirée de la biologie pour renforcer la reconnaissance d’objets dans des conditions difficiles.