Réseaux Neuraux Non Locaux Rapides et Interprétables pour le Débruitage d'Images par Apprentissage de Dictionnaire Convolutif Groupe-Épars

La non-localité de l'auto-similarité au sein des images naturelles est devenue un a priori de plus en plus populaire dans les modèles d'apprentissage profond. Malgré leurs performances réussies en restauration d'images, ces modèles restent largement inexplicables en raison de leur construction boîte noire. Nos études précédentes ont montré qu'il était possible d'obtenir une construction interprétable d'un débruiteur entièrement convolutif (CDLNet) avec des performances équivalentes à celles des meilleurs modèles boîte noire, en déroulant un algorithme d'apprentissage de dictionnaire. Dans ce manuscrit, nous cherchons à construire de manière interprétable un réseau convolutif avec un a priori de non-localité de l'auto-similarité, qui offre des performances comparables à celles des modèles non-locaux boîte noire. Nous montrons que cette architecture peut être efficacement réalisée en améliorant le critère de parcimonie $\ell 1$ du CDLNet pour le transformer en un critère de parcimonie pondérée par groupes. À partir de cette formulation, nous proposons une nouvelle opération non-locale par fenêtre glissante, rendue possible par l'arithmétique sur tableaux creux. En plus d'une performance compétitive avec les DNNs non-locales boîte noire, nous démontrons que l'attention parcimonieuse par fenêtre glissante proposée permet des vitesses d'inférence supérieures d'un ordre de grandeur à celles de ses concurrents.