BANet : Réseaux d'attention conscients du flou pour le déflouage de scènes dynamiques

Le flou de mouvement d'image résulte d'une combinaison des mouvements des objets et des vibrations de l'appareil photo, et cet effet de flou est généralement directionnel et non uniforme. Les recherches antérieures ont tenté de traiter les flous non uniformes en utilisant des architectures à récurrence auto-entretenue, multiscales, multi-fragments ou multi-temporelles, intégrant une attention auto-associative pour obtenir des résultats satisfaisants. Toutefois, l’utilisation de cadres à récurrence auto-entretenue entraîne généralement un temps de déduction prolongé, tandis que l’attention inter-pixel ou inter-canal peut engendrer une consommation mémoire excessive. Ce papier propose un réseau d’attention conscient du flou (BANet), capable de réaliser un déflouage précis et efficace en une seule passe forward. Notre BANet exploite une attention auto-associative basée sur des régions, combinée à un pooling par bandes à noyaux multiples, afin de décomposer les motifs de flou de différentes intensités et orientations, ainsi qu’une convolution dilatée en cascade parallèle pour agréger des caractéristiques de contenu à plusieurs échelles. Des résultats expérimentaux étendus sur les benchmarks GoPro et RealBlur démontrent que le BANet proposé se distingue favorablement des méthodes de pointe en restauration d’images floues et permet d’obtenir des résultats défloués en temps réel.