HyperAIHyperAI
il y a 17 jours

Stripformer : Strip Transformer pour le flou d'image rapide

Fu-Jen Tsai, Yan-Tsung Peng, Yen-Yu Lin, Chung-Chi Tsai, Chia-Wen Lin
Stripformer : Strip Transformer pour le flou d'image rapide
Résumé

Les images prises dans des scènes dynamiques peuvent contenir un flou de mouvement indésirable, qui dégrade considérablement la qualité visuelle. Ce flou engendre des artefacts de lissage spécifiques à certaines régions, à court et à longue portée, souvent directionnels et non uniformes, difficiles à supprimer. Inspirés par les succès récents des transformateurs dans les tâches de vision par ordinateur et de traitement d’images, nous proposons Stripformer, une architecture basée sur les transformateurs qui construit des tokens intra-bande et inter-bande afin de réajuster les caractéristiques d’image dans les directions horizontale et verticale, permettant ainsi de capturer des motifs flous orientés de manière différente. En empilant des couches d’attention intercalées intra-bande et inter-bande, Stripformer parvient à révéler les intensités du flou. En plus de détecter des motifs flous régionaux de diverses orientations et intensités, Stripformer est également un modèle transformateur à faible consommation de tokens et à faible nombre de paramètres, nécessitant bien moins de mémoire et de coût computationnel qu’un transformateur classique, tout en offrant de meilleures performances sans dépendre de grandes quantités de données d’entraînement. Les résultats expérimentaux montrent que Stripformer se distingue favorablement des modèles les plus avancés dans la tâche de déflouage d’images en scènes dynamiques.

Stripformer : Strip Transformer pour le flou d'image rapide | Articles de recherche récents | HyperAI