HyperAIHyperAI
il y a 8 jours

AKDT : Transformateur à dilatation de noyau adaptatif pour un débruitage d'image efficace

{Ciprian Orhei, Adrian Avram, Raul Balmez, Alexandru Brateanu}
Résumé

L’image denoising est une tâche fondamentale mais difficile, en particulier lorsqu’elle concerne des images haute résolution et des motifs de bruit complexes. La plupart des méthodes existantes reposent sur des architectures Transformer standard, qui souffrent souvent d’une complexité computationnelle élevée et d’une faible adaptabilité aux niveaux de bruit variables. Dans ce travail, nous introduisons le modèle Adaptive Kernel Dilation Transformer (AKDT), une nouvelle architecture basée sur le Transformer qui exploite pleinement le potentiel des taux de dilatation apprenables au sein des convolutions. L’AKDT se compose de plusieurs couches et de blocs sur mesure, incluant notre nouveau module Learnable Dilation Rate (LDR), utilisé pour construire un module d’estimation du bruit (Noise Estimator, NE). Au cœur de l’AKDT, le NE est intégré de manière fluide aux composants standards du Transformer pour former le réseau feed-forward guidé par le bruit (Noise-Guided Feed-Forward Network, NG-FFN) et l’attention multi-têtes guidée par le bruit (Noise-Guided Multi-Headed Self-Attention, NG-MSA). Ces composants du Transformer modulés par le bruit permettent au modèle d’atteindre des performances de débruitage inégalées tout en réduisant significativement les coûts computationnels. Des expériences étendues sur plusieurs benchmarks de débruitage d’images montrent que l’AKDT établit un nouveau record d’état de l’art, en traitant efficacement à la fois les bruits réels et synthétiques. Le code source et les modèles pré-entraînés sont disponibles publiquement à l’adresse suivante : https://github.com/albrateanu/AKDT.

AKDT : Transformateur à dilatation de noyau adaptatif pour un débruitage d'image efficace | Articles de recherche récents | HyperAI