LYT-NET : Réseau léger basé sur un transformateur YUV pour l'amélioration d'images en faible luminosité

Cette lettre présente LYT-Net, un nouveau modèle léger basé sur les transformateurs pour l'amélioration des images en faible lumière (Low-Light Image Enhancement, LLIE). LYT-Net est composé de plusieurs couches et de blocs détachables, notamment nos nouveaux blocs -- le Dénicheur de Bruit par Canal (Channel-Wise Denoiser, CWD) et la Fusion Multistage de Compression et d'Excitation (Multi-Stage Squeeze & Excite Fusion, MSEF) -- ainsi que du traditionnel bloc Transformer et de l'Attention Auto-Référencée à Têtes Multiples (Multi-Headed Self-Attention, MHSA). Dans notre méthode, nous adoptons une approche à double voie, traitant les canaux chromatiques U et V et le canal de luminance Y comme des entités distinctes afin d'aider le modèle à mieux gérer l'ajustement de l'éclairage et la restauration des corruptions. Notre évaluation exhaustive sur des jeux de données LLIE établis montre que, malgré sa faible complexité, notre modèle surpasses les méthodes LLIE récentes. Le code source et les modèles pré-entraînés sont disponibles à l'adresse suivante : https://github.com/albrateanu/LYT-Net