Bases simples pour la restauration d'images

Bien que des progrès significatifs aient été réalisés récemment dans le domaine de la restauration d'images, la complexité des systèmes des méthodes les plus avancées (state-of-the-art, SOTA) augmente également, ce qui peut entraver l'analyse et la comparaison pratiques de ces méthodes. Dans cet article, nous proposons une ligne de base simple qui dépasse les méthodes SOTA et est efficace sur le plan computationnel. Pour simplifier davantage cette ligne de base, nous démontrons que les fonctions d'activation non linéaires, telles que Sigmoid, ReLU, GELU, Softmax, etc., ne sont pas nécessaires : elles peuvent être remplacées par une multiplication ou supprimées. Ainsi, nous dérivons un réseau exempt de fonctions d'activation non linéaires, nommé NAFNet (Nonlinear Activation Free Network). Des résultats SOTA sont obtenus sur diverses benchmarks difficiles, par exemple : 33,69 dB PSNR sur GoPro (pour la désaturation d'images), dépassant le précédent SOTA de 0,38 dB avec seulement 8,4 % de ses coûts computationnels ; 40,30 dB PSNR sur SIDD (pour le débruitage d'images), dépassant le précédent SOTA de 0,28 dB avec moins de la moitié de ses coûts computationnels. Le code source et les modèles pré-entraînés sont disponibles à l'adresse suivante : https://github.com/megvii-research/NAFNet.