Couche de masquage flou : injection de connaissances a priori dans les réseaux convolutionnels pour la classification d'images
Le traitement d’image vise à renforcer certaines caractéristiques visuelles telles que les contours, les frontières ou le contraste. L’objectif principal consiste à traiter l’image d’origine afin d’améliorer significativement les performances globales des tâches de visualisation, de classification et de segmentation. Les méthodes traditionnelles nécessitent un réglage manuel des paramètres pour contrôler le comportement du traitement. À ce jour, les approches récentes basées sur les réseaux de neurones convolutifs (CNN) utilisent fréquemment ces techniques comme étape de prétraitement enrichie. Dans ce travail, nous proposons la première couche de prétraitement intrinsèque basée sur les CNN, fondée sur l’algorithme bien connu du masquage non aiguisé (unsharp masking). La couche proposée intègre une connaissance a priori sur la manière d’améliorer l’image en ajoutant des informations de haute fréquence à l’entrée, afin de mettre en évidence les caractéristiques significatives. Cette couche optimise automatiquement les paramètres du masquage non aiguisé durant l’entraînement du modèle, sans intervention manuelle. Nous évaluons les performances du réseau et son impact sur deux applications : la classification d’images CIFAR100 et le défi d’identification PlantCLEF. Les résultats obtenus montrent une amélioration significative par rapport aux CNN populaires, avec des gains respectifs de 9,49 % pour PlantCLEF et de 2,42 % pour CIFAR100 en général. La conception d’une couche d’amélioration par masquage non aiguisé améliore clairement la précision avec un coût de performance négligeable sur des modèles CNN simples, car une connaissance a priori est directement intégrée pour renforcer la robustesse du modèle.