Caractéristiques contextuelles spatiales orientées pour la détection d'ombres

La détection d'ombres est une tâche fondamentale et complexe, car elle nécessite une compréhension des sémantiques globales de l'image et les ombres peuvent se trouver sur diverses arrière-plans. Cet article présente un nouveau réseau neuronal pour la détection d'ombres en analysant le contexte de l'image de manière directionnelle. Pour y parvenir, nous formulons mécanisme d'attention directionnel dans un réseau neuronal récurrent spatial (RNN) en introduisant des poids d'attention lors de l'agrégation des caractéristiques contextuelles spatiales dans le RNN. En apprenant ces poids au cours de l'entraînement, nous pouvons récupérer le contexte spatial directionnel (CSD) pour détecter les ombres. Cette conception est développée en module CSD et intégrée à un CNN pour apprendre les caractéristiques CSD à différents niveaux. De plus, une perte de cross-entropy pondérée est conçue pour rendre l'entraînement plus efficace. Nous utilisons deux jeux de données de référence couramment utilisés pour la détection d'ombres et effectuons diverses expériences pour évaluer notre réseau. Les résultats expérimentaux montrent que notre réseau surpasses les méthodes les plus avancées actuellement disponibles et atteint une précision de 97 % avec une réduction de 38 % du taux d'erreur équilibré.