Détection de lignes sémantiques et ses applications

Les lignes sémantiques caractérisent la disposition d'une image. Malgré leur importance dans l'analyse d'images et la compréhension de scènes, il n'existe actuellement aucune recherche fiable sur la détection des lignes sémantiques. Dans cet article, nous proposons un détecteur de lignes sémantiques basé sur un réseau de neurones convolutifs utilisant un apprentissage multi-tâches, en considérant la détection de lignes comme une combinaison de tâches de classification et de régression. Nous utilisons des couches de convolution et de max-pooling pour extraire des cartes de caractéristiques multi-échelles à partir de l'image d'entrée. Ensuite, nous introduisons une couche de pooling de lignes afin d'extraire un vecteur de caractéristiques pour chaque candidat de ligne à partir des cartes de caractéristiques. Ce vecteur est ensuite alimenté dans deux couches parallèles de classification et de régression. La couche de classification détermine si le candidat de ligne est sémantique ou non. En cas de ligne sémantique, la couche de régression calcule un décalage pour affiner la position de la ligne. Les résultats expérimentaux montrent que le détecteur proposé extrait les lignes sémantiques avec une précision et une fiabilité élevées. De plus, nous démontrons que ce détecteur peut être efficacement appliqué à trois tâches : l'estimation de l'horizon, l'amélioration de la composition et la simplification d'images.