HyperAIHyperAI
il y a 11 jours

Interprétation de scènes par un modèle de classification intégré et une régularisation basée sur la variance

{ Zichen Song, Qingbo Wu, Hongliang Li, Hengcan Shi}
Interprétation de scènes par un modèle de classification intégré et une régularisation basée sur la variance
Résumé

La segmentation d'images est une tâche difficile en vision par ordinateur, pouvant être formulée comme un problème de classification par pixel. Les méthodes basées sur les réseaux de neurones profonds existantes utilisent généralement un classificateur général pour reconnaître toutes les catégories d'objets. Toutefois, ce classificateur général est sujet à des erreurs lorsqu'il traite des catégories ambiguës présentant des apparences ou des significations similaires. Dans cet article, nous proposons un modèle de classification intégré ainsi qu'une régularisation fondée sur la variance, afin d'obtenir des classifications plus précises. D'une part, le modèle de classification intégré inclut plusieurs classificateurs, non seulement le classificateur général, mais aussi un classificateur de raffinement conçu pour distinguer les catégories ambiguës. D'autre part, la régularisation basée sur la variance vise à maximiser la séparation entre les scores attribués à toutes les catégories, afin de réduire les erreurs de classification. Plus précisément, le modèle intégré repose sur trois étapes. La première consiste à extraire les caractéristiques de chaque pixel. À partir de ces caractéristiques, la deuxième étape effectue la classification de chaque pixel parmi toutes les catégories, produisant ainsi un résultat de classification préliminaire. Dans la troisième étape, nous utilisons un classificateur de raffinement pour affiner ce résultat, en se concentrant particulièrement sur la distinction entre les catégories ayant un score préliminaire élevé. Un loss intégré combinant la régularisation basée sur la variance est utilisé pour entraîner le modèle. Des expériences étendues sur trois jeux de données courants pour la segmentation d'images démontrent l'efficacité de la méthode proposée.

Interprétation de scènes par un modèle de classification intégré et une régularisation basée sur la variance | Articles de recherche récents | HyperAI