HyperAIHyperAI
il y a 2 mois

SRCD : Raisonnement Sémantique avec des Domaines Composés pour la Détection Généralisée d'Objets à Domaine Unique

Zhijie Rao; Jingcai Guo; Luyao Tang; Yue Huang; Xinghao Ding; Song Guo
SRCD : Raisonnement Sémantique avec des Domaines Composés pour la Détection Généralisée d'Objets à Domaine Unique
Résumé

Ce papier propose un cadre novateur pour la détection d'objets généralisée à un seul domaine (Single-DGOD), où nous nous intéressons à l'apprentissage et au maintien des structures sémantiques de échantillons inter-domaines composés auto-accrus afin d'améliorer la capacité de généralisation du modèle. Contrairement à DGOD formé sur plusieurs domaines sources, le Single-DGOD est beaucoup plus difficile à généraliser efficacement vers plusieurs domaines cibles avec seulement un seul domaine source. Les méthodes existantes adoptent en grande majorité une approche similaire à celle de DGOD pour apprendre des caractéristiques invariantes par domaine en découplant ou en comprimant l'espace sémantique. Cependant, il peut y avoir deux limitations potentielles : 1) une corrélation pseudo-attribut-étiquette, due à l'extrême rareté des données mono-domaine ; et 2) les informations structurelles sémantiques sont généralement ignorées, c'est-à-dire que nous avons constaté que les affinités des relations sémantiques au niveau de l'instance dans les échantillons sont cruciales pour la généralisation du modèle. Dans ce travail, nous introduisons le Raisonnement Sémantique avec Domaines Composés (SRCD) pour le Single-DGOD. Plus précisément, notre SRCD comprend deux composants principaux, à savoir le module d'auto-amplification basé sur la texture (TBSA) et le module de raisonnement sémantique local-global (LGSR). Le TBSA vise à éliminer les effets des attributs non pertinents associés aux étiquettes, tels que la lumière, l'ombre, la couleur, etc., au niveau de l'image par une auto-amplification légère mais efficace. De plus, le LGSR est utilisé pour modéliser davantage les relations sémantiques sur les caractéristiques d'instances afin de révéler et de maintenir les structures sémantiques intrinsèques. De nombreuses expériences sur plusieurs bancs d'essai démontrent l'efficacité du SRCD proposé.

SRCD : Raisonnement Sémantique avec des Domaines Composés pour la Détection Généralisée d'Objets à Domaine Unique | Articles de recherche récents | HyperAI