HyperAIHyperAI
vor 2 Monaten

SRCD: Semantische Schlussfolgerung mit zusammengesetzten Bereichen für die generalisierte Objekterkennung in einzelnen Domänen

Zhijie Rao; Jingcai Guo; Luyao Tang; Yue Huang; Xinghao Ding; Song Guo
SRCD: Semantische Schlussfolgerung mit zusammengesetzten Bereichen für die generalisierte Objekterkennung in einzelnen Domänen
Abstract

Dieses Papier präsentiert einen neuen Rahmen für die einbereichsweise verallgemeinerte Objekterkennung (Single-DGOD), bei dem es darum geht, die semantischen Strukturen selbst augmentierter komplexer Querbezugsproben zu erlernen und aufrechtzuerhalten, um die Verallgemeinerungsfähigkeit des Modells zu verbessern. Im Gegensatz zu DGOD-Modellen, die auf mehreren Quellbereichen trainiert werden, ist Single-DGOD mit nur einem einzigen Quellbereich eine viel größere Herausforderung, um sich gut auf mehrere Zielbereiche zu verallgemeinern. Bestehende Methoden greifen in der Regel auf ähnliche Ansätze wie DGOD zurück, um durch Entkopplung oder Kompression des semantischen Raums bereichsinvariante Merkmale zu erlernen. Es gibt jedoch zwei potenzielle Einschränkungen: 1) eine fälschliche Attribut-Label-Korrelation aufgrund der extrem geringen Datenmenge aus einem einzelnen Bereich; und 2) die semantische strukturelle Information wird in der Regel vernachlässigt, d.h., wir haben festgestellt, dass die Affinität von instanzbasierten semantischen Beziehungen in den Proben für die Verallgemeinerung des Modells entscheidend ist. In diesem Papier stellen wir Semantic Reasoning with Compound Domains (SRCD) für Single-DGOD vor. Speziell besteht unser SRCD aus zwei Hauptkomponenten, nämlich dem texturbasierten Selbst-Augmentationsmodul (TBSA) und dem lokalen-globalen semantischen Schließungsmodul (LGSR). TBSA zielt darauf ab, durch eine leichte und effiziente Selbst-Augmentierung die Auswirkungen irrelevanter Attribute, die mit Labels verbunden sind, wie Licht, Schatten, Farbe usw., auf Bildenebene zu beseitigen. Darüber hinaus wird LGSR verwendet, um die semantischen Beziehungen zwischen Instanzmerkmalen weiter zu modellieren und damit die intrinsischen semantischen Strukturen aufzudecken und beizubehalten. Umfangreiche Experimente an verschiedenen Benchmarks zeigen die Effektivität des vorgeschlagenen SRCD.

SRCD: Semantische Schlussfolgerung mit zusammengesetzten Bereichen für die generalisierte Objekterkennung in einzelnen Domänen | Neueste Forschungsarbeiten | HyperAI