HyperAIHyperAI
vor 16 Tagen

Geometrische und texturale Augmentierung zur Reduktion des Domain-Gap

{Peter Hall, Yong-Liang Yang, Xiao-Chang Liu}
Geometrische und texturale Augmentierung zur Reduktion des Domain-Gap
Abstract

Forschung hat gezeigt, dass konvolutionale neuronale Netze für die Objekterkennung anfällig für Veränderungen der Darstellung sind, da das Lernen tendenziell auf die niedrigstufigen Statistiken von Texturmustern ausgerichtet ist. Neuere Arbeiten konzentrieren sich darauf, die Robustheit zu verbessern, indem sie Stiltransfer auf Trainingsbeispiele anwenden, um eine Überanpassung an einen bestimmten Darstellungsstil zu verringern. Diese Ansätze verbessern die Leistung, ignorieren jedoch die geometrischen Variationen in der Objektform, wie sie in der realen Kunst auftreten: Künstler verformen und verzerren Objekte bewusst, um künstlerische Wirkung zu erzielen. Ausgehend von dieser Beobachtung schlagen wir eine Methode vor, die durch eine gleichzeitige Erhöhung der Vielfalt von Textur und Geometrie in den Trainingsdaten die Bias reduziert. Im Wesentlichen erweitern wir die visuelle Objektklasse, um Beispiele mit von Künstlern genutzten Formveränderungen einzuschließen. Konkret lernen wir die Verteilung von Verzerrungen, die jeweils eine gegebene Objektklasse abdecken. Zusammen mit der Erweiterung der Textur durch eine breite Verteilung von Stilen zeigen wir in Experimenten, dass unsere Methode die Leistung auf mehreren Cross-Domain-Benchmarks verbessert.