HyperAIHyperAI
vor 11 Tagen

PhysAug: Eine physisch geleitete und frequenzbasierte Datenaugmentierung für die einfeldübergreifende verallgemeinerte Objektdetektion

Xiaoran Xu, Jiangang Yang, Wenhui Shi, Siyuan Ding, Luqing Luo, Jian Liu
PhysAug: Eine physisch geleitete und frequenzbasierte Datenaugmentierung für die einfeldübergreifende verallgemeinerte Objektdetektion
Abstract

Einzel-Domänen-verallgemeinerter Objektdetektion (S-DGOD) zielt darauf ab, durch Nutzung eines Objektdetektors auf einer einzigen Quelldomäne robuste Leistung über eine Vielzahl unerwarteter Ziel-Domänen hinweg zu erzielen. Bisherige Ansätze zur S-DGOD stützen sich häufig auf Daten-Augmentierungsstrategien, die eine Kombination visueller Transformationen beinhalten, um die Generalisierungsfähigkeit des Detektors zu verbessern. Allerdings behindert das Fehlen realweltbasierter Vorwissen die Daten-Augmentierung darin, zur Vielfalt der Trainingsdatenverteilungen beizutragen. Um dieses Problem anzugehen, stellen wir PhysAug vor – eine neuartige, auf physikalischen Modellen basierende Methode zur Daten-Augmentierung unter nicht-idealen Abbildbedingungen, die die Anpassungsfähigkeit von S-DGOD-Aufgaben verbessert. Ausgehend von den Prinzipien der atmosphärischen Optik entwickeln wir ein universelles Störungsmodell, das die Grundlage für unser vorgeschlagenes PhysAug bildet. Da visuelle Störungen typischerweise aus der Wechselwirkung von Licht mit atmosphärischen Partikeln resultieren, nutzen wir das Bildfrequenzspektrum, um während des Trainings realweltähnliche Variationen nachzuahmen. Dieser Ansatz fördert die Lernfähigkeit des Detektors, domäneninvariante Darstellungen zu erwerben, wodurch dessen Fähigkeit zur Generalisierung in unterschiedlichen Szenarien gesteigert wird. Ohne die Netzwerkarchitektur oder die Verlustfunktion zu verändern, übertrifft unsere Methode signifikant die bisherigen State-of-the-Art-Methoden auf verschiedenen S-DGOD-Datensätzen. Insbesondere erzielt sie eine erhebliche Verbesserung um 7,3 % und 7,2 % gegenüber der Baseline auf den Datensätzen DWD und Cityscapes-C, was ihre erhöhte Generalisierbarkeit in realen Anwendungsszenarien unterstreicht.

PhysAug: Eine physisch geleitete und frequenzbasierte Datenaugmentierung für die einfeldübergreifende verallgemeinerte Objektdetektion | Neueste Forschungsarbeiten | HyperAI