Die Erstellung von Verteilungsshifts für die Validierung und das Training bei der Generalisierung von einzelnen Quelldomains

Die single-source Domain Generalization versucht, ein Modell auf einem Quelldomänen-Datensatz zu trainieren und es dann in unbekannten Zieldomänen einzusetzen. Der Zugriff ausschließlich auf Daten des Quelldomänen-Datensatzes stellt zwei wesentliche Herausforderungen dar: Wie kann man ein Modell trainieren, das verallgemeinern kann, und wie kann man sicherstellen, dass es dies auch tut? Die übliche Praxis der Validierung auf der Trainingsverteilung spiegelt die Verallgemeinerungsfähigkeit des Modells nicht genau wider, während die Validierung auf der Testverteilung eine zu vermeidende Fehlpraxis ist. In dieser Arbeit konstruieren wir einen unabhängigen Validierungsdatensatz, indem wir Quelldomänen-Bilder mit einer umfassenden Liste von Augmentierungen transformieren, die ein breites Spektrum potenzieller Verteilungsshifts in den Zieldomänen abdecken. Wir zeigen eine hohe Korrelation zwischen Validierungs- und Testleistung für mehrere Methoden und über verschiedene Datensätze. Die vorgeschlagene Validierung erzielt eine relative Genauigkeitsverbesserung gegenüber der Standardvalidierung von 15,4 % oder 1,6 %, je nachdem, ob sie zur Methodenauswahl oder zur Lernrateneinstellung verwendet wird. Darüber hinaus führen wir eine neue Familie von Methoden ein, die durch verbesserte Kantendetektionskarten den Formbias erhöhen. Um während des Trainings von den Augmentierungen zu profitieren und gleichzeitig die Unabhängigkeit des Validierungsdatensatzes zu gewährleisten, wurde ein k-faches Validierungsverfahren entwickelt, das die in Training und Validierung verwendeten Augmentierungstypen trennt. Aus der vorgeschlagenen Familie wird die Methode ausgewählt, die bei der augmentierten Validierung die beste Leistung erzielt. Diese Methode erreicht den aktuellen Stand der Technik (state-of-the-art) auf verschiedenen Standardbenchmarks. Code unter: https://github.com/NikosEfth/crafting-shifts