Progressive Domain Adaptation für die Objekterkennung

Neuere Ansätze der tiefen Lernens für die Objekterkennung basieren auf einer großen Menge an Bounding-Box-Anmerkungen. Die Erhebung dieser Anmerkungen ist aufwendig und kostspielig, und überwachte Modelle generalisieren schlecht, wenn sie auf Bildern aus einer anderen Verteilung getestet werden. Domain-Adaptation bietet eine Lösung, indem bestehende Labels an die Zieltestdaten angepasst werden. Ein großer Abstand zwischen den Domänen kann die Adaptation jedoch zu einer herausfordernden Aufgabe machen, was zu instabilen Trainingsprozessen und suboptimalen Ergebnissen führen kann. In diesem Paper schlagen wir vor, die Domänenlücke durch eine Zwischendomäne zu überbrücken und schrittweise einfachere Adaptationsunteraufgaben zu lösen. Diese Zwischendomäne wird durch die Transformation der Quellbilder erzeugt, um die Bilder der Ziel-Domäne nachzuahmen. Um das Problem der Domänenverschiebung zu bewältigen, verwenden wir adversariales Lernen, um die Verteilungen auf der Merkmals-Ebene auszurichten. Zudem wird eine gewichtete Task-Verlustfunktion eingesetzt, um die ungleichmäßige Bildqualität in der Zwischendomäne zu berücksichtigen. Experimentelle Ergebnisse zeigen, dass unsere Methode gegenüber dem Stand der Technik in Bezug auf die Leistung in der Ziel-Domäne vorteilhaft abschneidet.