HyperAIHyperAI
vor 2 Monaten

Domain-adaptiver Faster R-CNN für die Objekterkennung in der Wildbahn

Yuhua Chen; Wen Li; Christos Sakaridis; Dengxin Dai; Luc Van Gool
Domain-adaptiver Faster R-CNN für die Objekterkennung in der Wildbahn
Abstract

Objekterkennung geht in der Regel davon aus, dass Trainings- und Testdaten aus einer identischen Verteilung stammen, was in der Praxis jedoch nicht immer zutrifft. Ein solcher Verteilungsunterschied führt zu einem erheblichen Leistungsverlust. In dieser Arbeit streben wir eine Verbesserung der cross-domain-Robustheit von Objekterkennung an. Wir adressieren den Domänenversatz auf zwei Ebenen: 1) die Bild-Ebene, wie zum Beispiel Bildstil, Beleuchtung usw., und 2) die Instanz-Ebene, wie zum Beispiel Objekt-Aussehen, Größe usw. Unser Ansatz basiert auf dem aktuellen state-of-the-art-Modell Faster R-CNN, und wir entwerfen zwei Domänenanpassungskomponenten, eine auf Bild-Ebene und eine auf Instanz-Ebene, um den Domänenunterschied zu reduzieren. Die beiden Domänenanpassungskomponenten sind auf der Grundlage der H-Divergenz-Theorie entwickelt und werden durch das Lernen eines Domänenklassifikators in einem adversären Trainingsmodus implementiert. Die Domänenklassifikatoren auf verschiedenen Ebenen werden durch eine Konsistenzeinschränkung weiter verstärkt, um ein domäneninvariantes Region Proposal Network (RPN) im Faster R-CNN-Modell zu lernen. Wir evaluieren unseren neu vorgeschlagenen Ansatz mit mehreren Datensätzen, darunter Cityscapes, KITTI, SIM10K usw. Die Ergebnisse zeigen die Effektivität unseres vorgeschlagenen Ansatzes für robuste Objekterkennung in verschiedenen Szenarien des Domänenversatzes.