Robuste und genaue Objekterkennung mittels adversarischer Lernverfahren

Die Datenaugmentation ist zu einem Standardbestandteil bei der Schulung hochleistungsfähiger tiefer Bildklassifizierer geworden, doch ihr Potenzial für die Objektdetektion bleibt weitgehend unerschlossen. Da die meisten modernsten Objektdetektoren von der Feinabstimmung eines vortrainierten Klassifizierers profitieren, untersuchen wir zunächst, wie die durch verschiedene Datenaugmentierungsstrategien erzielten Verbesserungen beim Klassifizierer auf die Objektdetektion übertragen werden. Die Ergebnisse sind enttäuschend: Die Gewinne verringern sich nach der Feinabstimmung sowohl hinsichtlich der Genauigkeit als auch der Robustheit. Stattdessen erweitern wir den Feinabstimmungsprozess für Objektdetektoren durch die Exploration von adversarialen Beispielen, die als modellabhängige Datenaugmentation betrachtet werden können. Unser Ansatz wählt dynamisch die stärkeren adversarialen Bilder aus den Klassifikations- und Lokalisierungsbranchen des Detektors aus und entwickelt sich gemeinsam mit dem Detektor weiter, um sicherzustellen, dass die Augmentierungsstrategie stets aktuell und relevant bleibt. Diese modellabhängige Augmentation generalisiert besser auf verschiedene Objektdetektoren als AutoAugment, eine modellunabhängige Augmentierungsstrategie, die auf einem bestimmten Detektor basierend gesucht wurde. Unser Ansatz steigert die Leistung modernster EfficientDets um +1,1 mAP auf dem COCO-Objektdetektionsbenchmark. Zudem verbessert er die Robustheit der Detektoren gegenüber natürlichen Verzerrungen um +3,8 mAP und gegenüber Domänenverschiebungen um +1,3 mAP. Die Modelle sind unter https://github.com/google/automl/tree/master/efficientdet/Det-AdvProp.md verfügbar.