RandAugment: Praktische automatisierte Datenaugmentation mit einem reduzierten Suchraum

Neuere Arbeiten haben gezeigt, dass Datenaugmentation das Potenzial besitzt, die Generalisierung von Deep-Learning-Modellen erheblich zu verbessern. Kürzlich führten automatisierte Augmentierungsstrategien zu state-of-the-art-Ergebnissen in der Bildklassifizierung und Objekterkennung. Während diese Strategien darauf abgestimmt waren, die Validierungspräzision zu steigern, erzielten sie zudem state-of-the-art-Ergebnisse im halbüberwachten Lernen und verbesserten die Robustheit gegenüber häufigen Bildverzerrungen. Ein Hindernis für eine breite Anwendung dieser Methoden ist die separate Suchphase, die die Trainingskomplexität erhöht und die Rechenkosten erheblich steigern kann. Zudem können diese Ansätze aufgrund der separaten Suchphase die Regularisierungsstärke nicht an die Größe des Modells oder der Datensätze anpassen. Automatisierte Augmentierungsstrategien werden oft durch das Training kleiner Modelle auf kleinen Datensätzen gefunden und anschließend auf größere Modelle angewendet. In dieser Arbeit beseitigen wir beide Hindernisse. RandAugment weist einen erheblich verkleinerten Suchraum auf, sodass es direkt auf der Zielaufgabe trainiert werden kann, ohne dass eine separate Proxy-Aufgabe erforderlich ist. Zudem ermöglicht die Parametrisierung eine Anpassung der Regularisierungsstärke an unterschiedliche Modell- und Datensatzgrößen. RandAugment kann einheitlich für verschiedene Aufgaben und Datensätze eingesetzt werden und funktioniert „out of the box“, wobei es alle vorherigen automatisierten Augmentierungsansätze auf CIFAR-10/100, SVHN und ImageNet erreicht oder übertroffen hat. Auf dem ImageNet-Datensatz erzielen wir eine Genauigkeit von 85,0 %, was eine Verbesserung um 0,6 % gegenüber dem vorherigen State-of-the-Art und um 1,0 % gegenüber der Baseline-Augmentierung darstellt. In der Objekterkennung führt RandAugment zu einer Verbesserung um 1,0–1,3 % gegenüber der Baseline-Augmentierung und liegt nur 0,3 % mAP unter AutoAugment auf COCO. Schließlich ermöglicht der interpretierbare Hyperparameter von RandAugment die Untersuchung der Rolle der Datenaugmentation bei variierenden Modell- und Datensatzgrößen. Der Quellcode ist online verfügbar.