AutoAugment: Lernen von Augmentationsrichtlinien aus Daten

Datenverstärkung ist eine effektive Technik zur Verbesserung der Genauigkeit moderner Bildklassifizierer. Aktuelle Implementierungen von Datenverstärkung werden jedoch manuell entwickelt. In dieser Arbeit beschreiben wir ein einfaches Verfahren namens AutoAugment, das automatisch nach verbesserten Datenverstärkungsstrategien sucht. In unserer Implementierung haben wir einen Suchraum entworfen, in dem eine Strategie aus vielen Unterstrategien besteht, von denen für jedes Bild in jedem Minibatch zufällig eine ausgewählt wird. Eine Unterstrategie besteht aus zwei Operationen, wobei jede Operation eine Bildverarbeitungsfunktion wie Verschiebung, Drehung oder Scherung sowie die Wahrscheinlichkeiten und Intensitäten darstellt, mit denen die Funktionen angewendet werden. Wir verwenden einen Suchalgorithmus, um die beste Strategie zu finden, sodass das neuronale Netzwerk auf einem Ziel-Datensatz die höchste Validierungs-Genauigkeit erzielt. Unsere Methode erreicht den aktuellen Stand der Technik in Bezug auf die Genauigkeit auf CIFAR-10, CIFAR-100, SVHN und ImageNet (ohne zusätzliche Daten). Auf ImageNet erreichen wir eine Top-1-Genauigkeit von 83,5 %, was 0,4 % besser ist als der bisherige Rekord von 83,1 %. Auf CIFAR-10 erreichen wir einen Fehlerwert von 1,5 %, was 0,6 % besser ist als der bisherige Stand der Technik. Die von uns gefundenen Verstärkungsstrategien sind übertragbar zwischen verschiedenen Datensätzen. Die auf ImageNet gelernte Strategie führt zu signifikanten Verbesserungen bei anderen Datensätzen wie Oxford Flowers, Caltech-101, Oxford-IIT Pets, FGVC Aircraft und Stanford Cars.