Puzzle Mix: Ausnutzung von Aufmerksamkeit und lokalen Statistiken für optimales Mixup

Obwohl tiefe neuronale Netze eine hervorragende Leistung bei der Anpassung an die Trainingsverteilung erzielen, neigen die gelernten Netzwerke zur Überanpassung und sind anfällig für adversarielle Angriffe. In diesem Zusammenhang wurden kürzlich mehrere auf Mixup basierende Erweiterungsmethoden vorgeschlagen. Diese Ansätze konzentrieren sich jedoch hauptsächlich auf die Generierung bisher unbekannter, virtueller Beispiele und können dem Netzwerk gelegentlich irreführende überwachende Signale liefern. Um dieses Problem anzugehen, stellen wir Puzzle Mix vor, eine Mixup-Methode, die explizit die Salienzinformationen und die zugrundeliegenden Statistiken natürlicher Beispiele nutzt. Dies führt zu einem interessanten Optimierungsproblem, das zwischen dem Mehrfachklassifizierungsziel für einen optimalen Mischmasken und dem salienzabgezogenen optimalen Transportziel wechselt. Unsere Experimente zeigen, dass Puzzle Mix im Vergleich zu anderen Mixup-Methoden auf den Datensätzen CIFAR-100, Tiny-ImageNet und ImageNet Ergebnisse auf dem Stand der Technik hinsichtlich Generalisierungsfähigkeit und adversarialer Robustheit erzielt. Der Quellcode ist unter https://github.com/snu-mllab/PuzzleMix verfügbar.