Reiner Rausch zur Rettung unzureichender Daten: Verbesserung der unbalancierten Klassifikation durch Training auf zufälligen Rauschbildern

Trotz beachtlicher Fortschritte bei visuellen Erkennungsaufgaben zeigen tiefe Neuronale Netze weiterhin erhebliche Schwierigkeiten bei der Generalisierung, wenn die Trainingsdaten knapp oder stark unbalanciert sind, wodurch sie besonders anfällig für reale Anwendungsbeispiele werden. In diesem Artikel stellen wir eine überraschend einfache, jedoch äußerst wirksame Methode vor, um diese Limitation zu überwinden: die Verwendung von reinen Rauschbildern als zusätzliche Trainingsdaten. Im Gegensatz zur üblichen Anwendung von additivem oder adversariischem Rauschen zur Datenvervollständigung schlagen wir einen völlig neuen Ansatz vor, indem wir direkt auf rein zufälligen Rauschbildern trainieren. Wir führen eine neue Schicht namens Distribution-Aware Routing Batch Normalization (DAR-BN) ein, die es ermöglicht, sowohl auf natürlichen Bildern als auch auf reinen Zufallsbildern innerhalb desselben Netzwerks zu trainieren. Dies fördert die Generalisierbarkeit und unterdrückt Overfitting. Unsere vorgeschlagene Methode verbessert die Leistung bei unbalancierten Klassifikationsaufgaben erheblich und erzielt state-of-the-art Ergebnisse auf einer Vielzahl von langschwänzigen Bildklassifikationsdatensätzen (CIFAR-10-LT, CIFAR-100-LT, ImageNet-LT, Places-LT und CelebA-5). Zudem ist unsere Methode äußerst einfach und leicht anwendbar als allgemeines neues Augmentationswerkzeug (ergänzend zu bestehenden Augmentationsmethoden) und kann in beliebige Trainingsstrategien integriert werden. Sie erfordert weder spezielle Datengenerierungsverfahren noch besondere Trainingsprozeduren und bleibt somit schnell und effizient.