Schaltbare Verweißung für tiefes Repräsentationslernen

Normalisierungsmethoden sind wesentliche Bestandteile in Faltungsneuronalen Netzen (CNNs). Sie standardisieren oder bleichen Daten unter Verwendung von Statistiken, die auf vordefinierten Pixelmengen geschätzt werden. Im Gegensatz zu bisherigen Arbeiten, die Normalisierungstechniken für spezifische Aufgaben entwickeln, schlagen wir Switchable Whitening (SW) vor, das eine allgemeine Form bietet, die verschiedene Bleichmethoden sowie Standardisierungsmethoden vereint. SW lernt, zwischen diesen Operationen in einem end-to-end-Prozess zu wechseln. Es hat mehrere Vorteile. Erstens wählt SW anpassungsfähig geeignete Statistiken für die Bleiche oder Standardisierung für unterschiedliche Aufgaben aus (siehe Abb. 1), was es gut für einen breiten Spektrum an Aufgaben ohne manuelles Design eignet. Zweitens zeigt SW durch die Integration der Vorteile verschiedener Normalisierer konsistente Verbesserungen gegenüber seinen Konkurrenten in verschiedenen anspruchsvollen Benchmarks. Drittens dient SW als nützliches Werkzeug zur Analyse der Eigenschaften von Bleiche- und Standardisierungstechniken. Wir zeigen, dass SW andere Alternativen bei Bildklassifikation (CIFAR-10/100, ImageNet), semantischer Segmentierung (ADE20K, Cityscapes), Domänenanpassung (GTA5, Cityscapes) und Bildstilverteilung (COCO) übertrifft. Zum Beispiel erreichen wir ohne zusätzliche Optimierungen den aktuellen Stand der Technik mit 45,33 % mIoU auf dem ADE20K-Datensatz. Der Quellcode ist unter https://github.com/XingangPan/Switchable-Whitening verfügbar.