HyperAIHyperAI
vor 2 Monaten

ImageNet-geschulte CNNs sind textureorientiert; ein erhöhter Schwenkungsbias verbessert Genauigkeit und Robustheit

Robert Geirhos; Patricia Rubisch; Claudio Michaelis; Matthias Bethge; Felix A. Wichmann; Wieland Brendel
ImageNet-geschulte CNNs sind textureorientiert; ein erhöhter Schwenkungsbias verbessert Genauigkeit und Robustheit
Abstract

Faltungsneuronale Netze (CNNs) werden üblicherweise als Systeme wahrgenommen, die Objekte durch das Lernen zunehmend komplexer Darstellungen von Objektformen erkennen. Einige jüngere Studien deuten jedoch darauf hin, dass Bildtexturen eine viel wichtigere Rolle spielen. In dieser Arbeit unterziehen wir diese widersprüchlichen Hypothesen einer quantitativen Prüfung, indem wir CNNs und menschliche Beobachter auf Bildern mit einem Konflikt zwischen Textur- und Formhinweisen evaluieren. Wir zeigen, dass CNNs, die auf ImageNet trainiert wurden, stark dazu neigen, Texturen anstelle von Formen zu erkennen. Dies steht im krassen Gegensatz zu den menschlichen Verhaltensevidenzen und offenbart grundlegend unterschiedliche Klassifikationsstrategien. Anschließend demonstrieren wir, dass die gleite Standardarchitektur (ResNet-50), die auf ImageNet eine texturbasierte Darstellung lernt, stattdessen eine formbasierte Darstellung erlernen kann, wenn sie auf "Stylized-ImageNet" trainiert wird – einer stilisierten Version von ImageNet. Dies führt zu einer viel besseren Anpassung an die menschliche Verhaltensleistung in unserer gut kontrollierten psychophysikalischen Laborumgebung (neun Experimente mit insgesamt 48.560 psychophysischen Versuchen bei 97 Beobachtern) und bringt eine Reihe unerwarteter Nebenvorteile mit sich, wie etwa verbesserte Objekterkennungsleistung und bisher nicht beobachtete Robustheit gegenüber einer Vielzahl von Bildverzerrungen. Diese Ergebnisse unterstreichen die Vorteile einer formbasierten Darstellung.

ImageNet-geschulte CNNs sind textureorientiert; ein erhöhter Schwenkungsbias verbessert Genauigkeit und Robustheit | Neueste Forschungsarbeiten | HyperAI