ChimeraMix: Bildklassifizierung auf kleinen Datensätzen durch maskebasierte Merkmalsmischung

Tiefe Faltungsneuronale Netze erfordern große Mengen an beschrifteten Datenmustern. Für viele praktische Anwendungen stellt dies eine wesentliche Einschränkung dar, die häufig durch Vergrößerungsmethoden (augmentation methods) überwunden wird. In dieser Arbeit behandeln wir das Problem des Lernens tiefer Neuronalenetze auf kleinen Datensätzen. Unser vorgeschlagenes Architekturmodell, ChimeraMix, lernt eine Datenvergrößerung durch die Erzeugung von Instanzkompositionen. Das generative Modell kodiert Bilder paarweise, kombiniert die Merkmale unter der Leitung einer Maske und erstellt neue Muster. Zur Bewertung werden alle Methoden ohne zusätzliche Daten von Grund auf neu trainiert. Verschiedene Experimente mit Benchmark-Datensätzen wie ciFAIR-10, STL-10 und ciFAIR-100 zeigen die überlegene Leistung von ChimeraMix im Vergleich zu aktuellen Stand der Technik-Methoden für die Klassifizierung auf kleinen Datensätzen.