HyperAIHyperAI
vor 17 Tagen

Qualitätsunabhängige Bilderkennung mittels invertierbarem Decoder

{Jinwoo Shin, Jae-Joon Han, Seong-Jin Park, Ji-won Baek, Seungju Han, Insoo Kim}
Qualitätsunabhängige Bilderkennung mittels invertierbarem Decoder
Abstract

Trotz der bemerkenswerten Leistung tiefer Modelle bei Aufgaben der Bilderkennung sind sie bekanntermaßen anfällig für häufige Störungen wie Unschärfe, Rauschen und geringe Auflösung. Die Datenverstärkung (data augmentation) ist eine etablierte Methode, um robuste Modelle zu entwickeln, indem diese typischen Störungen während des Trainings berücksichtigt werden. Ein naiver Ansatz zur Datenverstärkung kann jedoch zu einem nicht spezialisierten Modell für bestimmte Störungsarten führen, da das Modell tendenziell die durchschnittliche Verteilung über alle Störungen lernt. Um dieses Problem zu adressieren, schlagen wir ein neues Trainingsparadigma für tiefe Bilderkennungsnetzwerke vor, das es ermöglicht, aus Bildern beliebiger Qualität „saubere“ Merkmale zu generieren, indem eine invertierbare neuronale Architektur eingesetzt wird. Unser Ansatz besteht aus zwei Stufen. In der ersten Stufe trainieren wir ein invertierbares Netzwerk ausschließlich anhand sauberer Bilder unter Berücksichtigung der Erkennungszielsetzung. In der zweiten Stufe wird dessen Inversion – also der invertierbare Decoder – an ein neues Erkennungsnetz angehängt, und das resultierende Encoder-Decoder-Netzwerk wird sowohl mit sauberen als auch mit gestörten Bildern trainiert, wobei sowohl die Erkennungs- als auch die Rekonstruktionsziele berücksichtigt werden. Unser zweistufiger Ansatz ermöglicht es dem Netzwerk, aus Bildern beliebiger Qualität robuste, saubere Merkmale zu erzeugen, indem es über den invertierbaren Decoder die ursprünglich sauberen Bilder rekonstruiert. Wir demonstrieren die Wirksamkeit unseres Verfahrens anhand von Aufgaben der Bildklassifikation und Gesichtserkennung.

Qualitätsunabhängige Bilderkennung mittels invertierbarem Decoder | Neueste Forschungsarbeiten | HyperAI