SeqNet: Sequenzielle Netze für die One-Shot-Verkehrszeichen-Erkennung mit Transfer Learning
Bei Aufgaben der Verkehrszeichenerkennung verfügt die Erkennung von Verkehrszeichen durch Beobachtung synthetischer Referenzbilder über eine menschenähnliche Fähigkeit, die von One-Shot-Lernalgorithmen realisiert werden kann. Die One-Shot-Objekterkennung stellt eine herausfordernde Aufgabe für tiefe neuronale Netze dar, bei der ein tiefes Modell Abfragen basierend auf Unterstützungsbildern klassifiziert. Diese Aufgabe wird schwieriger, wenn zwischen den Unterstützungsbildern und den Abfragen ein Domänenversatz vorliegt. Die Generalisierung eines tiefen Modells auf unbekannte Domänen mit unterschiedlichen Verteilungen ist ein weiteres problematisches Element bei der One-Shot-Erkennung. In dieser Arbeit wird ein neuartiges tiefes Netzwerk namens SeqNet vorgestellt, das diese oben genannten Herausforderungen überwinden soll. Soweit uns bekannt ist, übertrifft dieses Verfahren alle aktuellen State-of-the-Art-Modelle in der One-Shot-Verkehrszeichenerkennung und der One-Shot-Logo-Identifikation durch überlegene Ergebnisse. Unser vorgeschlagenes SeqNet-Modell generalisiert auf bisher unbekannte Domänen, ohne dass eine zusätzliche Feinabstimmung des Modells an den Testdaten erforderlich ist. Zudem zeigen wir, wie die Nutzung übertragener Kenntnisse aus einer irrelevanten, aber großen Domäne die Anzahl der Netzwerkparameter reduzieren und somit die Modellgröße verringern kann. Durch die Ausnutzung der Macht übertragener Kenntnisse aus einem großen tiefen Modell wird SeqNet kleiner und verfügt über etwa ein Sechstel der Parameter seiner Konkurrenten. Die geringere Größe der SeqNet-Architektur ermöglicht deren Einsatz auf ressourcenbeschränkten Geräten in zahlreichen Anwendungen wie beispielsweise intelligenten Fahrzeugen. Die experimentellen Ergebnisse zeigen, dass die Leistungsfähigkeit unseres vorgeschlagenen SeqNet erheblich verbessert wird – mit bis zu 20 Prozentpunkten Genauigkeit bei der One-Shot-Klassifikation und bis zu 30 Prozentpunkten AUC (Area Under the Curve) bei Aufgaben der Bildretrieval.