Tiefes Lernen für Logo-Erkennung

In dieser Arbeit schlagen wir eine Methode zur Logo-Erkennung mit tiefem Lernen vor.Unsere Erkennungs Pipeline besteht aus einem Vorschlag für Logo-Regionen, gefolgt von einemFaltungsneuronalen Netzwerk (Convolutional Neural Network, CNN), das speziell für die Klassifizierung von Logos trainiert wurde, auch wenn diese nicht präzise lokalisiert sind. Experimente werden auf der FlickrLogos-32-Datenbank durchgeführt, und wir bewerten den Einfluss synthetischer versus realer Datenverstärkung sowie des Bildvorverarbeitens auf die Erkennungsleistung. Des Weiteren untersuchen wir systematisch die Vorteile verschiedener Trainingsentscheidungen wie Klassenbalancierung, Stichprobenbewertung und explizites Modellieren der Hintergrundklasse (d.h. Bereiche ohne Logos). Die experimentellen Ergebnisse bestätigen die Machbarkeit der vorgeschlagenen Methode, die die Methoden des aktuellen Standes der Technik übertrifft.